Pythonのお勉強 Part72

2024/05/05(日) 15:18:19.04

コードを出さないと負け惜しみにしか聞こえないぞ

2024/05/05(日) 15:58:54.36

3重ループの人でしょ
https://mevius.5ch.net/test/read.cgi/tech/1689241721/439

2024/05/05(日) 20:26:20.99

numpyのバージョンアップは怖い

2024/05/06(月) 00:41:49.83

どんぐりレベルが足りなくてかけない

警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 0f60-+nJg) · 2024/05/06(月) 00:42:30.89

レベルアップしたのか

2024/05/06(月) 11:03:33.16

たくさんのファイルを3ステップで加工したい
一つずつやると時間かかるので、並列処理させる
全ファイルをステップ1処理 -> 全ファイルをステップ2処理、という感じ

それでかなりスピードアップはするけど、
ステップの継ぎ目部分で全体の完了を待つのが無駄
全体は待たずにファイル毎にどんどん先に進む並列処理を
簡単に書くモジュールある?

2024/05/06(月) 11:41:41.15

>>748
処理がファイル間で独立しているならmultiprocessingモジュール
Unix環境ならxargsコマンドで足りる話にみえるけど

2024/05/06(月) 11:45:32.98

concurrent.futuresモジュールのが書きやすいかもしれん
どっちも見てみて

2024/05/06(月) 12:28:01.25

あんまりいいサンプルが見つからない

キモは、プロセスの実行に条件があるという点
file1-step1が完了してないとfile1-step2は実行できない
必要なプロセスを全部登録して実行させるとそんなことは考慮されないので、
どのプロセスが実行可能か依存関係を教えてやらないといけない

2024/05/06(月) 13:02:05.97

モジュール使う分には単純だから公式ドキュメント読んで
https://docs.python.org/ja/3/library/multiprocessing.html
https://docs.python.org/ja/3/library/concurrent.futures.html
それでファイル単位に並列にして
ファイルを引数にstep1/step2を関数化したら後は呼ぶだけよ

あるいは外部コマンド化して
cat paths | xargs -IZ -P $(nproc) sh -c 'step1.py Z; step2.py Z'

2024/05/06(月) 13:58:46.28

step1とstep2でプロセスを分けずに全体を1つのプロセスにするということかな
実際にはそれぞれで別のexeファイルを実行するのでなかなか難しい

2024/05/06(月) 17:25:03.16

for file in files:
　step1.exe file
for file in files:
　step2.exe file
という形じゃなく
step1.exe files
step2.exe files
という形で実行してるなら各exeがファイル毎に進捗報告やコールバックしてくれないと
ファイル単位で処理を先に進めるのは無理

前者でやってるならやりようがあるけど
ファイル単位じゃなくステップ単位にまとめるとスピードアップしたということなので
その原因を先に確認した上でやり方考えたほうがいい

性能向上のための並行/並列化は
具体的な処理内容やワークロードの特性によってアプローチが変わる
one size fits allなやり方は存在しない

2024/05/06(月) 17:28:20.27

何を言ってんだこいつは
プログラミング言語の前に国語をやり直せ
そうだな>>748を100万回読み直して相手に何が伝わってると思うか感想を述べよ

2024/05/06(月) 17:29:01.71

>>752
>'step1.py Z; step2.py Z'
これは'step1-3.py Z’でよくない？
キャッシュされてもインタプリタ起動のオーバーヘッドはそれなりにかかるので

2024/05/06(月) 17:41:01.35

>>755
なるほど
実際にはまだ何も並行化/並列化できてないという話なのか

>実際にはそれぞれで別のexeファイルを実行するのでなかなか難しい
だったら↑この思い込みを捨てることから始めたほうがいいよ

結局のところPythonで並行/並列化するなら以下の4択なので
具体的な処理内容とワークロードの特性を加味して適切なものを選んでね
1.非同期
2.マルチスレッド
3.マルチプロセス
4.非同期+マルチプロセス

2024/05/06(月) 19:12:43.39

結局、
proc1.exeをsubprocess.Popen()で並列処理
proc2.exeをsubprocess.Popen()で並列処理
proc3.exeをsubprocess.Popen()で並列処理
となっていたものを、
proc1.exe
proc2.exe
proc3.exe
を実行するbatファイルに移動させて、
batファイルをsubprocess.Popen()で並列処理で目的は達成できた

batファイルかー、という気もするけど、並列処理で依存関係を気にした例は見つからなかった
(並行処理なら普通)

2024/05/06(月) 19:51:46.91

バッチファイルのことをbatファイルと書いているのは初めて見た

2024/05/06(月) 19:58:25.18

マジか
"バッチファイル" 473,000
"batファイル" 134,000
だから少数派ではあるけど、22%くらいの勢力はあるのに

そもそも、batファイルを使った経験自体が少ないのでは

2024/05/06(月) 19:58:39.61

>>758
テキストファイルの操作みたいだけど、そういうのは処理範囲を指定して同時に動かすんだよ。

2024/05/06(月) 20:03:11.50

エスパーすげえ

2024/05/06(月) 20:04:20.54

>>760
batファイルという書き言葉は最近、発生しているようだけど、一般書籍でもマイクロソフトでもbatファイルとは呼んでいない。

日本語ではバッチファイル、英語ではbatch file。

バッチファイルを使ったことがないというのは、シェルスクリプトを使ったことがないというのと同じで、Pythonコードも動かいたことがないと思われてしまうレベル。

2024/05/06(月) 20:06:52.12

>>762
ステップは行という意味に思われるからやめた方がいい

2024/05/06(月) 20:13:01.17

>>762
複数のファイルと書いてあったな。

並列化には担当するファイルを分けるなどいくらでも方法はある。

マルチプロセスの日本語訳が並列処理、マルチスレッドの日本語訳が並行処理だが、英語ではマルチという言葉で同時実行という言葉ではない。

同時実行という意味を付加しているのは日本語。

2024/05/06(月) 20:16:17.12

エスパーの言葉は為になる

2024/05/06(月) 20:21:34.96

EXEファイルを二重起動とかPythonもバッチファイルも関係ねえな

実行ファイルを引数なしで実行するとか、シリアル前提処理を多重起動して、想定どおりにならないとか狂っんなw

2024/05/06(月) 20:23:17.58

>>766
本人不在だったのか

2024/05/06(月) 20:24:57.69

ID:poYagYhe0 は自作自演のネタ野郎だった

2024/05/06(月) 21:00:04.96

>>763
batファイルでも別に普通じゃない？
拡張子batのファイルには違いないんだし

txtファイル、jpgファイル、mpgファイルと同じだよ

2024/05/06(月) 21:40:01.57

テキストファイルの拡張子をtxtとしているのはWindowsの世界だけ

Windowsを使っていてバッチファイルを知らないなんて素人だろ

2024/05/06(月) 21:47:03.75

>>770
拡張子は拡張子でしかない

JPEGのファイルの拡張子はjpegが本来の拡張子で、jpgはWindows、MS-DOSの拡張子は3文字までという仕様で発生したもの。

さらにWindowsのデフォルト設定だと拡張子を表示しないんだぜ？

何をどう勘違いしているのかな。

2024/05/06(月) 21:49:36.31

エスパーの思考は常人には判らない

2024/05/06(月) 22:24:52.88

>>772 の中では噛み合った会話なのかな。

2024/05/06(月) 22:42:13.79

ほほいほいほい

2024/05/06(月) 23:45:29.15

txtファイルなんて書くやついるのか？

2024/05/06(月) 23:50:45.62

拡張子がhtmlだとhtmlファイル、拡張子がhtmだとhtmファイルだと呼ぶなら、単に無知をごまかしているだけ

2024/05/07(火) 00:02:15.12

バッチファイルはマイクロソフトの命名のセンスが悪かっただけだが、バッチファイルと作っている会社が言っている名称を使うのが素直

拡張子が3文字だと思っている疑惑があるのと、UNIX、Linuxの世界では拡張子はあくまで目印にすぎない

ファイルが何のファイルかは少し読み込んで判断する
WindowsでUTF-8のテキストファイルを扱う場合は、テキストファイルにBOMという情報を先頭に書く

シェルスクリプトも1行目に自分自身の種類と何で実行するのかを書く

2024/05/07(火) 00:24:22.86

なんかすげぇ
自分の中で世界ができあがってる…

2024/05/07(火) 01:25:06.73

どうでもいいことで盛り上がってんなｗｗ
batファイルってのは同じバッチファイルでも.cmdじゃなく.batだぞってこと
htmファイルも同じ
まあ個人的には.batファイルのようにドット付きでなら書くけどドット無しでは書かないな

2024/05/07(火) 01:49:44.68

>>758
proc1.exeをsubprocess.run()
proc2.exeをsubprocess.run()
proc3.exeをsubprocess.run()
↑この一連を関数にまとめればbatファイルはいらない
それとまとめた関数は直接Popenじゃなくmultiprocessing経由で処理すれば
Poolを使う分だけオーバーヘッドが減る

あと処理内容次第だけどasyncio使って全部非同期ににしたほうが
コードは多少面倒でもリソースが減って速度も出る可能性もある

2024/05/07(火) 10:26:46.57

Pool版も問題なく動いた

if __name__ == '__main__':
が要るのね

2024/05/07(火) 14:13:11.88

子供がエラー出てもなんも判らんのな
get() すると判るけど、マルチプロセスにならないので、デバッグ終わったら外す
グローバル変数経由で参照させようとしても見えないとか罠がいろいろ

2024/05/07(火) 14:44:49.52

Python関係なく基礎技術知らなすぎるんだろうけど
https://docs.python.org/ja/3/library/multiprocessing.html#multiprocessing-listeners-clients
たぶんこのへん誤読してる
他のモジュールでも同じような仕組みはあるから読み替えて

2024/05/07(火) 14:51:36.53

apply_async(func, args=(arg,))
の余計なコンマもなんじゃこれと思ったら、無いと動かないんだよな
そんなもんバグやがな

2024/05/07(火) 15:53:24.89

それは要素が1個のタプルだ

2024/05/07(火) 15:55:19.18

グローバル変数が参照できるかどうかは処理系依存な気がするんだよな
Copy-On-Writeでプロセス増やしてたら普通に参照できる筈
そんな互換性の無いコードが書けていいのかとは思うけど

2024/05/07(火) 16:00:55.95

さすがにこのレベルの基礎を押さえていない人は
自称Python初心者でなくても↓こちらのスレへどうぞ

>●関連スレ● 自称初心者は↓へ
>【まず1嫁】くだすれPython(超初心者用) その59
>https://mevius.5ch.net/test/read.cgi/tech/1689241721/

2024/05/07(火) 16:02:36.17

>>788は>>785宛ね

2024/05/07(火) 16:11:14.75

要素1個のタプル 1,
要素0個のタプル ()

なんでやねん
コンマこそがタプルを表しているなら、コンマだけが空タプルの本質だろうに
冗長に書いて(,) でもエラーになる
コンマがタプルで括弧はおまけだけど空の時だけ例外ルール

2024/05/07(火) 19:25:27.35

>>790
あのさ(1)だとタプルじゃなくてただ数値がカッコで括られてるだけと判別出来ないだろ

2024/05/07(火) 19:43:11.21

>>790
要素数ゼロのタプルって何か意味あるん

2024/05/08(水) 00:49:45.86

>>792
要素数が変化しない空のシーケンスを表現するためにある
fが引数1個を取る関数、gが引数を取らない関数だとしたら
apply(f, (1,))とapply(g, ())
のようにempty tupleを使うのが理にかなってる

2024/05/08(水) 01:07:25.23

>>793
なるほど
ありがとう

2024/05/09(木) 23:41:44.90

SQLで書いてるクエリをSQLAlchemyでORMにしたいのに
全然出来んわ、半分諦めかけてる
なんかコツとかないんか？

2024/05/09(木) 23:48:54.52

word1かword2かword3のいずれかがstrに含まれているかどうか
はどうやったらすっきり書けるだろう

内包表記なら書けるけど、
if (word1, word2, word3) in str
くらいの判りやすさが欲しい

2024/05/10(金) 07:36:47.53

すぐに思いつかないようなゴルフが仮にできるとしても
関数化した方がわかりやすいとおもう

2024/05/10(金) 09:53:05.97

any(w in str for w in words)で不満か？

2024/05/10(金) 10:30:11.03

>>798
>>796 さんは「すっきり」と仰っていますが。

# 敢えて反語法で表現しました。

**デフォルトの名無しさん** (JP 0H33-ePh+) · 2024/05/10(金) 15:27:10.41

どういうこと？strかどうか調べたいていうこと？

2024/05/10(金) 17:50:44.59

>>800
(word1 in str) or (word2 in str) or (word3 in str)
を、すっきり書きたいのですと。

2024/05/10(金) 18:31:25.49

list in str
を許容するように文法を変える
結果のリストが得られるので、
any(list in str)
みたいに使う

2024/05/10(金) 18:35:00.30

and なのかor なのかは明示してくれ

2024/05/10(金) 18:40:17.35

isinstance(word1, str)

2024/05/10(金) 18:47:36.75

anyかallで>>804わたすのじゃだめなの？

2024/05/10(金) 18:50:16.41

>>796
ここで言うstrって変数じゃなくて型か？

2024/05/10(金) 19:40:33.29

短くするより分かりやすくする方がよくないか

2024/05/10(金) 21:21:08.00

any([isinstance(x, str) for x in (word1, word2, word3)])
any(map(isinstance, (word1, word2, word3), [str]*3))

2024/05/10(金) 21:41:43.74

関数一つかますしか無いだろうな

def find_words(list, str):
　return [w in str for w in list]

print(any(find_words(['a', 'b'], 'bcde')))

2024/05/10(金) 21:41:47.92

、pythonでWEBスクレイピングをしてるのですが、タスクスケジューラで動かすと画面が欠けます。
ログイン中だと問題なくでます。
なぜかサイズ指定しても効かないのですが、タスクスケジューラで登録して自動実行させてる方いませんでしょか？

2024/05/11(土) 00:19:43.68

>>810
「ユーザーがログオンしているかどうかに関わらず実行する」が選択された場合、
タスクはセッション0のデスクトップが無い環境で実行される(Vista以降)
通常のブラウザでイスクレイピングをしたければ適当なアカウントにログインしていなければならない
またはヘッドレスモードのあるブラウザなら動きそうではあるがどうだったかな

2024/05/11(土) 01:09:05.58

>>811
ありがとうございます。
ヘットレスモード試してみます。
まずはログインした状態でタスクスケジューラ起動とかが一番近道かもですね！

2024/05/11(土) 03:05:51.08

>>796
s = set(str.split())
if {word1, word2, word3} & s != {}:
　...

2024/05/11(土) 03:15:20.18

>>796
ごめん間違えた
s = set(str.split())
if {word1, word2, word3} & s != set():
　...

2024/05/11(土) 06:12:20.38

配列のインデックスが1じゃなく0から始まる利点て?

2024/05/11(土) 07:40:03.89

0の方がいろいろ合理的だけど、
printf(f'{count+1}')
とかやるよな

範囲を示す時に始点と終点よりも、始点と終点+1(次の要素の始点)の方が
便利なケースが圧倒的に多いけど、なんか怖いので愚直にやる

2024/05/11(土) 08:22:43.45

>>813-814
スマソ、なんか Trueにならなくね?

>>> word1 = 'abc'
>>> word2 = 'def'
>>> word3 = 'ghi'
>>> sstr = 'aaabcddd'
>>> s = set(sstr.split())
>>> {word1, word2, word3} & s != set()
False
>>> s = set('zzzzzzz'.split())
>>> {word1, word2, word3} & s != set()
False
>>>

2024/05/11(土) 08:24:59.32

>>815
Pythonって配列無いんじゃ？リストやろ

C言語系とかの配列的に添字が0から始まるのはメモリアドレスを計算する時に高速な為

2024/05/11(土) 09:00:38.69

1. {'sss'}.issubset({'s', 'ss', 'sst'})

2.
strings = ('miss')
ret = any([s for s in ('s', 'ss', 'ss') if s in strings])

3. filter(lambda s=s: s in strings, strings)

4.
strings = ('ss', )
is_in = strings in ('s', 'ss', 'sss')

2024/05/11(土) 11:03:50.73

strって関数オブジェクトじゃないの？

2024/05/11(土) 11:33:01.51

ヒント
画像情報テレポート
エネルギー瞬間にどう
観測結果論部あり
※情報とエネルギーを送れるのなら任意の波と線とHzを任意の場所で発生可能

上記の技術に脳内インプラントデータを対象者全身に送信で操り人形
地球外宇宙人もサイコパスが使用中

高度な科学を使用できていても自然環境も人間社会いも狡猾な者【人間を物として見る者】が圧勝
ガスライティング.ギャングストーカー.電磁波攻撃等
現在の若者サイコパスで無い者は何%いるのかな?

地球派【マイクロ波聴覚効果】は違法でないので宇宙人が行っていても合法
別の惑星はテロに該当なので問答無用で戦争

マイクロ波は波の種類なので
X線でマイクロ波を起こしているので
お前に200回のx線を打ち込んだも理解できるでしょう
※５Gはミリ波で動的動作も追跡可能になるのでマイクロ波より便利
テラヘルツ波はミリ波と比べて現在不明なので研究中

何Hzの帯域は対象者周囲の状況に応じて変化していると思われるので
線種類＋波種類＋何hz ＋使用w数＝音波【音の高さ】?

2024/05/11(土) 11:47:23.04

requests.get() したものに対して、
<meta charset= の内容を見てencodingを設定してくれる機能ってある?

2024/05/11(土) 12:21:55.32

>>817
その条件では使えない
英文みたいに空白で単語が区切られている時に使える
部分一致はsuffix arrayみたいな重く複雑なsetが必要
ひょっとしたら何かエレガントな書き方があるのかもしれないが

2024/05/11(土) 13:44:37.23

>>822
まずdecodeしないでmeta見れるの？

2024/05/11(土) 16:52:01.34

>>816 >>818
おk

2024/05/11(土) 16:57:44.24

apparent_encoding にするといいよという記事をよく見るけど、
encodingに困ってる時にapparent_encoding使うと悪化する
困ってない時は何もしなくていい
結局使い所が無い

2024/05/11(土) 17:02:27.88

>>818
高級言語なのにそこにつっこむセンス
速度に影響するから知っておいても損はないけども
むしろ内部実装でいうとlistは配列ちがう？

2024/05/11(土) 17:32:49.96

>>826
エンコーディングの推論って日本語だとうまく機能しないよな
結局決め打ちして試すしかない

2024/05/11(土) 17:55:41.08

決め打ちしなくても、meta読めばそれが正解なんだよな
答えが書いてあるのに推測しようとして失敗する

2024/05/12(日) 01:03:35.51

charsetに嘘書いてある事もあるから
metaは参考程度

2024/05/12(日) 03:16:25.45

>>827
なんで配列がリストと同様だと思ったん？

2024/05/12(日) 03:47:45.56

>>831
https://github.com/python/cpython/blob/main/Objects%2Flistobject.c

2024/05/12(日) 15:32:32.50

「動的配列は配列じゃないリストだ」と言い張る人なんじゃね？
それか何か根本的な勘違いをしてるか

まあどうでもいいけど

2024/05/12(日) 15:44:47.38

その辺の言葉の使い方は言語や人や実装によって違うからまずは定義をちゃんとして欲しいな

2024/05/12(日) 15:47:15.87

言語も何も指定せずにプログラム関連でリストというと、リスト構造を指すよな

2024/05/12(日) 15:49:04.86

基本情報も持ってないような奴はその辺のデータ構造としての配列とかリスト分かってないんだろ

2024/05/12(日) 15:51:41.09

大抵はリンクリストを指すのだろうけど動的言語あたりが好き勝手用語を解釈し始めて
動的配列を指すこともあるし一般的にモノが並んでいることをリストと言ったりもする
ややこしい時代になったもんだ

2024/05/12(日) 18:01:26.30

データ構造に言及しない文脈なら一般的に一覧とかリストで済ますでしょ
PythonスレはVBAスレに並ぶ初心者が集うスレだからこんな議論が度々起きても仕方ない

2024/05/12(日) 19:15:29.77

ごくごく一般的な言葉を環境特有の用語として使う馬鹿が悪い

2024/05/12(日) 19:35:34.27

数学なんかそんなんばっかり
わざとだろと思うくらい

2024/05/12(日) 21:39:13.62

赤っ恥かいた人の自演言い訳レスばっかりで草

2024/05/13(月) 02:42:21.97

俺の投稿GW以降初なんだが馬鹿の自演言い訳扱いにされてんの?

警備員[Lv.1][新初] (ﾌﾞｰｲﾓ MMb3-7UPu) · 2024/05/13(月) 19:42:10.18

>>833
配列そのものが連続したアドレスのメモリ領域のことだからな

動的にメモリを確保する場合は、型が後づけになるから配列と呼ぶの違和感があるのは仕方ない

2024/05/13(月) 20:27:48.60

サイズ決めてからリスト作ったら
内部データは1つの配列？
それとも1つ1つ個別のリンクリスト？

2024/05/13(月) 20:53:26.29

そういうのはnumpyなんだよな

2024/05/13(月) 22:15:15.85

>>843
>配列そのものが連続したアドレスのメモリ領域のことだからな
何を主張したいのかよくわからん
Pythonのlistは配列じゃないと言いたいの？それとも配列だと言いたいの？

>動的にメモリを確保する場合は、型が後づけになるから配列と呼ぶの違和感があるのは仕方ない
動的にメモリを確保することと型が後付になるかどうかは関係ないよ

2024/05/13(月) 22:22:23.19

メモリなんかいつでも好きな時に確保できるように見えるだけで、
実際はmallocで頑張って実現してるしな

思想は先進化していくのに実現手段はずっとCなので、
職人がどんどんハゲる

2024/05/14(火) 08:46:28.42

結局 >>839 だよな。お前の言う「配列」はどれなんだってな。

2024/05/14(火) 09:10:15.76

「環境特有の用語」として使ってるやつなんていないだろ

2024/05/14(火) 11:55:04.88

発端はこれ
>Pythonって配列無いんじゃ？リストやろ

書き方から配列ではない”リスト”、リストではない”配列”について述べてることは自明
つまり抽象データ構造としてのリストを指してるわけではなく、その具体的実装のうち配列ではないもの(リンクリスト等)を指しているか、Pythonのlist(リスト型)を指していることになる

次にこれ
>なんで配列がリストと同様だと思ったん？

これはlistの内部実装が配列だというレスへの返信内容なので、発端となったレスと合わせるとlistがリンクリスト的なもので実装されてると勘違いしてたということ

同じ勘違いをしてると思われ、かつ同じように二言目にはCに言及してるレスが散見されるのは偶然ではないでしょう

2024/05/14(火) 12:27:50.27

トートロジーなんだよな
中身のアドレスが規則的に並んでいるものを配列と呼ぶ
と定義すれば、配列はアドレスが規則的に並んでいる

自分の定義に疑問を持つような文章を書くから、
知らんがなお前の脳内にしか答えはねえよになる

2024/05/14(火) 14:39:54.11

python変化目まぐるしくて追いつくのがしんどすぎる....
最先端のpythonライブラリのポータルサイトとかないの？
毎日確認したいわ
本でkeras、tensorflowとか必死で習得(完璧ではない)したのに
今はpytorchも主流らしいね
こんなの追いつくの大変だわ
webとpythonは本当に頭がスポンジじゃないと無理だわ

2024/05/14(火) 15:55:30.69

>>852
https://pypi.org/

だいたいのライブラリはGitHubでプロジェクトつくってるから
バグやリリース前の情報を追いたいならissuesをみる

2024/05/14(火) 15:56:53.18

>>852
pytorchも生で使う人はいないぞ
transformersというpytorchを使いやすくしたライブラリしか使われてない
まあそれも計算資源がある会社や組織しか無理だけど
日本向けにCPUでうまく学習できるライブラリ作れよって思うけどね
スパコンはあるわけだし
もう作れる技術ある人がいないのだろう
悲しいなあ

2024/05/14(火) 17:17:20.85

>>853
見方がわからんｗ
>>854
人工知能のアルゴリズム組めるってそこそこ優秀で大学院レベルだと
思うんだよね
javaとかだとベテランが大量にいるだろうけど
それってjavaの取り巻く環境と文法についてのベテランであって

pythonのベテランっていうともろに数理科学に精通した人達だから
地頭レベルでいい人なんだろうな

もしかして独学は途方もない挑戦なのかも

2024/05/14(火) 17:44:51.87

>>855
昔はライブラリなんてなかったし
どんな分野でも大企業の人間とか研究室の教授とかが作ってたんだよなあ

2024/05/14(火) 18:36:12.11

>>851
>トートロジーなんだよな
>中身のアドレスが規則的に並んでいるものを配列と呼ぶ
>と定義すれば、配列はアドレスが規則的に並んでいる
またまた>>843と同じで何を主張したいかわからん文章だけど
結局Pythonのlistは俺の定義する配列ではないということ？

2024/05/14(火) 20:39:34.27

AIはいい方法が見つかって、あとは規模を拡大していくだけじゃないの
その先に強いAIもあるよ

2024/05/14(火) 21:25:34.15

>>857
トートロジー言いたいだけ

2024/05/14(火) 22:22:59.43

循環定義と言いたかったんじゃね？
循環してないから的外れだけど

2024/05/14(火) 22:50:26.75

>>860
循環してないならトートロジーで合ってるのでは

2024/05/14(火) 23:30:34.98

>>861
もちろん合ってない
哲学板ででも聞いてくれば？
そんな板があるのか知らんけど

2024/05/15(水) 02:04:38.50

>>855
PHP の本を書いている、たにぐちまこともPython の動画を出そうとしたけど、
大学で勉強しないと無理と言っていた

KENTA が既に言っている。
理系で、8年も掛けて勉強するのは効率が悪い。
何年も勉強する看護師とかもそう

文系のアホが唯一金持ちになれる、最強のチート職業はRuby on Rails である！
Runteq の菊本も、千時間と言っている。
外人も言っている

Railsでは頭の良さが必要ではなく、再現性が高い。
東大受験と同じ。
アホでも3千時間の暗記で、偏差値が40上がる。
75時間で1偏差値上がる

だから、ほとんどの学校・サロンではRailsを教える。
知識が勉強時間に比例するから。
東大向け予備校と同じ

一方、Pythonは大学院数学科とか、地頭の良さが問われる。
文法を知っていても雇われない。
全言語の中で唯一、人余りの言語だし

文系なら絶対に無理。
理系で偏差値70以上なら独学でもできるだろうけど

Java は建設業と同じ、5大SIer の多重請負構造の身分制度があるから、
間に1社入る毎に、3割抜かれる。
絶対に大企業系列での身分が変わらないから、
一発逆転を狙うdrop out 組は、Railsへ進む

2024/05/15(水) 09:28:02.91

理系で偏差値70医学部だろ

2024/05/15(水) 09:51:34.33

医者が難しい積分とかできてどうするんだろうな

2024/05/15(水) 10:23:20.15

東大数学も難なく解けるような人間だとpython+人工知能も余裕なんだろうな
高卒にプログラマかなり多いけど彼らは人工知能理解できるのだろうか？

確率過程、解析学、線形代数など大学数学レベルの応用なわけだが

2024/05/15(水) 10:30:56.53

建築現場の労働者が強度計算できるのか心配してるようなもの

2024/05/15(水) 13:16:40.50

独学で学習したが動かせるようになるまで2.5年かかった
理解できているかは、分野や扱い方次第でどうとでも言えるかと
人工知能という単語が広すぎるので
何の何でどのモデルをどの手法でどうやってトレーニングして、何をできるようにしたことがあって、何に適用したことがあるか？
位まで説明してくれないとわからない

2024/05/15(水) 13:37:58.79

マクドに行ってハンバーガーくださいと言っているのと変わらないということ

警備員[Lv.6][新初] (ﾜｯﾁｮｲ 7b5f-7UPu) · 2024/05/15(水) 21:54:52.51

>>846
動的に確保したメモリ領域を1バイト単位の変数からおかしくないが、可変のマルチバイトの型にすると物理アドレスで追えなくなる。

警備員[Lv.6][新初] (ﾜｯﾁｮｲ 7b5f-7UPu) · 2024/05/15(水) 21:59:14.32

Pythonは一般的にコレクションにあたるものが独特の定義と変な構文・命令文で操作するから、素直な配列をリストと言う名称にして、配列とも呼ぶということにしたせいでわかりにくくなった。

配列は連続したメモリ領域という意味合いがあるが、Pythonは完全に無視しているので、初心者にはハードルが高い。

2024/05/15(水) 22:33:27.30

変にかじってるから連結リストを連想するんでは
シンプルに一覧、複数の要素を含むデータ構造ってだけ

2024/05/15(水) 22:35:29.17

arrayで良かったがな

2024/05/15(水) 23:48:19.33

>>871,872
配列の領域を動的に拡張する動的配列の話と
ヒープというか1つの配列で複数の型の値を管理する話がごちゃ混ぜになってたのね

動的配列であるPythonのlistも連続したメモリ領域(内部はCのarray)
先頭アドレス+インデックスでインデックス番目の要素にO(1)でアクセス可能
連続メモリ領域である配列に型の異なる要素を入れられるのは
PyObjectというオブジェクトへのポインタを格納してる配列だから

intやfloatを格納してもポインタの間接参照が必ず入るので
それを必要としないarray.arrayやndarrayに比べるとシーケンシャルスキャンなどは遅い

2024/05/15(水) 23:50:58.58

なんでappendした時のアドレスは最初から空いてるんだ?

2024/05/15(水) 23:59:39.16

動的配列(dynamic array)とか可変長配列(variable length array)でググってください

2024/05/16(木) 02:28:34.83

>>874
それは実装の瑣末な問題
ポインタに整数を埋め込んでいるrubyやv8などもある

2024/05/16(木) 09:01:52.97

アスペおじさんw

警備員[Lv.1][新芽] (ｱｳｱｳｳｰ Sa31-nr3a) · 2024/05/17(金) 09:14:14.67

test

**863** (ｱｳｱｳｳｰ Sa31-nr3a) · 2024/05/17(金) 09:15:28.47

>>866
Stack Overflow 米国年収。2022 -> 2023。
Rubyは、Go/Rust/Elixir の3大言語を超えた！

Ruby : 9.3 -> 9.9 万ドル
Elixir : 9.3 -> 9.6
Go : 8.9 -> 9.3
Rust : 8.7 -> 8.7

多くの言語 : 6.5～7 -> 7.3～7.8

PHP : 5 -> 5.9
Dart : 4.4 -> 5.6

プログラマーは、大卒コンピューターサイエンスが必須。
ただし、PHP, Dart だけは高卒用言語だから低収入。
だから、高卒で人工知能などをやっている香具師はいないはず

TIOBE Index 2024/4 では、
PHPは、9位 → 17。
一方、Ruby は、18 → 13

2019年「滅びゆく5つのプログラミング言語」として、
Ruby, Haskell, Objective-C, R, Perl の記事が出たけど、
実はRubyよりも、PHPの方が先に滅んでしまった

KENTA も、PHPをオワコン認定した。
そして初心者のキャリアパスは、Rails → Go のみと言う

2024/05/17(金) 09:47:04.55

滅ぶ為には一度栄える必要があるからな
滅ぶことすらできない言語が死屍累々

2024/05/18(土) 11:03:18.54

str.replaceとre.subがどっちがどっちだったか覚えられません

警備員[Lv.29] (ﾜｯﾁｮｲ 7ae7-e3iQ) · 2024/05/19(日) 20:02:36.67

>>874
知識がないようだけど、配列はすべて参照型というわけではない。

同じバイト数のデータ型なら、連続の領域を使う。
動的メモリ確保をして、メモリの断片化をさせる実装はあまりに無駄が多い。

2024/05/19(日) 20:20:55.34

RAMがハード的に仮想アドレスを持てるようにすれば、
ソフトが断片化とか気にしなくてよくなるな

2024/05/19(日) 21:43:05.64

CPUにMMUが追加されたかなり昔からOSが似たようなことをしているわけで

2024/05/19(日) 22:10:48.54

>>883
何言ってんだ？
全て参照だぞ

>同じバイト数のデータ型なら、連続の領域を使う。

これもデータをメモリに格納する話
先頭アドレスだけ解ればデータ型のビット数で算出出来るでしょ

2024/05/19(日) 22:11:43.39

スタックとかヒープ解ってない奴多過ぎ

2024/05/19(日) 23:42:12.30

ちんちんシュッシュッ
>>886
pythonはレジスタ長では

2024/05/19(日) 23:42:34.77

誤爆してるやないか

2024/05/20(月) 12:49:55.53

>>883
全参照なのでそこは間違い
連続になるのはcで連続に扱ったほうが高速に動くように改善されたデータ型だけで
必ず連続になるわけではないよ

2024/05/20(月) 12:50:47.46

それが何かというと
教えられないんだよな

2024/05/20(月) 12:51:13.63

ふう、ケツがヒヤッとした

2024/05/20(月) 14:41:24.00

>>890
>連続になるのはcで連続に扱ったほうが高速に動くように改善されたデータ型だけで
Pythonのlistにそんな最適化はされてなくない？

2024/05/20(月) 14:51:57.23

何故appendするとappend後のものを返すんじゃなくて元データが変更されるのか

2024/05/20(月) 18:02:45.08

>>893
>>832のソース見てもわかるようにそういう機能は無いね

>>894
appendは何も返さない
新しいlistを生成して返すのではなく
元のlistをmutateするのはそのほうが効率がいいから

2024/05/20(月) 18:38:10.23

>同じバイト数のデータ型なら、連続の領域を使う。
「連続領域を使う」というのは「配列の中身がポインタじゃなく実データになる」という意味なんだろうけどバイト数が同じかどうかで判断したりはしないでしょ
少なくともndarrayやarray.arrayはそういう実装にはなってない

他の言語の話だとしてもバイト数で判断する実装というのは聞いたことがない

2024/05/20(月) 18:48:16.70

読んでないけど、普通に実装したらポインタの配列にするのでは

2024/05/20(月) 18:51:43.87

array型すら中身はポインタだろ
値を直接突っ込む意味がない

2024/05/20(月) 19:17:25.12

pythonで扱う対象は全てオブジェクトです
というのは、高級なことを言ってる訳でもなくて、
全部ポインタで管理してるというだけの意味なんだよな

数字の1を入れたいと思っても、
0x01とか0x00000001を直接入れずにその実体は別にあってそのポインタを入れる

2024/05/20(月) 21:15:13.12

ぬるぽ

2024/05/20(月) 21:56:53.36

>>898
array.arrayそれ自身はPyObjectのポインタだけど
配列に格納してる中身はポインタじゃなくて実データ
取り出す時にPyObjectのポインタに変換してる

2024/05/20(月) 22:04:16.29

値を直接突っ込む意味はポインタのデリファレンスが必要なく
ローカリティが高いので処理によっては高速化できる(numpyが好まれる理由はこれ)
あとは必要なメモリサイズを小さくできる

警備員[Lv.30] (ﾜｯﾁｮｲ 7ab5-e3iQ) · 2024/05/21(火) 23:12:02.77

>>886
Pythonの配列のことではない。Pythonはコンテナというコレクションしかないので、他のプログラミング言語からするとアクセスの遅いコレクションしかないという何とも言えないクソ

警備員[Lv.30] (ﾜｯﾁｮｲ 7ab5-e3iQ) · 2024/05/21(火) 23:14:53.11

>>890
リストあたりは連続領域だよ？
要素に次の要素のアドレスが入っている。　

2024/05/21(火) 23:16:32.85

モノホンのヤバい人だったなｗｗｗ

警備員[Lv.30] (ﾜｯﾁｮｲ 7ab5-e3iQ) · 2024/05/21(火) 23:17:32.91

>>899
それは違う。普通の変数は関数などの呼び出し時にその変数の領域が割り当てられる。

警備員[Lv.30] (ﾜｯﾁｮｲ 7ab5-e3iQ) · 2024/05/21(火) 23:18:49.62

Pythonのスレはコンピューターをわかっていない人間が多すぎるよか

2024/05/21(火) 23:22:15.64

関数の引数で渡されるのが変数の実体なのか参照なのかは参照渡し云々で、
オブジェクトとして管理してるかとは別次元の話

警備員[Lv.30] (ﾜｯﾁｮｲ 7ab5-e3iQ) · 2024/05/21(火) 23:27:47.72

>>908
関数というサブルーチンを呼び出すときはCPUがスタックに呼び出し元の情報を保存して、関数というサブルーチンをプログラムからメモリにコピーする。

ノイマン型コンピューターなんだから、プログラムが保存されているところと、実行するプログラムは別物。

2024/05/21(火) 23:31:25.76

スタックから取り出したものが実体なのかポインタなのかは実装次第
コンピューターをわかっていない人間が多すぎる

2024/05/21(火) 23:44:17.95

ID:oNhs0c9T0の言ってることは、一見それらしいことを言ってるように見せかけて全部メチャクチャなので読む努力をしない方がいい
わざとやってるのかな？

2024/05/22(水) 00:34:43.45

わざとだろうね
じゃなければ病気かも

警備員[Lv.31] (ﾜｯﾁｮｲ 275f-e3iQ) · 2024/05/22(水) 14:49:18.95

>>910
スタックはメモリ構造のこで、スタックにブッシュしたメモリのアドレス順とは逆にポップではメモリの値を戻す。

2024/05/22(水) 14:58:06.52

GPT-4oに頭の悪い文章を書かせるテストをしています

2024/05/22(水) 15:37:05.89

>>906の頓珍漢レスを解説すると
彼が「関数などの呼び出し時に割り当てられる変数の領域」と読んでるものはスタックフレームのこと
対して>>899はスタックフレーム内の各変数が指してるのが
内部表現ではポインタなのか実体なのかという話をしてる
Pythonの場合は変数が指してるのはすべてポインタ(PyObject *)

もういちいち指摘しないけど>>903や>>904もすべて間違いなので
良い子は騙されないようにしましょう

警備員[Lv.31] (ﾜｯﾁｮｲ 275f-e3iQ) · 2024/05/22(水) 15:54:52.08

>>915
スタックはコンピューターのスタックでCPUの仕様
コンピューターを知らずに特定のプログラミング言語の用語だと思っているのか情けないねえ。

2024/05/22(水) 15:56:14.32

汎用機とかでハードスタック内容機種もあるけどなw

2024/05/22(水) 16:07:35.17

積みゲーオーバーフロー

2024/05/22(水) 16:17:21.02

CPUの実装の話？
pythonの実装の話？

2024/05/22(水) 18:00:18.16

100%発達障害
- 文脈が全く読めない
- 自分だけに通じる言葉使い
- 異常なまでに過大な自己評価
- とにかく自己正当化する

2024/05/22(水) 18:37:24.65

>>913
違う

ブッシュって何？
プッシュ(push)ね

間違えちゃダメだぞ

2024/05/22(水) 18:52:07.56

>>916
CPUについて詳しそうだから聞くんだけど
なぜ逆ポーランド記法？
正規ポーランド記法もトルーマン記法でもよくないか？

2024/05/22(水) 18:59:36.55

>>916
結婚しよう
つまり、Concrete

2024/05/23(木) 13:36:14.27

ぶん回してるのがオーバーフローかなんかで落ちるんだけど回避できるの？
エスパーよろ

2024/05/23(木) 13:47:59.79

一般論でいえば精度をあきらめるかアルゴリズム見直す
桁の上位・下位のベクトルで持つとか
いっそPython捨てるのもあり

2024/05/23(木) 14:04:22.65

リソース無くなったら誤動作する、というのはCPUの宿命だよな
そこを絶対安全にするアイディアが無い

2024/05/23(木) 15:15:41.08

算術オーバーフローなのか
スタックオーバーフローなのか
バッファオーバーフローなのか
ヒープオーバーフローなのか

どれも回避は可能だけど
ものによっては手間がかかる

2024/05/23(木) 15:19:37.02

(100!)!を計算するソフトをメモリ4kBで書いて

2024/05/23(木) 15:27:32.82

ありがとう
例えば一定時間たったら自殺して再スタートとか、同じような別コード走らせてお互いに監視して死んでたら復活させるとかはインプレスのパイソン入門一通り全部理解した程度の私でもググればいけるレベルでしょうか？

2024/05/23(木) 15:56:34.32

>>929
前者は別プロセスで処理を再スタートさせてから自分を落とす順序にすれば簡単
後者は初心者には難しい
あとはプロセスを定期的に監視して再起動するようなツールを使う手がある

2024/05/23(木) 19:11:14.74

>>928
そんなに余裕持って書いていいの！？
超余裕じゃん96バイトあればかけるんちゃう？

2024/05/23(木) 21:02:48.51

>>931
100!>2^100だから96バイトのメモリじゃ計算できないでしょ

2024/05/23(木) 21:51:40.26

非ノイマン的に、メモリは変数領域に全部使って良いとする

2024/05/23(木) 21:56:52.00

>>930
ありがとう！
supervisorというのを見つけたんでこれやってみます！

2024/05/24(金) 13:44:40.40

子どもが言語を獲得していくのと同じようにAIモデルに学習させることに成功

AIの真価が加速する

2024/05/24(金) 16:19:37.38

プログラミングやったことないんだけど、
すごく興味あります。自動学習的なやつとか特に。
たぶん、ある程度基本的なことを勉強したら、
どこかから画像認識できるプログラムのパーツ的なものを拝借して
作れるのかなと思ってるんですがあってますか？
あと、疑問なんですけど、
画像を読み込ませて学習するっていう話を聞いたことがあるのですが、
それってどんなものでも行けるんでしょうか？
例えば、産業用みたいな感じでベルトコンベヤーに乗って流れてきたものが
ギョウザだと認識できたらロボットアームでつかむ、
饅頭だと認識したらスルーみたいなプログラムと
おっぱいとお尻を区別するプログラム(昔ネットでやってる人を見ました）とかって
プログラム的には同じで覚えこませる画像が違うだけというイメージであってますか？
わかりにくい文ですみませんがご教授ください。

2024/05/24(金) 16:41:37.85

現実同様全ドメインを把握しなくても生活できるように
社会を構築しているのであってる
物事をモデル化するときは現実のようなしがらみが少ない分
できるだけ一般化を進めるので後半もあってる
どちらも良心に基づく話だから当てはまらない界隈も多いけど

2024/05/24(金) 17:31:34.34

>>936
拝借して作れるけど精度上げたいなら転移学習

モノを掴むとかもできるけどラズパイのgpioなどをも学ぶ必要あり

見分けるには教師データが転移学習でも数千枚必要
そんなものを数千枚ずつ入れたフォルダを素面で見て自己嫌悪にならないなら作れるw

2024/05/24(金) 17:36:06.97

>>937
良心というのはどういう意味ですか？

2024/05/24(金) 17:43:01.90

ラズパイのプログラミングはまた別なんですね。

画像データって色々あると思うんですが、
動画取ってそのキャプチャ画像とかでも使えますか？
やっぱり解像度とか精度に影響与えますかね？
数千枚は確かに重労働ですね・・・

2024/05/24(金) 17:46:12.78

良心はconscienceの訳語なのに、
conscienceの意味が全然理解されてないんだよな

2024/05/25(土) 10:44:55.91

4年前のソースコードgithubから落としてきたんだが
kerasとかtensorflowとかpytorchとか色々変更があって関数の変更がめちゃ大変

こういう時って
ライブラリを当時のバージョンに合わすか
関数を今のライブラリに変更するか
どっちがいいですか？