【統計分析】機械学習・データマイニング32

2022/08/01(月) 01:56:45.77

!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に１つずつ減るので、減ってたら３回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

＊機械学習に意識・知能は存在しません。
　　人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
【統計分析】機械学習・データマイニング31
https://mevius.5ch.net/test/read.cgi/tech/1632587566/

VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured

2022/09/28(水) 21:10:54.07

>>523
この定義は？
>人間と同等の創造力や応用力があるコンピュータ

2022/09/29(木) 00:32:33.10

現在のAIが知能と呼べるものかということについては１年程前にマイケルジョーダンが
発言を行ってAI業界で話題を集めた。
ジョーダンの指摘の内容は現在のAIは極めて限定的な認知力の範囲で有効なものであり
創造性という観点では知性は皆無というものとなる。
つまり、彼の見方ではAIは既知の学習の範囲内において画像認識とか限定的な領域で
人間よりも早く処理をこなせるというだけの存在であり、本質的な意味での知性＝創造性
は皆無に近いことになる。
この発言が注目を集めたのはジョーダンは教師なし学習の分野ではAIのトップ研究者であり、
被引用数では深層学習の父とも言えるルカンを超えるAI学界の頂点にいる研究者となる。
ただ、おそらくあえて言わないだけでルカンやヒントンも同じ見解じゃないかと思う。
もっとも/r/machinelearningとかでのディスカッションだと今更、深層学習を全否定され
てもな、という否定的な意見も多かった。

2022/09/29(木) 01:44:50.94

？

2022/09/29(木) 02:09:34.44

シンプルに自我を持てる/持てないでええねん

2022/09/29(木) 02:50:51.47

>>525とりあえず皆に伝わる共用の言葉で語ってください。

特に数学は世界でただ一つの共通語です。

2022/09/29(木) 02:54:23.08

えらいひとがいったからといってただしいわけではない

2022/09/29(木) 03:49:43.07

>>525
ネタを書くならもっと面白いのをお願いします

2022/09/29(木) 07:37:20.92

冗談なんだろｗ

2022/09/29(木) 08:20:41.90

マイケル・ジョーダンというAI研究者がいるのかね

2022/09/29(木) 14:14:52.77

66歳か
年齢高め

人間の意識とAIの意識のようなものを区別しようとしたら
結局は身体性とかになって
じゃあ各種センサーとモーターでシリアル通信の入出力させてこれも参照したら
何が違うんだって事になる

文脈がどうのと言うならニューラルネットを恒久性の強いものに置き換えるか？

2022/09/29(木) 17:52:06.81

>>527
シンギュラリティを起こすためには自我は必要ないよ
今までないものを創り出せる能力さえあればいい

そのためには自我が必要、と解明されれば必要になるけど

2022/09/29(木) 18:01:07.78

BIツールとかエクセルとか書いてあるレベルの求人に落とされる・・・・

2022/09/29(木) 22:25:45.97

人間だって自我があるかなんてわからないだろ
哲学的ゾンビみたいな思考実験もあるし

2022/09/30(金) 00:51:34.87

状況を入力して
有効な解、アクションを取れれば
シンギュラリティをクリアでは?
自我とか身体性とか関係あるのか?

2022/09/30(金) 12:22:48.82

intelのArcがまもなく出るが
pythonで使えるライブラリも無い状況か
cudaそのまま使えるなんてあり得んだろうし

AMDもROCmというのを出しているが利用者少なくて厳しい

ところで2年ほど前に「chainerはRTX2000番台以降のGPUを使えない。
逆にPyTorchは2000番台からしか動かない」と見かけたが
chainerを2000番台で動かした例はあるみたいだし(さすがに3000は開発終了後か)、
PyTorchもドライバのバージョンを守れば動くという話だなあ

2022/09/30(金) 12:47:57.27

tensorflowだと調子いいんじゃなかった？

2022/09/30(金) 13:38:32.26

しっかりと構造考えながらプログラムするならPyTorchだからなあ

そうこうするうちにRTX4000番台が出てしまう

2022/10/03(月) 07:58:19.34

Pytorchはネットワークの出力サイズをみまちま確認しながら書けるのが好き

2022/10/03(月) 18:39:22.03

統計、機械学習と書いてある求人でも環境がととのってなくて、
SQL，データ加工のハードスキルが必要と、あとBIｗ。データ加工ノックやったくらいと言ったけど反応は微妙だった・・・

2022/10/03(月) 19:48:28.91

blwてなに？

2022/10/03(月) 21:36:24.42

ビジネスインテリジェンス

2022/10/03(月) 22:19:34.39

ryzenのノート買おうと思うんだけどAPUでもgputensor使えますか？
ググるとrocmとかいうのを使える？

2022/10/03(月) 22:27:37.59

ryzen7 6800uです

2022/10/04(火) 02:40:17.18

>>543
読みにくすぎすまんｗBIツール。
データ解析を使うのは統計学を学んだ人だけではないのでごくごく自然な流れなんでしょうね。

2022/10/04(火) 14:27:31.32

lstmてrnnなの？

2022/10/04(火) 19:19:29.40

yes

2022/10/04(火) 23:50:41.26

グリッドサーチ使って最適化しようとしたら
なんだか知らんがfitの所でエラーが出る
第一引数の特徴量の次元構造は2次元配列を渡しているのだが
それが駄目らしい(もちろんKNeighborsたrandamforestやMLPC単独でfitさせると
問題は生じない)
グリッドサーチエラー等でググっても分からなかったから
グリッドサーチ的な物をスクラッチしようとしたら配列*配列*配列・・な総当りのプログラム書くのも
結構大変だ
なんだかんだ2日掛かった

2022/10/06(木) 11:13:15.37

これからは量子コンピュータだぜｗ

2022/10/06(木) 12:59:00.16

ないない。。
日本政府が騙されて量子アニーリングに投資する限りは発展しない。

2022/10/06(木) 13:03:15.02

ネタ、量子コンピュータは既に作られている、量産化されかどうかは知らんけどｗ

2022/10/06(木) 13:05:31.27

よりよい未来のために今、量子へのアクセスを拡大
https://cloud.google.com/blog/ja/products/compute/ionq-quantum-computer-available-through-google-cloud

2022/10/06(木) 13:12:37.60

D-WAVE
https://dwavejapan.com/system/

2022/10/06(木) 13:41:15.83

[0,[1,[2,[3,[4,[5]]]]]みたいな形をしたデータがあるのですが、もっと賢いデータ形式はありませんか？
データ出力しても見ててわかりにくいです

2022/10/06(木) 14:08:34.42

だから量子アニーリングはまがい物っていうてるやん。政府は騙されて投資してしまったけど、ゲートウェイ方式に転換しない限りは発展しないだろうね。

2022/10/06(木) 14:46:27.85

ハイパラチューって現場だとどうやってるんですか？
全数探索、ランダム、ベイジアン最適化？
optuna使うだけ？

2022/10/06(木) 14:59:07.63

googleとかは自腹でやってるのに、NECだか日立だかポンコツ共は量子補助金のおねだり、トンネル効果で量子コンピュータと何の関係もないゴミの餌に

2022/10/06(木) 15:50:44.09

ロナルド@デルフト大学VS西森@東工大

2022/10/06(木) 17:03:50.45

量子コンピュータの現状と機械学習への応用
https://www.soumu.go.jp/main_content/000775388.pdf

2022/10/06(木) 17:10:49.71

IBM Quantum machine learning
https://qiskit.org/learn/course/machine-learning-course

2022/10/06(木) 18:32:43.33

そもそも理論的に解の妥当性の補償もない量子アニーリングに投資する輩がマジ信じられん。

少し調べたが最近はD-waveってベンチャー、アニーリングに見切りつけたようで。
https://blueqat.com/yuichiro_minato2/ac036704-f855-4a22-9ec3-98a237f34dbd

2022/10/06(木) 18:40:54.86

今現在、日本政府が投資してるのは量子アニーリングっていうまがい物。

つまり日本で量子コンピュータなんて発展しなす。

2022/10/06(木) 20:14:58.00

JTCなんてどこも先進的なことやってると謳いながら国にベッタリの補助金漬けだというのは周知の事実

2022/10/06(木) 20:20:05.21

知的財産の用語の一つに『阻害要因』という言葉があるんだけど、ここまで綺麗に日本の技術発展を阻害している技術要因()ってなかなかないよね。

2022/10/06(木) 23:50:07.31

>>564
シミュレーテッドアニーリングはNNの方法

2022/10/06(木) 23:51:17.53

>>563
DLにも解が常に求まる保証はない

2022/10/07(金) 00:08:47.44

>>567
？、、えと‥。どこから突っ込めばよいのやら。
スレ違いの発言となりますが量子コンピュータは機械学習ではありません。

コンピュータは確定論でなければいけません。NNと一種ならばなおのこと一般向けとして使用してはいけませんね。

2022/10/07(金) 00:18:56.77

続きは量子コンピュータスレで

2022/10/07(金) 00:24:14.98

まあ量子アニーリングは提唱されている方々の解説にかなり問題があるように見える。

出版されている本のレビューとか見てると、よくもまあ簡単な言葉に騙されている人が多いなと。

2022/10/07(金) 00:29:08.63

ビジネスとしては見倣うべきか？

2022/10/07(金) 10:00:07.34

>>563
d-waveには当時からかなり懐疑的な視線が向けられてたような
むしろ日本は先を越された、彼らを追い返したnecは駄目だ、とかいう言及があったはず

2022/10/07(金) 19:47:12.31

そうですね。d-waveがゲートウェイ方式に傾いたことで今後はご察し
富士通も日立もNECどうするだろう？
いずれの量子A研究グループも現在ほぼ成果が出てないのではないかな？

私は彼らの普段の仕事を何も知らないが量子Aで何も結果が残せないことを数学は保証する。見積甘すぎ

2022/10/07(金) 19:47:33.35

焼きなまし法ってボルツマンマシンとかと同じでしょ？
なんでそんなものが取り上げられたのかよくわからん
量子ゲートも誤り訂正が実質無理なので実用は遥か先というか
何らかのブレイクスルーが起きないと無理

2022/10/07(金) 19:56:04.22

そうですね。ボルツマンモデルが近いですね。
また東工大の偉い人曰く、きょくしょかいからほかのきょくしょかいへとんねるこうかですりぬけるだそうな。

意味不明。

2022/10/07(金) 20:01:17.27

>>575
Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images
https://ieeexplore.ieee.org/document/4767596

2022/10/07(金) 20:03:33.83

>>577
ああ、はい。
第一原理の理論ではないですね。
意味わかる？

2022/10/07(金) 20:21:10.18

>>578
SAの論文を示したんだ意味わかる？

2022/10/07(金) 20:21:51.02

>>578
第一原理とは？

2022/10/07(金) 20:35:30.12

>>580
物理法則の根本となる仮定の部分。
https://ja.m.wikipedia.org/wiki/%E7%AC%AC%E4%B8%80%E5%8E%9F%E7%90%86

例えばギブスエネルギーであれば、『状態和を表す物理量はf(x+y)＝f(x)*f(y)という形を持っている』という仮定がある。

f(x+y)＝f(x)*f(y)は物理現象として真ですか？

2022/10/07(金) 20:36:15.84

>>581
wikiは当てにならない

2022/10/07(金) 20:41:05.26

>>582では581の本文を変えましょう

第一原理とは自然科学の物理法則の根本となる仮定の部分。その仮定を真としたとき、その仮定から演繹された現象は全て真である。

例えばギブスエネルギーであれば、『状態和を表す物理量はf(x+y)＝f(x)*f(y)という形を持っている』という仮定がある。

>>580もう一度問いますが
f(x+y)＝f(x)*f(y)は物理現象として真ですか？

2022/10/07(金) 20:48:48.81

>>578
ところで何で第一原理を持ち出したんだ？

2022/10/07(金) 20:52:44.07

>>583
物理で第一原理と言えば
物質の多体のシュレディンガー方程式を近似によらずなるべくそのまま解くこと
だが

2022/10/07(金) 21:01:26.86

忖度して言うと
量子コンピュータで解く問題に対して、それを量子力学の多体問題として翻訳して、それをそのままで解くこと
てな感じかな、知らんけどｗ

2022/10/07(金) 21:20:01.01

ん？なんかwiki避けたら変な方向に行ってるな。
違いますよ。量子の問題とは関係なく『第一原理』という言葉は>>583の意味を指します。シュレディンガー方程式の多体問題を解くシミュレーションは『第一原理バンド計算』と正式には分類されます。

ここで第一原理を取り上げたのは
量子Aの原理が第一原理を無視った原理であるためです。

まーたく解の保証はないのに日本の企業お馬鹿さんたちは、量子Aの簡便なモデルに取り憑かれ無駄なお金を投資してるというわけです。

2022/10/07(金) 21:25:58.28

馬鹿の壁　終了

2022/10/07(金) 21:33:19.40

言い換えるとからかっただけ

2022/10/07(金) 22:08:12.31

多体のスピン系の話

2022/10/07(金) 22:26:26.31

平均場近似以上の解を求めるということか、ニールセンも第10版だしね

2022/10/07(金) 23:18:56.62

計算機の世界、悪貨が良貨を駆逐する、シリコンが生き残る、分からないｗ

2022/10/08(土) 06:18:14.25

馬鹿が連投してただの糞スレになったな

2022/10/08(土) 10:25:26.36

ゲート型はプログラムごとに論路回路を作るｗ

2022/10/08(土) 12:11:48.47

俺は、続きは量子力学スレで、と言ったんだがｗ

2022/10/08(土) 12:35:36.92

midjourneyを素人にどう説明すりゃいいの？

2022/10/08(土) 22:17:10.03

役に立つことあるかなと思って2年ぐらいこのスレ見てたけど皆無でしたw

2022/10/08(土) 22:24:20.46

お前の書き込みもなｗ

2022/10/09(日) 01:01:56.06

ここに書き込むのなんか全員サワリだけのワナビーでしよ

2022/10/09(日) 07:12:28.80

チラシの落書きに何を期待する、という見方
何をしたいのか分からないのか、という見方
・・・

2022/10/09(日) 12:16:08.76

synthesizer vてなんであんなに品質高いの？

2022/10/10(月) 09:19:08.37

一ヶ月もかけて書いた独自アルゴリズムがちゃんと動作するか気になって
どうしても実行中のkaggleのカーネルから目が離せない
すごく無駄な時間なのに目が離せない

2022/10/10(月) 09:20:35.35

マジでどうすればいいんだろう
みんな、実行時間が2時間を超える処理の実行結果が気になって
別の作業が手につかない時にどうやって頭を切り替えてる？

2022/10/10(月) 10:40:31.99

熱いコーヒーを飲む

2022/10/10(月) 11:58:30.96

寝る

2022/10/12(水) 07:25:28.61

Windows Updateが動くたびにVSCodeのウインドウが落ちる

**デフォルトの名無しさん** · 2022/10/12(水) 15:28:46.53

>>603
いったんオナニーでスッキリ

2022/10/17(月) 00:39:50.36

外付けGPUではゲームは出来るが深層学習は出来ない、って聞いていたし信じ込んでいたのだが、

今ちょっと調べたら成功している例がちらほらというか
勝間和代氏が成功してるんじゃないのｗ
もちろんスピードは落ちるけど

2022/10/17(月) 10:14:42.05

あの人でもできるんだﾍｰ

**デフォルトの名無しさん** · 2022/10/19(水) 02:58:02.81

画像認識の練習として、４文字のひらがな画像認証キャプチャー突破に挑戦してみたのですがあっさりほぼ１００％認証できました
ですが・・
ノイズのかかったキャプチャーに挑戦してみたところ急に段違いの難易度になりました
こういうのです
https://i.imgur.com/YJHh9ul.jpg
さすがにこういう、ノイズも文字の一部に見えないこともない、みたいなやつだと難しいですよね？
何か良いアイデアはありますでしょうか
練習で足止めされるのも嫌なのでもう諦めて次行こうかなとも思ってます

2022/10/19(水) 08:09:01.36

学習データ増やすしかないんじゃないの

2022/10/19(水) 09:12:00.69

それを感があるのが楽しいと思うんだけど😅

**デフォルトの名無しさん** · 2022/10/19(水) 10:40:03.06

一応やったのは
・正解データに近い”ノイズ＋４文字ひらがな”キャプチャを生成する
・50px×50pxで一文字ずつ分割
みたいなのを１万枚（×４）くらいです

思ってた以上に、前処理で手こずりました・・
ざっくり直面した問題は
・一文字をしきい値で座標で区切ると、隣の文字が微妙にかぶる
・キーとノイズのしきい値が区別できないのでノイズがキレイに取り切れない（たとえば、”は”のバックに取り切れなかったヨコ線ノイズがあると”ほ”に見える）
たぶんこの部分をクリアできたら行けそうな気がします
やれることを考えると
・ある程度は「一文字がどの座標から始まるか」「一文字の間隔」に規則性があるので
　ざっくり一文字を区切り、４隅の独立したノイズを文字ごと消す
・”は”や”ほ”、”に”や”た”など、ノイズにより二面性三面性を現すキーを洗い出す
・一文字ずつの特徴量を算出する
くらいかなと画策してます
あとは上とは別のアプローチで、そもそもペアデータレスな拡散モデルでどうにかできるか考えています

2022/10/19(水) 21:44:59.22

機械学習じゃなくて、もはやアルゴだな

2022/10/20(木) 00:24:26.37

人為的になんとかしようと考えた時点で‥完

**デフォルトの名無しさん** · 2022/10/20(木) 01:14:15.50

深層強化学習だとエサを与えるわけですが
それって人為的ぽくないすか？

2022/10/20(木) 01:25:07.01

人の性質として先々の限界が見えてしまう‥‥

**デフォルトの名無しさん** · 2022/10/20(木) 01:29:11.00

うーん・・チューリングテスト不合格

2022/10/20(木) 09:23:06.15

在イランアメリカ大使館人質事件か

2022/10/20(木) 15:32:04.75

前処理で特定のパターン排除の意図的な処理を加えるとバイアスが生じる
それで処理が通ったとしてもそれで処理可能なのは、ある特定のパターンの画像のみとなるからね
これをやると特定のパターンごとのルールが必要な80年代のルールベースのエキスパートシステムみたいになる。

**デフォルトの名無しさん** · 2022/10/20(木) 17:08:08.32

４文字ひらかなキャプチャの例でいくと
強化学習の過程で、正解のご褒美与えるタイミングのルールってほぼ無し？
５０音×５０×５０×５０の確率で正解
だけだとめちゃくちゃ時間掛かりそうな気がする
「画像のこの部分から探してね」「薄かったり途切れすぎなやつは文字じゃないぞ」
みたいなヒントを与えるのも強化学習的には好ましくないってことかな

まずは、先頭の文字っぽい場所だけ当てたら褒めて学習終了
つぎのステップは、先頭の文字をドンピシャで当てたら褒めて学習終了
ってやれば少なくとも先頭の文字は行けそうだけど
これも作為的だよね
２番目、３番目であろうがどこから当てても、当てたら褒めてエサを与えて
ヒントは与えずひたすら見守る
だと思うけどめっちゃ時間かかりそう・・

2022/10/20(木) 17:47:27.46

機械学習とは、強化学習とは、いったい何なのかをよく考えたほうがいい

2022/10/20(木) 18:07:00.04

何なの？