【統計分析】機械学習・データマイニング32

■ このスレッドは過去ログ倉庫に格納されています
2022/08/01(月) 01:56:45.77ID:0yKqFwG20
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
【統計分析】機械学習・データマイニング31
https://mevius.5ch.net/test/read.cgi/tech/1632587566/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2022/09/28(水) 21:10:54.07ID:BOMDu6HO0
>>523
この定義は?
>人間と同等の創造力や応用力があるコンピュータ
525デフォルトの名無しさん (ワッチョイ 22ea-wKV2 [61.211.15.194])
垢版 |
2022/09/29(木) 00:32:33.10ID:HWwIwn+Q0
現在のAIが知能と呼べるものかということについては1年程前にマイケルジョーダンが
発言を行ってAI業界で話題を集めた。
ジョーダンの指摘の内容は現在のAIは極めて限定的な認知力の範囲で有効なものであり
創造性という観点では知性は皆無というものとなる。
つまり、彼の見方ではAIは既知の学習の範囲内において画像認識とか限定的な領域で
人間よりも早く処理をこなせるというだけの存在であり、本質的な意味での知性=創造性
は皆無に近いことになる。
この発言が注目を集めたのはジョーダンは教師なし学習の分野ではAIのトップ研究者であり、
被引用数では深層学習の父とも言えるルカンを超えるAI学界の頂点にいる研究者となる。
ただ、おそらくあえて言わないだけでルカンやヒントンも同じ見解じゃないかと思う。
もっとも/r/machinelearningとかでのディスカッションだと今更、深層学習を全否定され
てもな、という否定的な意見も多かった。
2022/09/29(木) 01:44:50.94ID:gP6ILi1b0
2022/09/29(木) 02:09:34.44ID:A75TDx2R0
シンプルに自我を持てる/持てないでええねん
2022/09/29(木) 02:50:51.47ID:gP6ILi1b0
>>525とりあえず皆に伝わる共用の言葉で語ってください。

特に数学は世界でただ一つの共通語です。
2022/09/29(木) 02:54:23.08ID:gP6ILi1b0
えらいひとがいったからといってただしいわけではない
2022/09/29(木) 03:49:43.07ID:6tct/z4w0
>>525
ネタを書くならもっと面白いのをお願いします
2022/09/29(木) 07:37:20.92ID:9dbYk4AE0
冗談なんだろw
2022/09/29(木) 08:20:41.90ID:eCXZCLoXr
マイケル・ジョーダンというAI研究者がいるのかね
2022/09/29(木) 14:14:52.77ID:tnpyjDHqr
66歳か
年齢高め

人間の意識とAIの意識のようなものを区別しようとしたら
結局は身体性とかになって
じゃあ各種センサーとモーターでシリアル通信の入出力させてこれも参照したら
何が違うんだって事になる

文脈がどうのと言うならニューラルネットを恒久性の強いものに置き換えるか?
534デフォルトの名無しさん (アウアウウー Sa9b-8V4y [106.128.75.11])
垢版 |
2022/09/29(木) 17:52:06.81ID:3+iRfHh/a
>>527
シンギュラリティを起こすためには自我は必要ないよ
今までないものを創り出せる能力さえあればいい

そのためには自我が必要、と解明されれば必要になるけど
535デフォルトの名無しさん (ワッチョイ 8e71-mIyF [39.111.143.175])
垢版 |
2022/09/29(木) 18:01:07.78ID:8NNAIGLO0
BIツールとかエクセルとか書いてあるレベルの求人に落とされる・・・・
536デフォルトの名無しさん (ワッチョイ 0797-5djn [182.171.246.142])
垢版 |
2022/09/29(木) 22:25:45.97ID:2clVMJp50
人間だって自我があるかなんてわからないだろ
哲学的ゾンビみたいな思考実験もあるし
2022/09/30(金) 00:51:34.87ID:qun5+YRs0
状況を入力して
有効な解、アクションを取れれば
シンギュラリティをクリアでは?
自我とか身体性とか関係あるのか?
2022/09/30(金) 12:22:48.82ID:oE0BSGJzr
intelのArcがまもなく出るが
pythonで使えるライブラリも無い状況か
cudaそのまま使えるなんてあり得んだろうし

AMDもROCmというのを出しているが利用者少なくて厳しい

ところで2年ほど前に「chainerはRTX2000番台以降のGPUを使えない。
逆にPyTorchは2000番台からしか動かない」と見かけたが
chainerを2000番台で動かした例はあるみたいだし(さすがに3000は開発終了後か)、
PyTorchもドライバのバージョンを守れば動くという話だなあ
2022/09/30(金) 12:47:57.27ID:/HVdopIpM
tensorflowだと調子いいんじゃなかった?
2022/09/30(金) 13:38:32.26ID:oE0BSGJzr
しっかりと構造考えながらプログラムするならPyTorchだからなあ

そうこうするうちにRTX4000番台が出てしまう
541デフォルトの名無しさん (ワッチョイ ef09-6w4i [111.217.222.86])
垢版 |
2022/10/03(月) 07:58:19.34ID:3OKdXKbm0
Pytorchはネットワークの出力サイズをみまちま確認しながら書けるのが好き
542デフォルトの名無しさん (ワッチョイ ef71-0qRf [39.111.143.175])
垢版 |
2022/10/03(月) 18:39:22.03ID:lndyBnH50
統計、機械学習と書いてある求人でも環境がととのってなくて、
SQL,データ加工のハードスキルが必要と、あとBIw。データ加工ノックやったくらいと言ったけど反応は微妙だった・・・
2022/10/03(月) 19:48:28.91ID:K49WPwaj0
blwてなに?
2022/10/03(月) 21:36:24.42ID:Ot3gEL5c0
ビジネスインテリジェンス
2022/10/03(月) 22:19:34.39ID:SDpE8rM+a
ryzenのノート買おうと思うんだけどAPUでもgputensor使えますか?
ググるとrocmとかいうのを使える?
2022/10/03(月) 22:27:37.59ID:SDpE8rM+a
ryzen7 6800uです
547デフォルトの名無しさん (ワッチョイ ef71-0qRf [39.111.143.175])
垢版 |
2022/10/04(火) 02:40:17.18ID:7+jzy9KN0
>>543
読みにくすぎすまんwBIツール。
データ解析を使うのは統計学を学んだ人だけではないのでごくごく自然な流れなんでしょうね。
2022/10/04(火) 14:27:31.32ID:NyT7w/pB0
lstmてrnnなの?
549デフォルトの名無しさん (ワッチョイ cf10-1pq4 [153.243.53.4])
垢版 |
2022/10/04(火) 19:19:29.40ID:vB1FZx7X0
yes
550デフォルトの名無しさん (ワッチョイ ff2d-mFhn [133.218.31.229])
垢版 |
2022/10/04(火) 23:50:41.26ID:dBFQWhOf0
グリッドサーチ使って最適化しようとしたら
なんだか知らんがfitの所でエラーが出る
第一引数の特徴量の次元構造は2次元配列を渡しているのだが
それが駄目らしい(もちろんKNeighborsたrandamforestやMLPC単独でfitさせると
問題は生じない)
グリッドサーチ エラー等でググっても分からなかったから
グリッドサーチ的な物をスクラッチしようとしたら配列*配列*配列・・な総当りのプログラム書くのも
結構大変だ
なんだかんだ2日掛かった
2022/10/06(木) 11:13:15.37ID:KfTleoYi0
これからは量子コンピュータだぜw
2022/10/06(木) 12:59:00.16ID:V4vaPl9+d
ないない。。
日本政府が騙されて量子アニーリングに投資する限りは発展しない。
2022/10/06(木) 13:03:15.02ID:KfTleoYi0
ネタ、量子コンピュータは既に作られている、量産化されかどうかは知らんけどw
2022/10/06(木) 13:05:31.27ID:KfTleoYi0
よりよい未来のために今、量子へのアクセスを拡大
https://cloud.google.com/blog/ja/products/compute/ionq-quantum-computer-available-through-google-cloud
2022/10/06(木) 13:12:37.60ID:KfTleoYi0
D-WAVE
https://dwavejapan.com/system/
2022/10/06(木) 13:41:15.83ID:aol1S20z0
[0,[1,[2,[3,[4,[5]]]]]みたいな形をしたデータがあるのですが、もっと賢いデータ形式はありませんか?
データ出力しても見ててわかりにくいです
2022/10/06(木) 14:08:34.42ID:V4vaPl9+d
だから量子アニーリングはまがい物っていうてるやん。政府は騙されて投資してしまったけど、ゲートウェイ方式に転換しない限りは発展しないだろうね。
2022/10/06(木) 14:46:27.85ID:+TF3xkSVa
ハイパラチューって現場だとどうやってるんですか?
全数探索、ランダム、ベイジアン最適化?
optuna使うだけ?
559デフォルトの名無しさん (ワッチョイ efe2-0qRf [39.111.143.242])
垢版 |
2022/10/06(木) 14:59:07.63ID:6NJyji2N0
googleとかは自腹でやってるのに、NECだか日立だかポンコツ共は量子補助金のおねだり、トンネル効果で量子コンピュータと何の関係もないゴミの餌に
2022/10/06(木) 15:50:44.09ID:KfTleoYi0
ロナルド@デルフト大学VS西森@東工大
2022/10/06(木) 17:03:50.45ID:KfTleoYi0
量子コンピュータの現状と機械学習への応用
https://www.soumu.go.jp/main_content/000775388.pdf
2022/10/06(木) 17:10:49.71ID:KfTleoYi0
IBM Quantum machine learning
https://qiskit.org/learn/course/machine-learning-course
2022/10/06(木) 18:32:43.33ID:Q0rqE4kk0
そもそも理論的に解の妥当性の補償もない量子アニーリングに投資する輩がマジ信じられん。

少し調べたが最近はD-waveってベンチャー、アニーリングに見切りつけたようで。
https://blueqat.com/yuichiro_minato2/ac036704-f855-4a22-9ec3-98a237f34dbd
2022/10/06(木) 18:40:54.86ID:Q0rqE4kk0
今現在、日本政府が投資してるのは量子アニーリングっていうまがい物。

つまり日本で量子コンピュータなんて発展しなす。
2022/10/06(木) 20:14:58.00ID:kMmI3nWha
JTCなんてどこも先進的なことやってると謳いながら国にベッタリの補助金漬けだというのは周知の事実
2022/10/06(木) 20:20:05.21ID:Q0rqE4kk0
知的財産の用語の一つに『阻害要因』という言葉があるんだけど、ここまで綺麗に日本の技術発展を阻害している技術要因()ってなかなかないよね。
2022/10/06(木) 23:50:07.31ID:KfTleoYi0
>>564
シミュレーテッド アニーリングはNNの方法
2022/10/06(木) 23:51:17.53ID:KfTleoYi0
>>563
DLにも解が常に求まる保証はない
2022/10/07(金) 00:08:47.44ID:PRT+mOBl0
>>567
?、、えと‥。どこから突っ込めばよいのやら。
スレ違いの発言となりますが量子コンピュータは機械学習ではありません。

コンピュータは確定論でなければいけません。NNと一種ならばなおのこと一般向けとして使用してはいけませんね。
2022/10/07(金) 00:18:56.77ID:pQf1N7Z90
続きは量子コンピュータスレで
2022/10/07(金) 00:24:14.98ID:4hVmjE6Y0
まあ量子アニーリングは提唱されている方々の解説にかなり問題があるように見える。

出版されている本のレビューとか見てると、よくもまあ簡単な言葉に騙されている人が多いなと。
2022/10/07(金) 00:29:08.63ID:4hVmjE6Y0
ビジネスとしては見倣うべきか?
2022/10/07(金) 10:00:07.34ID:BKVIyvfB0
>>563
d-waveには当時からかなり懐疑的な視線が向けられてたような
むしろ日本は先を越された、彼らを追い返したnecは駄目だ、とかいう言及があったはず
2022/10/07(金) 19:47:12.31ID:4hVmjE6Y0
そうですね。d-waveがゲートウェイ方式に傾いたことで今後はご察し
富士通も日立もNECどうするだろう?
いずれの量子A研究グループも現在ほぼ成果が出てないのではないかな?

私は彼らの普段の仕事を何も知らないが量子Aで何も結果が残せないことを数学は保証する。見積甘すぎ
2022/10/07(金) 19:47:33.35ID:CNFz94QBa
焼きなまし法ってボルツマンマシンとかと同じでしょ?
なんでそんなものが取り上げられたのかよくわからん
量子ゲートも誤り訂正が実質無理なので実用は遥か先というか
何らかのブレイクスルーが起きないと無理
2022/10/07(金) 19:56:04.22ID:4hVmjE6Y0
そうですね。ボルツマンモデルが近いですね。
また東工大の偉い人曰く、きょくしょかいからほかのきょくしょかいへとんねるこうかですりぬけるだそうな。

意味不明。
2022/10/07(金) 20:01:17.27ID:pQf1N7Z90
>>575
Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images
https://ieeexplore.ieee.org/document/4767596
2022/10/07(金) 20:03:33.83ID:4hVmjE6Y0
>>577
ああ、はい。
第一原理の理論ではないですね。
意味わかる?
2022/10/07(金) 20:21:10.18ID:pQf1N7Z90
>>578
SAの論文を示したんだ意味わかる?
2022/10/07(金) 20:21:51.02ID:pQf1N7Z90
>>578
第一原理とは?
2022/10/07(金) 20:35:30.12ID:4hVmjE6Y0
>>580
物理法則の根本となる仮定の部分。
https://ja.m.wikipedia.org/wiki/%E7%AC%AC%E4%B8%80%E5%8E%9F%E7%90%86

例えばギブスエネルギーであれば、『状態和を表す物理量はf(x+y)=f(x)*f(y)という形を持っている』という仮定がある。

f(x+y)=f(x)*f(y)は物理現象として真ですか?
2022/10/07(金) 20:36:15.84ID:pQf1N7Z90
>>581
wikiは当てにならない
2022/10/07(金) 20:41:05.26ID:4hVmjE6Y0
>>582では581の本文を変えましょう

第一原理とは自然科学の物理法則の根本となる仮定の部分。その仮定を真としたとき、その仮定から演繹された現象は全て真である。

例えばギブスエネルギーであれば、『状態和を表す物理量はf(x+y)=f(x)*f(y)という形を持っている』という仮定がある。

>>580もう一度問いますが
f(x+y)=f(x)*f(y)は物理現象として真ですか?
2022/10/07(金) 20:48:48.81ID:pQf1N7Z90
>>578
ところで何で第一原理を持ち出したんだ?
2022/10/07(金) 20:52:44.07ID:pQf1N7Z90
>>583
物理で第一原理と言えば
物質の多体のシュレディンガー方程式を近似によらずなるべくそのまま解くこと
だが
2022/10/07(金) 21:01:26.86ID:pQf1N7Z90
忖度して言うと
量子コンピュータで解く問題に対して、それを量子力学の多体問題として翻訳して、それをそのままで解くこと
てな感じかな、知らんけどw
2022/10/07(金) 21:20:01.01ID:4hVmjE6Y0
ん?なんかwiki避けたら変な方向に行ってるな。
違いますよ。量子の問題とは関係なく『第一原理』という言葉は>>583の意味を指します。シュレディンガー方程式の多体問題を解くシミュレーションは『第一原理バンド計算』と正式には分類されます。

ここで第一原理を取り上げたのは
量子Aの原理が第一原理を無視った原理であるためです。

まーたく解の保証はないのに日本の企業お馬鹿さんたちは、量子Aの簡便なモデルに取り憑かれ無駄なお金を投資してるというわけです。
2022/10/07(金) 21:25:58.28ID:pQf1N7Z90
馬鹿の壁 終了
2022/10/07(金) 21:33:19.40ID:pQf1N7Z90
言い換えるとからかっただけ
2022/10/07(金) 22:08:12.31ID:pQf1N7Z90
多体のスピン系の話
2022/10/07(金) 22:26:26.31ID:pQf1N7Z90
平均場近似以上の解を求めるということか、ニールセンも第10版だしね
2022/10/07(金) 23:18:56.62ID:pQf1N7Z90
計算機の世界、悪貨が良貨を駆逐する、シリコンが生き残る、分からないw
2022/10/08(土) 06:18:14.25ID:jOLU688EH
馬鹿が連投してただの糞スレになったな
2022/10/08(土) 10:25:26.36ID:KaiIk1Xk0
ゲート型はプログラムごとに論路回路を作るw
2022/10/08(土) 12:11:48.47ID:KaiIk1Xk0
俺は、続きは量子力学スレで、と言ったんだがw
2022/10/08(土) 12:35:36.92ID:yyZ+BMrv0
midjourneyを素人にどう説明すりゃいいの?
597デフォルトの名無しさん (スッップ Sd5a-yl7y [49.98.147.147])
垢版 |
2022/10/08(土) 22:17:10.03ID:i7TXyGNRd
役に立つことあるかなと思って2年ぐらいこのスレ見てたけど皆無でしたw
2022/10/08(土) 22:24:20.46ID:KaiIk1Xk0
お前の書き込みもなw
599デフォルトの名無しさん (ワッチョイ 2e10-XciQ [153.243.53.4])
垢版 |
2022/10/09(日) 01:01:56.06ID:9ImDgsuy0
ここに書き込むのなんか全員サワリだけのワナビーでしよ
2022/10/09(日) 07:12:28.80ID:us0laBSc0
チラシの落書きに何を期待する、という見方
何をしたいのか分からないのか、という見方
・・・
2022/10/09(日) 12:16:08.76ID:tY6KZ2lI0
synthesizer vてなんであんなに品質高いの?
2022/10/10(月) 09:19:08.37ID:lW2nTNyC0
一ヶ月もかけて書いた独自アルゴリズムがちゃんと動作するか気になって
どうしても実行中のkaggleのカーネルから目が離せない
すごく無駄な時間なのに目が離せない
2022/10/10(月) 09:20:35.35ID:lW2nTNyC0
マジでどうすればいいんだろう
みんな、実行時間が2時間を超える処理の実行結果が気になって
別の作業が手につかない時にどうやって頭を切り替えてる?
2022/10/10(月) 10:40:31.99ID:C9XaDRaS0
熱いコーヒーを飲む
2022/10/10(月) 11:58:30.96ID:7gBnEc2D0
寝る
2022/10/12(水) 07:25:28.61ID:SmnzTN2xH
Windows Updateが動くたびにVSCodeのウインドウが落ちる
2022/10/12(水) 15:28:46.53ID:jC6qXKwq
>>603
いったんオナニーでスッキリ
2022/10/17(月) 00:39:50.36ID:EIHjNblk0
外付けGPUではゲームは出来るが深層学習は出来ない、って聞いていたし信じ込んでいたのだが、

今ちょっと調べたら成功している例がちらほらというか
勝間和代氏が成功してるんじゃないのw
もちろんスピードは落ちるけど
2022/10/17(月) 10:14:42.05ID:DIX4RQTnM
あの人でもできるんだヘー
2022/10/19(水) 02:58:02.81ID:JPvx4Nee
画像認識の練習として、4文字のひらがな画像認証キャプチャー突破に挑戦してみたのですがあっさりほぼ100%認証できました
ですが・・
ノイズのかかったキャプチャーに挑戦してみたところ急に段違いの難易度になりました
こういうのです
https://i.imgur.com/YJHh9ul.jpg
さすがにこういう、ノイズも文字の一部に見えないこともない、みたいなやつだと難しいですよね?
何か良いアイデアはありますでしょうか
練習で足止めされるのも嫌なのでもう諦めて次行こうかなとも思ってます
2022/10/19(水) 08:09:01.36ID:dksue1xmH
学習データ増やすしかないんじゃないの
2022/10/19(水) 09:12:00.69ID:TYSgUbxaM
それを感があるのが楽しいと思うんだけど😅
2022/10/19(水) 10:40:03.06ID:JPvx4Nee
一応やったのは
・正解データに近い”ノイズ+4文字ひらがな”キャプチャを生成する
・50px×50pxで一文字ずつ分割
みたいなのを1万枚(×4)くらいです

思ってた以上に、前処理で手こずりました・・
ざっくり直面した問題は
・一文字をしきい値で座標で区切ると、隣の文字が微妙にかぶる
・キーとノイズのしきい値が区別できないのでノイズがキレイに取り切れない(たとえば、”は”のバックに取り切れなかったヨコ線ノイズがあると”ほ”に見える)
たぶんこの部分をクリアできたら行けそうな気がします
やれることを考えると
・ある程度は「一文字がどの座標から始まるか」「一文字の間隔」に規則性があるので
 ざっくり一文字を区切り、4隅の独立したノイズを文字ごと消す
・”は”や”ほ”、”に”や”た”など、ノイズにより二面性三面性を現すキーを洗い出す
・一文字ずつの特徴量を算出する
くらいかなと画策してます
あとは上とは別のアプローチで、そもそもペアデータレスな拡散モデルでどうにかできるか考えています
2022/10/19(水) 21:44:59.22ID:KdBl77waH
機械学習じゃなくて、もはやアルゴだな
2022/10/20(木) 00:24:26.37ID:7Dzkrm7g0
人為的になんとかしようと考えた時点で‥完
2022/10/20(木) 01:14:15.50ID:y3K9DSVg
深層強化学習だとエサを与えるわけですが
それって人為的ぽくないすか?
2022/10/20(木) 01:25:07.01ID:7Dzkrm7g0
人の性質として先々の限界が見えてしまう‥‥
2022/10/20(木) 01:29:11.00ID:10va8QHp
うーん・・チューリングテスト不合格
2022/10/20(木) 09:23:06.15ID:vWHP35QB0
在イランアメリカ大使館人質事件か
620デフォルトの名無しさん (ワッチョイ 9fea-2yG4 [61.211.15.194])
垢版 |
2022/10/20(木) 15:32:04.75ID:nCDkhQbq0
前処理で特定のパターン排除の意図的な処理を加えるとバイアスが生じる
それで処理が通ったとしてもそれで処理可能なのは、ある特定のパターンの画像のみとなるからね
これをやると特定のパターンごとのルールが必要な80年代のルールベースのエキスパートシステムみたいになる。
2022/10/20(木) 17:08:08.32ID:y3K9DSVg
4文字ひらかなキャプチャの例でいくと
強化学習の過程で、正解のご褒美与えるタイミングのルールってほぼ無し?
50音×50×50×50の確率で正解
だけだとめちゃくちゃ時間掛かりそうな気がする
「画像のこの部分から探してね」「薄かったり途切れすぎなやつは文字じゃないぞ」
みたいなヒントを与えるのも強化学習的には好ましくないってことかな

まずは、先頭の文字っぽい場所だけ当てたら褒めて学習終了
つぎのステップは、先頭の文字をドンピシャで当てたら褒めて学習終了
ってやれば少なくとも先頭の文字は行けそうだけど
これも作為的だよね
2番目、3番目であろうがどこから当てても、当てたら褒めてエサを与えて
ヒントは与えずひたすら見守る
だと思うけどめっちゃ時間かかりそう・・
2022/10/20(木) 17:47:27.46ID:C0rWwrYjH
機械学習とは、強化学習とは、いったい何なのかをよく考えたほうがいい
2022/10/20(木) 18:07:00.04ID:vWHP35QB0
何なの?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。