【統計分析】機械学習・データマイニング32

■ このスレッドは過去ログ倉庫に格納されています
2022/08/01(月) 01:56:45.77ID:0yKqFwG20
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
【統計分析】機械学習・データマイニング31
https://mevius.5ch.net/test/read.cgi/tech/1632587566/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
2022/10/06(木) 18:40:54.86ID:Q0rqE4kk0
今現在、日本政府が投資してるのは量子アニーリングっていうまがい物。

つまり日本で量子コンピュータなんて発展しなす。
2022/10/06(木) 20:14:58.00ID:kMmI3nWha
JTCなんてどこも先進的なことやってると謳いながら国にベッタリの補助金漬けだというのは周知の事実
2022/10/06(木) 20:20:05.21ID:Q0rqE4kk0
知的財産の用語の一つに『阻害要因』という言葉があるんだけど、ここまで綺麗に日本の技術発展を阻害している技術要因()ってなかなかないよね。
2022/10/06(木) 23:50:07.31ID:KfTleoYi0
>>564
シミュレーテッド アニーリングはNNの方法
2022/10/06(木) 23:51:17.53ID:KfTleoYi0
>>563
DLにも解が常に求まる保証はない
2022/10/07(金) 00:08:47.44ID:PRT+mOBl0
>>567
?、、えと‥。どこから突っ込めばよいのやら。
スレ違いの発言となりますが量子コンピュータは機械学習ではありません。

コンピュータは確定論でなければいけません。NNと一種ならばなおのこと一般向けとして使用してはいけませんね。
2022/10/07(金) 00:18:56.77ID:pQf1N7Z90
続きは量子コンピュータスレで
2022/10/07(金) 00:24:14.98ID:4hVmjE6Y0
まあ量子アニーリングは提唱されている方々の解説にかなり問題があるように見える。

出版されている本のレビューとか見てると、よくもまあ簡単な言葉に騙されている人が多いなと。
2022/10/07(金) 00:29:08.63ID:4hVmjE6Y0
ビジネスとしては見倣うべきか?
2022/10/07(金) 10:00:07.34ID:BKVIyvfB0
>>563
d-waveには当時からかなり懐疑的な視線が向けられてたような
むしろ日本は先を越された、彼らを追い返したnecは駄目だ、とかいう言及があったはず
2022/10/07(金) 19:47:12.31ID:4hVmjE6Y0
そうですね。d-waveがゲートウェイ方式に傾いたことで今後はご察し
富士通も日立もNECどうするだろう?
いずれの量子A研究グループも現在ほぼ成果が出てないのではないかな?

私は彼らの普段の仕事を何も知らないが量子Aで何も結果が残せないことを数学は保証する。見積甘すぎ
2022/10/07(金) 19:47:33.35ID:CNFz94QBa
焼きなまし法ってボルツマンマシンとかと同じでしょ?
なんでそんなものが取り上げられたのかよくわからん
量子ゲートも誤り訂正が実質無理なので実用は遥か先というか
何らかのブレイクスルーが起きないと無理
2022/10/07(金) 19:56:04.22ID:4hVmjE6Y0
そうですね。ボルツマンモデルが近いですね。
また東工大の偉い人曰く、きょくしょかいからほかのきょくしょかいへとんねるこうかですりぬけるだそうな。

意味不明。
2022/10/07(金) 20:01:17.27ID:pQf1N7Z90
>>575
Stochastic Relaxation, Gibbs Distributions, and the Bayesian Restoration of Images
https://ieeexplore.ieee.org/document/4767596
2022/10/07(金) 20:03:33.83ID:4hVmjE6Y0
>>577
ああ、はい。
第一原理の理論ではないですね。
意味わかる?
2022/10/07(金) 20:21:10.18ID:pQf1N7Z90
>>578
SAの論文を示したんだ意味わかる?
2022/10/07(金) 20:21:51.02ID:pQf1N7Z90
>>578
第一原理とは?
2022/10/07(金) 20:35:30.12ID:4hVmjE6Y0
>>580
物理法則の根本となる仮定の部分。
https://ja.m.wikipedia.org/wiki/%E7%AC%AC%E4%B8%80%E5%8E%9F%E7%90%86

例えばギブスエネルギーであれば、『状態和を表す物理量はf(x+y)=f(x)*f(y)という形を持っている』という仮定がある。

f(x+y)=f(x)*f(y)は物理現象として真ですか?
2022/10/07(金) 20:36:15.84ID:pQf1N7Z90
>>581
wikiは当てにならない
2022/10/07(金) 20:41:05.26ID:4hVmjE6Y0
>>582では581の本文を変えましょう

第一原理とは自然科学の物理法則の根本となる仮定の部分。その仮定を真としたとき、その仮定から演繹された現象は全て真である。

例えばギブスエネルギーであれば、『状態和を表す物理量はf(x+y)=f(x)*f(y)という形を持っている』という仮定がある。

>>580もう一度問いますが
f(x+y)=f(x)*f(y)は物理現象として真ですか?
2022/10/07(金) 20:48:48.81ID:pQf1N7Z90
>>578
ところで何で第一原理を持ち出したんだ?
2022/10/07(金) 20:52:44.07ID:pQf1N7Z90
>>583
物理で第一原理と言えば
物質の多体のシュレディンガー方程式を近似によらずなるべくそのまま解くこと
だが
2022/10/07(金) 21:01:26.86ID:pQf1N7Z90
忖度して言うと
量子コンピュータで解く問題に対して、それを量子力学の多体問題として翻訳して、それをそのままで解くこと
てな感じかな、知らんけどw
2022/10/07(金) 21:20:01.01ID:4hVmjE6Y0
ん?なんかwiki避けたら変な方向に行ってるな。
違いますよ。量子の問題とは関係なく『第一原理』という言葉は>>583の意味を指します。シュレディンガー方程式の多体問題を解くシミュレーションは『第一原理バンド計算』と正式には分類されます。

ここで第一原理を取り上げたのは
量子Aの原理が第一原理を無視った原理であるためです。

まーたく解の保証はないのに日本の企業お馬鹿さんたちは、量子Aの簡便なモデルに取り憑かれ無駄なお金を投資してるというわけです。
2022/10/07(金) 21:25:58.28ID:pQf1N7Z90
馬鹿の壁 終了
2022/10/07(金) 21:33:19.40ID:pQf1N7Z90
言い換えるとからかっただけ
2022/10/07(金) 22:08:12.31ID:pQf1N7Z90
多体のスピン系の話
2022/10/07(金) 22:26:26.31ID:pQf1N7Z90
平均場近似以上の解を求めるということか、ニールセンも第10版だしね
2022/10/07(金) 23:18:56.62ID:pQf1N7Z90
計算機の世界、悪貨が良貨を駆逐する、シリコンが生き残る、分からないw
2022/10/08(土) 06:18:14.25ID:jOLU688EH
馬鹿が連投してただの糞スレになったな
2022/10/08(土) 10:25:26.36ID:KaiIk1Xk0
ゲート型はプログラムごとに論路回路を作るw
2022/10/08(土) 12:11:48.47ID:KaiIk1Xk0
俺は、続きは量子力学スレで、と言ったんだがw
2022/10/08(土) 12:35:36.92ID:yyZ+BMrv0
midjourneyを素人にどう説明すりゃいいの?
597デフォルトの名無しさん (スッップ Sd5a-yl7y [49.98.147.147])
垢版 |
2022/10/08(土) 22:17:10.03ID:i7TXyGNRd
役に立つことあるかなと思って2年ぐらいこのスレ見てたけど皆無でしたw
2022/10/08(土) 22:24:20.46ID:KaiIk1Xk0
お前の書き込みもなw
599デフォルトの名無しさん (ワッチョイ 2e10-XciQ [153.243.53.4])
垢版 |
2022/10/09(日) 01:01:56.06ID:9ImDgsuy0
ここに書き込むのなんか全員サワリだけのワナビーでしよ
2022/10/09(日) 07:12:28.80ID:us0laBSc0
チラシの落書きに何を期待する、という見方
何をしたいのか分からないのか、という見方
・・・
2022/10/09(日) 12:16:08.76ID:tY6KZ2lI0
synthesizer vてなんであんなに品質高いの?
2022/10/10(月) 09:19:08.37ID:lW2nTNyC0
一ヶ月もかけて書いた独自アルゴリズムがちゃんと動作するか気になって
どうしても実行中のkaggleのカーネルから目が離せない
すごく無駄な時間なのに目が離せない
2022/10/10(月) 09:20:35.35ID:lW2nTNyC0
マジでどうすればいいんだろう
みんな、実行時間が2時間を超える処理の実行結果が気になって
別の作業が手につかない時にどうやって頭を切り替えてる?
2022/10/10(月) 10:40:31.99ID:C9XaDRaS0
熱いコーヒーを飲む
2022/10/10(月) 11:58:30.96ID:7gBnEc2D0
寝る
2022/10/12(水) 07:25:28.61ID:SmnzTN2xH
Windows Updateが動くたびにVSCodeのウインドウが落ちる
2022/10/12(水) 15:28:46.53ID:jC6qXKwq
>>603
いったんオナニーでスッキリ
2022/10/17(月) 00:39:50.36ID:EIHjNblk0
外付けGPUではゲームは出来るが深層学習は出来ない、って聞いていたし信じ込んでいたのだが、

今ちょっと調べたら成功している例がちらほらというか
勝間和代氏が成功してるんじゃないのw
もちろんスピードは落ちるけど
2022/10/17(月) 10:14:42.05ID:DIX4RQTnM
あの人でもできるんだヘー
2022/10/19(水) 02:58:02.81ID:JPvx4Nee
画像認識の練習として、4文字のひらがな画像認証キャプチャー突破に挑戦してみたのですがあっさりほぼ100%認証できました
ですが・・
ノイズのかかったキャプチャーに挑戦してみたところ急に段違いの難易度になりました
こういうのです
https://i.imgur.com/YJHh9ul.jpg
さすがにこういう、ノイズも文字の一部に見えないこともない、みたいなやつだと難しいですよね?
何か良いアイデアはありますでしょうか
練習で足止めされるのも嫌なのでもう諦めて次行こうかなとも思ってます
2022/10/19(水) 08:09:01.36ID:dksue1xmH
学習データ増やすしかないんじゃないの
2022/10/19(水) 09:12:00.69ID:TYSgUbxaM
それを感があるのが楽しいと思うんだけど😅
2022/10/19(水) 10:40:03.06ID:JPvx4Nee
一応やったのは
・正解データに近い”ノイズ+4文字ひらがな”キャプチャを生成する
・50px×50pxで一文字ずつ分割
みたいなのを1万枚(×4)くらいです

思ってた以上に、前処理で手こずりました・・
ざっくり直面した問題は
・一文字をしきい値で座標で区切ると、隣の文字が微妙にかぶる
・キーとノイズのしきい値が区別できないのでノイズがキレイに取り切れない(たとえば、”は”のバックに取り切れなかったヨコ線ノイズがあると”ほ”に見える)
たぶんこの部分をクリアできたら行けそうな気がします
やれることを考えると
・ある程度は「一文字がどの座標から始まるか」「一文字の間隔」に規則性があるので
 ざっくり一文字を区切り、4隅の独立したノイズを文字ごと消す
・”は”や”ほ”、”に”や”た”など、ノイズにより二面性三面性を現すキーを洗い出す
・一文字ずつの特徴量を算出する
くらいかなと画策してます
あとは上とは別のアプローチで、そもそもペアデータレスな拡散モデルでどうにかできるか考えています
2022/10/19(水) 21:44:59.22ID:KdBl77waH
機械学習じゃなくて、もはやアルゴだな
2022/10/20(木) 00:24:26.37ID:7Dzkrm7g0
人為的になんとかしようと考えた時点で‥完
2022/10/20(木) 01:14:15.50ID:y3K9DSVg
深層強化学習だとエサを与えるわけですが
それって人為的ぽくないすか?
2022/10/20(木) 01:25:07.01ID:7Dzkrm7g0
人の性質として先々の限界が見えてしまう‥‥
2022/10/20(木) 01:29:11.00ID:10va8QHp
うーん・・チューリングテスト不合格
2022/10/20(木) 09:23:06.15ID:vWHP35QB0
在イランアメリカ大使館人質事件か
620デフォルトの名無しさん (ワッチョイ 9fea-2yG4 [61.211.15.194])
垢版 |
2022/10/20(木) 15:32:04.75ID:nCDkhQbq0
前処理で特定のパターン排除の意図的な処理を加えるとバイアスが生じる
それで処理が通ったとしてもそれで処理可能なのは、ある特定のパターンの画像のみとなるからね
これをやると特定のパターンごとのルールが必要な80年代のルールベースのエキスパートシステムみたいになる。
2022/10/20(木) 17:08:08.32ID:y3K9DSVg
4文字ひらかなキャプチャの例でいくと
強化学習の過程で、正解のご褒美与えるタイミングのルールってほぼ無し?
50音×50×50×50の確率で正解
だけだとめちゃくちゃ時間掛かりそうな気がする
「画像のこの部分から探してね」「薄かったり途切れすぎなやつは文字じゃないぞ」
みたいなヒントを与えるのも強化学習的には好ましくないってことかな

まずは、先頭の文字っぽい場所だけ当てたら褒めて学習終了
つぎのステップは、先頭の文字をドンピシャで当てたら褒めて学習終了
ってやれば少なくとも先頭の文字は行けそうだけど
これも作為的だよね
2番目、3番目であろうがどこから当てても、当てたら褒めてエサを与えて
ヒントは与えずひたすら見守る
だと思うけどめっちゃ時間かかりそう・・
2022/10/20(木) 17:47:27.46ID:C0rWwrYjH
機械学習とは、強化学習とは、いったい何なのかをよく考えたほうがいい
2022/10/20(木) 18:07:00.04ID:vWHP35QB0
何なの?
2022/10/20(木) 18:31:34.54ID:dmMoNXzSH
睡眠学習ってのもあったな
2022/10/20(木) 20:24:21.79ID:eJ25/7hpr
>>610
興味があるのですが、このCaptchaはどのライブラリですか?
2022/10/21(金) 07:36:36.52ID:lm/rriCTM
機械じゃなくて貴方が学習するのよ
2022/10/21(金) 09:35:08.54ID:3/vGG0lo0
学習には十分な睡眠が必要
2022/10/21(金) 10:35:18.11ID:Tw/sZfwtH
あんまりあれこれ親が手出しすると、子供は学習する気なくなるよな
2022/10/21(金) 11:44:14.98ID:Tq12a2Z+d
>>621
>>617
2022/10/21(金) 16:17:05.29ID:8wxWObRUa
お30GBになったの
2022/10/21(金) 20:11:23.21ID:ntxXNdDt0
>>614
俺だったら四文字を通常生成したとき
背景の色を各文字ごとに大きく変化させて
それから文字の歪みとかを加える

そしたら文字の背景色を教師データとして
各文字の範囲を特定させるのを学習させる
2022/10/21(金) 22:19:21.05ID:3/vGG0lo0
おま〇こ
2022/10/22(土) 19:38:12.00ID:fXIBwKIld
「AIが人間をロックし正確に狙う機関銃...」イスラエルが開発、パレスチナ難民キャンプに配備した [朝一から閉店までφ★]
https://asahi.5ch.net/test/read.cgi/newsplus/1666433077/
634デフォルトの名無しさん (ワッチョイ ab30-w3aL [121.103.189.61])
垢版 |
2022/10/23(日) 00:05:16.12ID:WBpEkeHj0
特定の人はゴリラと間違われて認識しないパターンありそうだな
マイナス面もあればプラス面もある
635デフォルトの名無しさん (ワッチョイ ad97-/6zz [182.171.246.142])
垢版 |
2022/10/23(日) 04:19:53.48ID:5croyCwd0
>>621
割と提案の方法でいいと思うけどな。強化学習って子供育てるみたいなもんだから
2022/10/23(日) 09:10:37.36ID:ft8JtfId0
アメとムチw
2022/10/23(日) 09:24:59.91ID:Aq7REWh9H
強化学習の意味が違うような
2022/10/23(日) 11:28:53.26ID:X/EM3gMwd
強化合宿w
2022/10/23(日) 11:36:46.70ID:ft8JtfId0
コロラドで毎日50km走だ
2022/10/23(日) 17:21:04.79ID:JkSgqX5w0
まあダメ出しばっか、褒めてばっかじゃどうしてうまくいかないかは説明できるところはあるわなw
2022/10/24(月) 10:23:38.71ID:DN1lvpUcM
洗濯物畳みマシーンがここまできたぞ😅
https://www.popsci.com/technology/laundry-folding-robot/
2022/10/24(月) 11:01:28.85ID:eEV/ea+o0
俺は適当に折ってから丸めて筒状にしてる。収納するのが楽。
643デフォルトの名無しさん (ワッチョイ 2d33-8A0V [118.241.154.101])
垢版 |
2022/10/25(火) 16:40:59.86ID:zPIzEYg30
オセロの強化学習をしてるんだけど、
自己対戦をしているときに突然グラボのファンが回りだすことがしばしばある
チェックしてみるとグラボが認識されなくなっていて、仕方なく再起動するはめに
原因わかる人いる?
2022/10/25(火) 17:37:44.95ID:u2q/3a270
松島の呪い
2022/10/25(火) 18:53:24.86ID:iXSi4M2k0
熱暴走
2022/10/26(水) 11:03:05.86ID:yIZhftHRd
熱ですね。グラボの使用率要確認。
100%いってたら負荷が限界。
2022/10/26(水) 11:25:46.80ID:TaIxnEJu0
まさか熱暴走がわからない奴は今時いないだろ
648デフォルトの名無しさん (ワッチョイ 432d-3sNL [133.218.31.229])
垢版 |
2022/10/26(水) 11:40:12.75ID:NPv1EL700
競馬予想に機械学習を用いているのだが
競馬サイトから38万件のデータを取得
18項目の特徴量を抽出してデータクレンジングを行った
ターゲットとなる順位(1-3位を0、それ以外は1)、過去3走のスピード指数(西田式)、斤量、騎手名(ダミー変数化)、過去3走の平均順位、過去の総賞金額
距離、芝/ダ、馬場、性別、馬齢、馬体重、体重増減など
k近傍法で機械学習させたら
正答率57%になった
1/2はランダムで50%だから当てずっぽうにやった場合より7%程度精度が上がってる計算
だが、そこらの競馬好きのおっさんでもこれぐらいは当てれそう
スクレイピングして大量データを機械学習に掛けましたってだけではそんなに精度上がらんのね
ある程度まとまった量のデータがあるならディープラーニング等で教師なし学習した方がいいんかな
それから一括でfitさせるよりはループ処理を用いてレースごとにfitさせた方がいい気がするんだが
モデルによりfitが初期化されたりされなかったりするらしいので仕様を知っておく必要がある
2022/10/26(水) 11:42:54.30ID:TaIxnEJu0
儲かるのか?
2022/10/26(水) 15:29:50.89ID:/Jbhrlo+a
>>648
lightgbm使ってみたら?
テーブルデータはみんなこれ使ってるよ
2022/10/26(水) 17:55:15.84ID:D5ZEh2Zc0
そもそも熱暴走する前にファンが回るべきだからなんかおかしいな
挿し直しやドライバの再インストールするとか
652デフォルトの名無しさん (ワッチョイ e3ea-SeMD [61.211.15.194])
垢版 |
2022/10/27(木) 03:00:12.83ID:DiyEvfZj0
>>649
正答率57%だと理論上は7%分が利益になるじゃない
余談だが、昔読んだ統計学の本で、競馬予想の確率について解説している章があった
その中で大橋巨泉の何十年分の勝ち負けの賞金配分率の結果が紹介されていて
大橋の場合、配分率は80%だったと書いていた。
配分率が80%ということは、100円を賭けた結果のリターンが 80円で
20円の損失を出しいるこということで、勝率に換算すると40%とかそういう値になる。
これはつまり、当時の競馬予想界のトップに居た予想屋でも勝率50%を超えることは
難しいということを示している。
競馬の世界ではその後、2000年台に入ってから株式市場でのインデックスファンド
と似た方式で株券を購入する一種の必勝法が考案され、この結果、年間、数十億円
規模の利益を上げる投資家が出現し、競馬の配当金の課税方式をめぐって国税と投資家の
間で複数の裁判が最高裁まで争われる事態に陥った。
機械学習方式に予想を現実世界に応用する実験は、競馬、株式、犯罪防止とかの
領域で試みられてきたが、少なくとも上記の3つの応用例の場合は全て失敗している。
これは予想が現実世界に影響を及ぼすことで現実世界の状況に変化が生じることに起因している。
2022/10/27(木) 07:01:01.20ID:XAvnQ9bx0
>>652
解説ありがとん
654デフォルトの名無しさん (ワッチョイ 432d-3sNL [133.218.31.229])
垢版 |
2022/10/27(木) 07:23:33.38ID:prGfjbqk0
>>652
昨日モデルのパラメーターを色々変えたら正答率75%に大幅改善された
更にグリッドサーチにかけて様々なモデル、パラメーターを
試行し、血統データを入れたりデータの変更などの微調整を加えれば80%超えれそう
それぐらいならリターン100%超えるんじゃないか
2022/10/27(木) 12:36:27.23ID:QKN3w3aX0
故障
2022/10/27(木) 18:49:07.98ID:4BeoNyhQ0
短期での勝率云々言われましても‥‥‥‥
2022/10/27(木) 18:59:22.28ID:QKN3w3aX0
確実に儲かる、という方法を売りつけるほうが儲かる
2022/10/27(木) 19:04:35.80ID:4BeoNyhQ0
競馬なんて不確定要素多すぎて機械学習やろうとも思わんわ。ダビスタでやってろ
2022/10/27(木) 20:01:10.64ID:FHDslQSTd
馬は気分次第だからなぁ
2022/10/28(金) 13:03:45.27ID:Ydc6iWTC0
RTX3000番台はその発売後に3ヶ月かけてようやくpytorchが
6ヶ月かけてやっとtensorflowが対応した、と思っていたのだが
(今から記事を見直すともっと早く(10月末)出来ていたようなのだが、少なくとも2020年後半一杯は
RTX3080でtensorflowが動きましたという記事は無かったような)、

今回はもうpytorchもtensorflow両方とも発売直後からバシバシ動いて
4090は3090の1.3~1.6倍つまり最大でtensorコア数に比例する程度速いですという
当たり前の結果を叩きだしているんだなあ

だが2080tiとのコア数比だとあんまり大したことは無いんだっけ
LHRのせいか
2022/10/28(金) 16:00:20.73ID:u3gCatVy0
回収率も分かってなさそうw
662デフォルトの名無しさん (ワッチョイ e3ea-AKjw [61.211.15.194])
垢版 |
2022/10/28(金) 16:38:46.69ID:Q3Joycmh0
>>660
4000系と3000系の違いはDPX InstructionsとかDistributed Shared Memoryがサポートされてるかどうか、
それ以外は互換性がある。
おそらく、現行のpytorchは、上記のCUDA Compute Capability 9.0の機能はサポートしておらず
3000系のCUDA CC 8.xの機能セットの範囲で動いている。
この状態では、4000系のアドバンテージは、CUDAコアの数と搭載メモリのアクセス速度と容量の増大分くらいしか見込めない。
3080が登場した際にCUDAの互換性がなくなったのはCUDA sm_86の互換性が3000台に上がった際に仕様変更されたことが原因。
あとLHRの有無は機械学習には影響を及ぼさない(微妙に1コア分の処理負荷くらいは消費するかもしれないが)
2022/10/28(金) 19:49:56.57ID:hVn7ndsYH
ぶっちゃけ速度倍になっても2か月が1か月になるだけなんだよなあ
もっと指数関数的に速度が上がるブレイクスルーが来てほしい
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況