X



【統計分析】機械学習・データマイニング32
■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん (ワッチョイ db10-OtAY [114.163.141.1])
垢版 |
2022/08/01(月) 01:56:45.77ID:0yKqFwG20
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
【統計分析】機械学習・データマイニング31
https://mevius.5ch.net/test/read.cgi/tech/1632587566/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
0102デフォルトの名無しさん (ワッチョイ 6f5f-rSKY [14.10.48.193])
垢版 |
2022/08/08(月) 22:02:39.62ID:falD34gU0
多分テクニカル分析に毛が生えたようなことやってるんだろうけどその手の分析の元データにチャートの画像を使う意味はないんだよなあ
数値でやればいいものをわざわざ画像を間に挟むことでデータサイズを増やしつつ入力を不正確にするという精度悪化へのダブルパンチ
0107デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.242.244.200])
垢版 |
2022/08/08(月) 23:41:26.29ID:sf8DoyKQ0
オカルトには詳しくありませんが、難しそうですね。
0108デフォルトの名無しさん (ワッチョイ 4610-b4mn [153.243.53.4])
垢版 |
2022/08/08(月) 23:42:18.95ID:wsYAfPSE0
画像的にチャートが似ていることって株的には意味あるんかね?
0113デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.186.149.180])
垢版 |
2022/08/09(火) 12:55:46.19ID:YYV2tzWRp
必死になってて悔しいんかな
0114デフォルトの名無しさん (ワッチョイ e363-qs2z [120.74.28.249])
垢版 |
2022/08/09(火) 13:35:49.58ID:LsVAgLyo0
画像だってただの数値データだし
処理しやすくするために色々な軸とって画像データにするのもいいんじゃないの?
0125デフォルトの名無しさん (ワッチョイ 97fb-Vyf3 [92.203.11.83])
垢版 |
2022/08/09(火) 17:05:06.48ID:Mm+QGPzv0
>>123
値動きの数値データからは見えない範囲の空白部分が解釈や影響を与える可能性はありそうですね。

同じ事象の学習データでも数値データとグラフ画像を使うのでは生成されるモデルは何かしらの相違点が生じるでしょうし。
0126デフォルトの名無しさん (アウアウウー Sadb-RDsG [106.146.98.113])
垢版 |
2022/08/09(火) 17:42:36.24ID:O7AMnKRha
グラフの空白部分には何もプロットされていないんだから情報量ゼロなのに画像を元にした機械学習モデルには入力せざるを得ないだけ
仮に空白部分の影響で意味ありげな結果が出たとしてそんなものをありがたがるのはオカルト
0127デフォルトの名無しさん (ワッチョイ 97fb-Vyf3 [92.203.11.83])
垢版 |
2022/08/09(火) 18:47:32.42ID:Mm+QGPzv0
>>126
空白部分の情報がゼロであるというのが典型的な思い込みですね。

例えばグラフで分断された上下の空白の面積ですとか、複数グラフの交点が描く領域の形状などは数値データからも理論上は算出できますが、モデルが特徴量として発見し獲得する難易度やコストは大きく変わるでしょうね。
0128デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.186.144.152])
垢版 |
2022/08/09(火) 18:58:35.24ID:MQUta3vIp
必死になってて草
しかし残念ながらポロリはするつもりないからまあ精々生産性のない罵詈雑言に精を出してくれ
今はまだ月次3桁万円のA級雑魚botterだけど今年中に必ず俺はS級botterになる
0129デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.186.144.152])
垢版 |
2022/08/09(火) 19:01:42.84ID:MQUta3vIp
S級botter達成したらいよいよゲームプレイヤー系botに着手する
特にまだ競争が少ないブルーオーシャン、シューター系botや
BCGのTCGbotは既に作ってて稼働させてるけど小遣い程度のトークンは稼いでくれてるから割と美味い
0130デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.242.244.200])
垢版 |
2022/08/09(火) 19:03:12.18ID:oM0lzHLp0
月数百万儲かってるのか。
凄いな。
働くより儲かるじゃん。
0131デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.186.144.152])
垢版 |
2022/08/09(火) 19:11:10.07ID:MQUta3vIp
>>130
結果だけ見ればそうだけどここに辿り着くまでに割と血を吐く思いはしてきた
稼げるモデルを作り上げるまでは種銭少数で実験してきてるから損失は微々たるものやけど、お金以上に精神を削れた感はある
だからこの結実は本当に嬉しくてしょうがない
0132デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.186.144.152])
垢版 |
2022/08/09(火) 19:14:02.22ID:MQUta3vIp
>>127
わいの着眼点とは違うけど、あなたはあなたで結構センスありそうな気がする
もし気が向いたら参戦をオヌヌメします結構知的で面白い世界が広がってますよ
Twitter見れば分かるけど日本だけでも強強な人が沢山いますし刺激的です
0133デフォルトの名無しさん (JP 0Hde-sDOb [91.234.192.10])
垢版 |
2022/08/09(火) 19:17:39.53ID:J+rqBnXnH
別に自分に害があるわけじゃないんだから、そうやりたいという人のやることを否定することはないでしょう
たとえ愚かなことをやっていても、それで本人が満足しているのなら、誰かが迷惑してるわけでもないんだし、別にいいでしょう
今回のケースが愚かだという話ではなくて、たとえそうであってもという話
0136デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.242.244.200])
垢版 |
2022/08/09(火) 19:40:18.11ID:oM0lzHLp0
ホタテのジョナサン。
0137デフォルトの名無しさん (ワッチョイ 97fb-Vyf3 [92.203.11.83])
垢版 |
2022/08/09(火) 19:53:01.67ID:Mm+QGPzv0
>>134
問題点は個々の計算可能性ではなく、アルゴリズムが有限のコストで特徴を獲得できるかどうかですね。

他の人も言及してますが、画像形式で与えることである種の前処理を行なっていると捉えることができ、同じ学習コストを掛けた場合の到達点は明らかに異なりますし。

投資自体が多数のプレイヤーの意思決定に依る動的なゲームと考えると、大多数のプレイヤーが参照している情報形式を前処理として取り込むというのは至極まっとうなアプローチでもありますね。
0139デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.242.244.200])
垢版 |
2022/08/09(火) 19:58:13.62ID:oM0lzHLp0
条件付き確率場ってことですかね。
0140デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.186.144.152])
垢版 |
2022/08/09(火) 20:31:42.77ID:MQUta3vIp
やっぱこの人ID:Mm+QGPzv0 センスあるわ
0142デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.242.244.200])
垢版 |
2022/08/09(火) 20:39:04.71ID:oM0lzHLp0
アルアルネーヨの代表例。
0143デフォルトの名無しさん (スップ Sde2-uuKZ [1.66.103.238])
垢版 |
2022/08/09(火) 20:44:32.50ID:PVBWKCRgd
>>134
何回言わせんだよw
それができないから画像でやってるんだっての
で、分かってないやつはそこまで。それでもまあ儲かる
俺ら的にはその先が重要なんだが、値動きでの判断とそれを画像にしたときとを比較して画像のほうが効率が悪いってのは値動き解析と同じ判断をさせるときの話であって、間違っちゃいない。当たり前だな
で、別に同じ判断をする必要は無くて、何を判断させるかで競い合ってるってのが現状というか趨勢は固まってきてる
0144デフォルトの名無しさん (ワッチョイ 4610-b4mn [153.243.53.4])
垢版 |
2022/08/09(火) 21:09:49.94ID:uAlRq9u+0
>>127
実際に、空白には、どんな重要な情報があるの?
空白部分の情報が、役立った証拠は?
0145デフォルトの名無しさん (アウアウウー Sadb-RDsG [106.146.98.172])
垢版 |
2022/08/09(火) 21:37:04.34ID:mk8N7Kg2a
数値データでできないのにグラフ化すればできるという発想が微笑ましい
どちらも情報量は同じなんだからやれることは変わらない
パターン認識というワードに引っ張られすぎて「パターン=画像」と思い込んじゃったんだろう
0146デフォルトの名無しさん (テテンテンテン MM62-8q3l [193.119.168.87])
垢版 |
2022/08/09(火) 21:42:29.01ID:BjJ0mcGdM
時系列データあんま詳しくないんだけど
例えば株取引で窓開けみたいな動きが起きたときに時系列データだけだと分析出来ないけど画像にしたら視覚的情報として分析出来るみたいなことってあるの?
0147デフォルトの名無しさん (ワッチョイ 97fb-Vyf3 [92.203.11.83])
垢版 |
2022/08/09(火) 22:19:24.38ID:Mm+QGPzv0
>>144
グラフ本体と空白部分に重要度の差があるという前提を一度捨てたほうが良いですね。

例えば空白部分だけ取り出したとしてもその輪郭から元のグラフの線は復元できますよね?
当然逆もまた然りで、グラフ本体と空白は等価の情報を持つ場合もあるわけです。
これはチャート画像とグラフの値データにも言えることです。

互いに変換できる情報が存在するとき、目的とする情報を取り出すのに変換を挟むのは当然コストがかかります。

機械学習においてはこのような変換を学習で見つけるのは非常にコストが高く付きますので、これを大幅に軽減する意味でもデータの選択や前処理を行っているわけです。

極端な話、グラフの数値データからの変換で理論上は取り出せても学習ではまず到達しえない次元の特徴量を、チャート画像からならば容易に取り出せる可能性があるという話です。
0148デフォルトの名無しさん (ワッチョイ 4610-b4mn [153.243.53.4])
垢版 |
2022/08/09(火) 22:33:25.01ID:uAlRq9u+0
それあなたの感想ですよね(画像略
情報が等価なのなら、やっぱり空白いらないよね
自分で結論出してるじゃん
0149デフォルトの名無しさん (ワッチョイ 4610-b4mn [153.243.53.4])
垢版 |
2022/08/09(火) 22:40:25.76ID:uAlRq9u+0
それに、もう一つ。
チャート画像には有効な特徴量が含まれるという前提を一度捨てたほうが良いですね。
今迄のあなたのレスを読んでも、何故、画像を経由すると、良い特徴量が得られるのかという問いに、答えられていない。
0151デフォルトの名無しさん (ワッチョイ 6f5f-rSKY [14.10.48.193])
垢版 |
2022/08/09(火) 23:12:11.66ID:j2Nmj4om0
人間にとって数字の羅列よりグラフの方が先が予測しやすそうに見える→コンピューターにもグラフを与えた方が予測しやすい、
みたいな素人がやりがちな典型的な間違いを犯してるんだと思う
機械学習とかやる前にコンピューターの仕組みとかコンピュータサイエンスの基礎とか統計学とかを復習した方がいいのでは?
0153デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.242.244.200])
垢版 |
2022/08/09(火) 23:50:35.22ID:oM0lzHLp0
蟹工船の題材になった船はマルハニチロの博愛丸なんですよ。
政府と組んで悪いことをすれば儲かるってことです。
0155デフォルトの名無しさん (ワッチョイ 4614-woMg [153.183.137.102])
垢版 |
2022/08/10(水) 07:26:11.98ID:QaOKdagF0
そもそも株価ってのは人間の心理が多分に影響している
投資家がチャートを見ながらやってるから数値データではなくチャートを読み込ませることに意味がある可能性はある
0165デフォルトの名無しさん (アウアウウー Sadb-jVOG [106.154.140.131])
垢版 |
2022/08/10(水) 20:57:34.93ID:0BTzxlAHa
RNNの時刻t-1での出力の勾配って時刻tでのΔとVの行列積で求まるんですよね、それは分かります。
一方RNNの誤差関数は各時刻の総和であり、時刻t-1の出力勾配って時刻t-1の誤差関数の偏微分からも求まるけれどこれを使えないのは何故でしょうか?
0167デフォルトの名無しさん (ササクッテロロ Spff-4kWG [126.253.34.205])
垢版 |
2022/08/11(木) 10:03:01.71ID:NJ/u2UQPp
アップルが文章や画像から3次元シーンの映像を生成する技術を発表
https://www.moguravr.com/apple-gaudi/
3Dも来たか
0169デフォルトの名無しさん (ササクッテロロ Spff-4kWG [126.253.34.205])
垢版 |
2022/08/11(木) 11:11:34.12ID:NJ/u2UQPp
サイバーセキュリティ周りは詳しくないから知らんけどそのための電子透かし?やタイムスタンプなのでは?
いや本当に適当に言葉並べただけだけど簡単に偽造できない様な仕組みがあったはずよね
0172デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.182.227.237])
垢版 |
2022/08/11(木) 11:42:41.65ID:zQ9v+5Zdp
さすがにメタ情報改竄は犯罪だからそういったAIサービスは提供出来ないと思う
今でもエロやロリやグロは規制されてるし、改竄はクラック技術だからまた別の話かと
犯罪者がクラックにAIを使うことはあるだろうけど
0175デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.182.231.205])
垢版 |
2022/08/11(木) 13:10:33.53ID:FCkLejbep
>>174
基本的にクラックは突破するためだから、その後の検証レベルでは専門家が普通に立証するのでは
そのための仕組みだし突破するってことは必ず痕跡を残すことにもなるわけで、何なら検証する側もAIを導入してるわけでさ
0176デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.53.55.77])
垢版 |
2022/08/11(木) 17:27:57.99ID:ZCQSRwpp0
>>174
総裁の指示で警察が嵌めるほうがありそうじゃない?
そして、日本国総裁に命令してるのが、統一教会の七精霊ってことも。
0180デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.157.177.129])
垢版 |
2022/08/11(木) 20:00:58.98ID:J5VceLwtp
NVIDIA Japan @NVIDIAJapan (2022/08/11 09:27:01)
つい先程 #SIGGRAPH2022 にて、本物そっくりのバーチャル アシスタントやデジタル ヒューマンを容易に作成し、カスタマイズできるようにするためのクラウドネイティブな AI モデルとサービスを統合した「NVIDIA Omniverse Avatar Cloud Engine (ACE)」を発表しました。https://nvda.ws/3QD29zc
https://ohayua.cyou/twimg/FZ1vxt0XkAEdz3o.jpg
https://ohayua.cyou/tweet/1557523950166491136/NVIDIAJapan
0183デフォルトの名無しさん (ササクッテロラ Spff-4kWG [126.157.183.121])
垢版 |
2022/08/11(木) 21:11:36.64ID:9Qna9vcmp
森羅万象を生成し得る可能性を持ったAIエンジニアこそが真のクリエイターなのかもな
少なくとも森羅万象を創造できるクリエイターはクリエイティブ連鎖の頂点であることは間違いない
0185デフォルトの名無しさん (ワッチョイ ff01-9Xv3 [126.53.55.77])
垢版 |
2022/08/12(金) 01:20:48.60ID:ijOecH2p0
>>184
すべて理解したうえで投資詐欺のためにAIの凄さを吹聴してる人も多いのでは?
0189デフォルトの名無しさん (アウアウウー Sadb-RDsG [106.146.63.119])
垢版 |
2022/08/12(金) 09:51:14.25ID:mLU3tc+pa
ニューラルネットなんて大昔から理論は大して変わっていないしコンピューターのスペック不足がボトルネックというのはその頃から周知の事実でしょ
ニューラルネットの数式が理解できていれば大量の計算資源さえ投入すればどうにかなるのは容易に予測できる
0190デフォルトの名無しさん (ワッチョイ 42f5-qs2z [131.213.244.210])
垢版 |
2022/08/12(金) 10:35:39.27ID:WjSgPDXu0
一部の分野ではもうデータ量とそれを処理可能なハードウェアの勝負になりつつあるしな
0191デフォルトの名無しさん (ワッチョイ 4610-b4mn [153.243.53.4])
垢版 |
2022/08/12(金) 11:05:28.44ID:V16IFZ6j0
勾配消失や誤差逆伝播法の開発を知らんのか?
マシンパワーだけの問題じゃないぞ
0193デフォルトの名無しさん (ワントンキン MM3e-RtKi [211.17.85.98])
垢版 |
2022/08/12(金) 13:07:43.53ID:7m/dg8fEM
>>191
そういうこと
ニワカが大杉
0196デフォルトの名無しさん (オッペケ Srff-b4mn [126.253.253.85])
垢版 |
2022/08/12(金) 14:12:00.53ID:AKRIAlbQr
>>194
じゃあ何か替わりに挙げてみてよ
0197デフォルトの名無しさん (ワッチョイ 42f5-qs2z [131.213.244.210])
垢版 |
2022/08/12(金) 15:59:21.64ID:WjSgPDXu0
今ではデータ数が数十億枚とかだろ?
データ収集もこの規模の学習ができるハードも普通の企業じゃ用意できん
0199デフォルトの名無しさん (ワッチョイ ab01-eSj3 [126.59.199.91])
垢版 |
2022/08/13(土) 02:33:02.29ID:UZg55zLH0
複数の音が混ざってるmp3ファイルがあって、時間指定をしてその間にだけ含まれる成分を抽出するAIを作りたいです
時間指定は手動でできるとして、どんなネットワークみたいなものを使えばいいでしょうか?
ざっくりとした手順でいいのでやり方の方針を教えてください
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況