!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。
機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです。
■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
【統計分析】機械学習・データマイニング30
https://mevius.5ch.net/test/read.cgi/tech/1609459855/
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
探検
【統計分析】機械学習・データマイニング31
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん (ワッチョイ 7b10-4VFp [114.163.141.1])
2021/09/26(日) 01:32:46.82ID:fnXwjiVa0463デフォルトの名無しさん (ワッチョイ df6e-ub6K [138.64.70.222])
2022/03/29(火) 01:28:15.27ID:omLa31ht0 optunaって、同じパラメータを重複して試行することあるよね?
仕様なの?
仕様なの?
464デフォルトの名無しさん (ワッチョイ 1a63-fe9w [221.189.97.225])
2022/04/02(土) 06:29:57.41ID:SlF55qRa0 当方超絶初心者なのですが質問をお許しください。
やりたいことは、5小節分のベートーヴェンの楽譜をデータセットとして、
学習後諸パラメータからベートーヴェンの曲のある瞬間の音を推論するというもの
その際、まずは手作業で一小節づつ手作業でデータセットを作り、
また目標値を単純にある音の次の音、ということにしました。
つまり一つの音に音高・音価・音量等があるのですが、それが四声同時に鳴るので、
3×4×(記録する音との数)という3次元配列なのですが、目標値もまた3次元配列です。
このとき、from chainer import Sequentialして
入力変数を12、出力変数と12として、
目的関数を適切に選べばやりたいことができるでしょうか(最終的にはライブで、自分の演奏を一定期間学習させてリアルタイムに学習済みモデルを作り、こちらの入力に対し推論値をOSCで演奏システムの方に送ってパラメータを設定させる、ということを考えています)
またその際の目的関数として何が適切なのかも教えて頂けると幸いです。
やりたいことは、5小節分のベートーヴェンの楽譜をデータセットとして、
学習後諸パラメータからベートーヴェンの曲のある瞬間の音を推論するというもの
その際、まずは手作業で一小節づつ手作業でデータセットを作り、
また目標値を単純にある音の次の音、ということにしました。
つまり一つの音に音高・音価・音量等があるのですが、それが四声同時に鳴るので、
3×4×(記録する音との数)という3次元配列なのですが、目標値もまた3次元配列です。
このとき、from chainer import Sequentialして
入力変数を12、出力変数と12として、
目的関数を適切に選べばやりたいことができるでしょうか(最終的にはライブで、自分の演奏を一定期間学習させてリアルタイムに学習済みモデルを作り、こちらの入力に対し推論値をOSCで演奏システムの方に送ってパラメータを設定させる、ということを考えています)
またその際の目的関数として何が適切なのかも教えて頂けると幸いです。
465デフォルトの名無しさん (アウアウウー Sa39-xcJo [106.154.70.111])
2022/04/04(月) 18:40:17.74ID:oFLIZQp1a そういう単純な方法だとだいたいにおいて目的にかなわない推測になるなw
適当にぐぐってそこから論文みつけてreferenceおっかけて方法ぱくるのがいいと思う
https://towardsdatascience.com/generating-music-with-artificial-intelligence-9ce3c9eef806
https://arxiv.org/pdf/1609.03499.pdf
適当にぐぐってそこから論文みつけてreferenceおっかけて方法ぱくるのがいいと思う
https://towardsdatascience.com/generating-music-with-artificial-intelligence-9ce3c9eef806
https://arxiv.org/pdf/1609.03499.pdf
466デフォルトの名無しさん (ワッチョイ 016e-kQLv [138.64.70.222])
2022/04/04(月) 21:41:20.09ID:6BKqFtko0 題材が面白い
467デフォルトの名無しさん (アウアウウー Sa39-9X9d [106.146.13.39])
2022/04/08(金) 11:39:54.46ID:JzsOoP0Ma 家庭用PCで学習できるオススメのレコメンドシステム教えて下さい
468デフォルトの名無しさん (ワッチョイ 7610-7Nbo [153.243.53.4])
2022/04/08(金) 12:41:14.77ID:ViZWtTWj0 協調フィルタリング
469デフォルトの名無しさん (ワッチョイ 5a63-L5s4 [221.189.97.225])
2022/04/09(土) 07:31:19.07ID:RkeIeVAB0 >>465
ご紹介ありがとうございます、リンク先凄いですね・・・
ただ今回は、オーディオを扱うのでなく、あくまで自作ソフトウェアシンセの
各パラメータを学習させて、それを自動演奏させるのが目的なので、
MIDI信号つまり小数の配列で十分なのです。
そこで方策として、
まず教師用データとして、一定時間自分の演奏を記録(各パラメータをPythonに送りそれぞれ一次元配列に格納しておく)
入力用データとして、そのあと同じ時間(つまり同じ長さ分の配列)自分の演奏を記録して、それを入力用データとする
アウトプットをソフトウェアシンセに送り返して、パラメータとして設定
という大まかなものが出来ました。
ところで本当によくわかってないので初歩的な質問を失礼しますが、目標値やラベルが必要だと思うのですが、ここでそれに当たるものは何なのでしょうか・・?
自分のシンセのパラメータは20個くらいを考えています。それらを20個の配列に記録したとして、これを教師用データとしたとして、ある入力(20個のパラメータ)に対してその予測として20個のパラメータを推論してくれれば嬉しいのですが・・・
普通だったら複数のパラメータから、一つの別のパラメータを予測するものですよね。
考え方が混乱しているので、ご指南いただけますと幸いです。
ご紹介ありがとうございます、リンク先凄いですね・・・
ただ今回は、オーディオを扱うのでなく、あくまで自作ソフトウェアシンセの
各パラメータを学習させて、それを自動演奏させるのが目的なので、
MIDI信号つまり小数の配列で十分なのです。
そこで方策として、
まず教師用データとして、一定時間自分の演奏を記録(各パラメータをPythonに送りそれぞれ一次元配列に格納しておく)
入力用データとして、そのあと同じ時間(つまり同じ長さ分の配列)自分の演奏を記録して、それを入力用データとする
アウトプットをソフトウェアシンセに送り返して、パラメータとして設定
という大まかなものが出来ました。
ところで本当によくわかってないので初歩的な質問を失礼しますが、目標値やラベルが必要だと思うのですが、ここでそれに当たるものは何なのでしょうか・・?
自分のシンセのパラメータは20個くらいを考えています。それらを20個の配列に記録したとして、これを教師用データとしたとして、ある入力(20個のパラメータ)に対してその予測として20個のパラメータを推論してくれれば嬉しいのですが・・・
普通だったら複数のパラメータから、一つの別のパラメータを予測するものですよね。
考え方が混乱しているので、ご指南いただけますと幸いです。
470デフォルトの名無しさん (ワントンキン MM8a-wrqy [153.147.208.48])
2022/04/09(土) 11:08:34.82ID:wsR7En4lM 時系列かなと思ったけど
あんまり履歴情報は使わないの?
あんまり履歴情報は使わないの?
471デフォルトの名無しさん (ワッチョイ 5a63-L5s4 [221.189.97.225])
2022/04/09(土) 11:52:07.89ID:RkeIeVAB0 時系列、ということは例えば、データセットとして演奏データを送ったとして、
データ送信終了するときの一番最新のものを、目標値として使う、などということでしょうか。
データ送信終了するときの一番最新のものを、目標値として使う、などということでしょうか。
472デフォルトの名無しさん (アウアウウー Sa47-2Zon [106.154.143.190])
2022/04/09(土) 22:36:41.08ID:ldStXoeua クロスエントロピー誤差の偏微分って出力変数の合計が1になるって制約は考えなくていいのはナゼ(・・?
出力変数がz1とz2の2つならz1について偏微分するときはz2=1-z1としなくていい?
出力変数がz1とz2の2つならz1について偏微分するときはz2=1-z1としなくていい?
473デフォルトの名無しさん (ワッチョイ 4e10-3n4s [153.243.53.4])
2022/04/10(日) 01:24:56.83ID:EKUiWMOD0 偏微分する変数はソフトマックスの前だから合計1の制約はない
474デフォルトの名無しさん (ワッチョイ 1a55-wAOu [59.147.205.222])
2022/04/11(月) 09:22:54.65ID:lzGgtjtn0 新しく出たCLRS著『Introduction to Algorithms 4th Edition』
ですが、機械学習についての章が追加されましたね。
ですが、機械学習についての章が追加されましたね。
475デフォルトの名無しさん (アウアウウー Sa47-wKAC [106.131.60.42])
2022/04/11(月) 16:05:56.30ID:2fSBGaeoa476デフォルトの名無しさん (テテンテンテン MMda-wrqy [193.119.145.236])
2022/04/11(月) 16:12:26.88ID:TQ9uCke7M 機械学習アルゴリズムは四則演算並みに常識化するのかも
477デフォルトの名無しさん (ワッチョイ 03fb-cNdZ [92.203.11.83])
2022/04/11(月) 17:10:35.01ID:qTt+hl+J0478デフォルトの名無しさん (ワッチョイ 0902-rPuy [106.166.50.77])
2022/04/17(日) 17:45:40.20ID:eq30vPTz0 セマンティックセグメンテーションを試そうとcolaboratoryでやろうとして
yolactは本家のデータセットが入ってないから止めた
そもそもyolactではPyTorchは1.4以上お薦めなのにPyTorch本家の指示に従うと1.1になってしまう
それでsemamtic segmentationという名前ので試そうとしたら今度はopenCVのバージョンを4.5でなく4.4に
する必要があった
しかも今度は教師データにアノテーションデータフォルダなしでこれも動かない
ちゃんとデータセット揃ってるのでやり直そう
yolactは本家のデータセットが入ってないから止めた
そもそもyolactではPyTorchは1.4以上お薦めなのにPyTorch本家の指示に従うと1.1になってしまう
それでsemamtic segmentationという名前ので試そうとしたら今度はopenCVのバージョンを4.5でなく4.4に
する必要があった
しかも今度は教師データにアノテーションデータフォルダなしでこれも動かない
ちゃんとデータセット揃ってるのでやり直そう
479デフォルトの名無しさん (ワッチョイ 1375-oxBX [61.120.184.208])
2022/04/17(日) 19:37:04.77ID:JJettxAE0 ここは日記帳じゃな…
480デフォルトの名無しさん (ワッチョイ 496e-/90K [138.64.70.222])
2022/04/17(日) 19:39:58.71ID:26nIbAS60 だってまともな書き込み少ないし
481デフォルトの名無しさん (ワッチョイ 0902-GYWO [106.166.50.77])
2022/04/17(日) 23:46:59.59ID:eq30vPTz0 データセットが揃ってる資料を使ってやってみたら
何とか最後まで行き着いた
しかし
1. PyTorch公式でpipすべきバージョンを調べた後で
わざわざそれと違う1.4をインストールするとか
opencvも4.4にするとか色々変える
2. 一見丁寧に書いてある資料と思わせて
公式のipynbの資料とやっぱり違ってて
そのまま丸写しすると
validdataのフォルダが作られてなかったり穴だらけになる
等などで、
「ここは最初の資料ではこう書いてあるがこうやらないと動かないぞ!!!!!」
と#コメント文が山のようにくっ付いたcolabの資料が完成した次第
しかし、別の時間帯に試したらGPUがK80とかT4とかだったりで
GPUガチャは避けられないからなあ
何とか最後まで行き着いた
しかし
1. PyTorch公式でpipすべきバージョンを調べた後で
わざわざそれと違う1.4をインストールするとか
opencvも4.4にするとか色々変える
2. 一見丁寧に書いてある資料と思わせて
公式のipynbの資料とやっぱり違ってて
そのまま丸写しすると
validdataのフォルダが作られてなかったり穴だらけになる
等などで、
「ここは最初の資料ではこう書いてあるがこうやらないと動かないぞ!!!!!」
と#コメント文が山のようにくっ付いたcolabの資料が完成した次第
しかし、別の時間帯に試したらGPUがK80とかT4とかだったりで
GPUガチャは避けられないからなあ
482ハノン ◆QZaw55cn4c (ワッチョイ 9b66-ZAg2 [183.77.78.72 [上級国民]])
2022/04/18(月) 00:02:15.50ID:fO2jMkbS0 >>29
さてそれはどうでしょうか
実は1月〜3月ほど強度のストレス下にあり、一睡もできない日々が2ヶ月続きました(体力維持のためしっかり食べてビタミン剤で補強しても体重は15kgも減りました)が、じゃあ記憶が全然できなかったかというとそうでもなかったです…
今ではサイコパス呼ばわりされちゃっています、私は結構タフですねえ…
さてそれはどうでしょうか
実は1月〜3月ほど強度のストレス下にあり、一睡もできない日々が2ヶ月続きました(体力維持のためしっかり食べてビタミン剤で補強しても体重は15kgも減りました)が、じゃあ記憶が全然できなかったかというとそうでもなかったです…
今ではサイコパス呼ばわりされちゃっています、私は結構タフですねえ…
483デフォルトの名無しさん (ワッチョイ c95f-xzLX [202.226.219.4])
2022/04/18(月) 01:44:31.01ID:0HwQROji0 本当に2ヶ月(24x60=1440時間)覚醒し続けたならもう死んでる。
つまり、2ヶ月一睡もしなかったというのは妄想。そりゃ精神障害扱いされるわ。
つまり、2ヶ月一睡もしなかったというのは妄想。そりゃ精神障害扱いされるわ。
484デフォルトの名無しさん (テテンテンテン MM73-/90K [193.119.150.87])
2022/04/18(月) 10:27:14.26ID:ldvKvDDSM 今yandexクラウドって日本から契約できるかな?
485デフォルトの名無しさん (ワッチョイ 4fe6-5amf [58.183.206.102])
2022/04/23(土) 00:30:31.12ID:dMbrZ21D0 機械学習メインでやってる人からすると、例えばGLMみたいな統計モデリングはどういう扱い?機械学習の一部?
486デフォルトの名無しさん (ワッチョイ 035f-Ok77 [14.10.48.193])
2022/04/23(土) 00:48:26.73ID:vni05tAU0 学習データを元にモデルのパラメータを推定するんだから機械学習
487デフォルトの名無しさん (ワッチョイ df10-rbym [153.243.53.4])
2022/04/23(土) 20:31:19.17ID:YDHn6dIe0 最小二乗法も機械学習?
488デフォルトの名無しさん (ワッチョイ 3fd5-Tb6s [111.217.170.2])
2022/04/23(土) 23:00:18.32ID:1pRqwchI0 うん
489デフォルトの名無しさん (ワッチョイ cf63-g9NX [153.169.32.251])
2022/04/23(土) 23:24:04.66ID:KO5U6zCs0 というより機械学習が統計崩れ
490デフォルトの名無しさん (ワッチョイ 6ff7-pAiX [61.25.140.151])
2022/04/24(日) 00:02:27.67ID:XmcVNZmY0 > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
クソチョンはウンコを食べる糞食人種w
クソチョンはゲリ便をじゅるじゅると
うまそうに食うw
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
クソチョンはウンコを食べる糞食人種w
クソチョンはゲリ便をじゅるじゅると
うまそうに食うw
491デフォルトの名無しさん (ドコグロ MM5f-6JeH [125.193.15.63])
2022/04/24(日) 02:26:30.49ID:zMrq6bhEM 最小二乗法は機械学習ではないな
計算過程に学習が必要でないから
計算過程に学習が必要でないから
492デフォルトの名無しさん (ワッチョイ ef97-rYrL [182.171.246.142])
2022/04/24(日) 03:32:27.95ID:JMbxt0Az0 「学習」という言葉をどう定義しているの?
493デフォルトの名無しさん (アウアウウー Sa47-Ok77 [106.146.59.54])
2022/04/24(日) 09:31:15.29ID:O71gCCTUa 学習用データに応じて結果が変わるんだから最小二乗法も学習してるでしょ
494デフォルトの名無しさん (ワッチョイ db6e-7xH5 [138.64.67.32])
2022/04/24(日) 16:32:36.67ID:2A9d2NDv0 クラスタリングも機械学習定期
495デフォルトの名無しさん (ワッチョイ df10-rbym [153.243.53.4])
2022/04/24(日) 17:33:03.56ID:WgEnBMjc0 最近傍法も機械学習
496デフォルトの名無しさん (スププ Sdaf-gg/B [49.98.235.56])
2022/04/24(日) 17:57:41.63ID:+Nm8DxZxd 〇〇はAIですかも同系統の質問だけど何でそんなことが気になるのか不思議
497デフォルトの名無しさん (ドコグロ MM5f-6JeH [125.193.15.36])
2022/04/24(日) 21:10:28.13ID:C8yoCkZdM いや最小二乗法は解析的に解くから学習してないだろう
学習の定義とかしらんが、機械学習ではない
学習の定義とかしらんが、機械学習ではない
498デフォルトの名無しさん (スッップ Sdaf-Tb6s [49.98.147.87])
2022/04/24(日) 21:13:53.85ID:+sg2jP07d 評価関数をMSEにして回帰してるなら機械学習
499デフォルトの名無しさん (ワッチョイ df10-rbym [153.243.53.4])
2022/04/24(日) 22:11:05.81ID:WgEnBMjc0500デフォルトの名無しさん (アウアウウー Sa47-mHJH [106.154.70.188])
2022/04/24(日) 23:04:26.15ID:b8mqC9pha MLの定義なんて決まってないからな
入れる奴もいれば入れない奴もいるってだけ
俺は最小二乗法も入ると考えてるけど、内心では古典的なクラスタリング含めてそんなもんML扱いすんなよと思ってる
入れる奴もいれば入れない奴もいるってだけ
俺は最小二乗法も入ると考えてるけど、内心では古典的なクラスタリング含めてそんなもんML扱いすんなよと思ってる
501デフォルトの名無しさん (ワッチョイ 7701-/zPW [126.125.20.44])
2022/04/25(月) 08:28:54.71ID:WWt+XW3b0 こんなこと言っても線形回帰に精度で負けちゃうんだよね
502デフォルトの名無しさん (ワンミングク MM97-7xH5 [114.156.59.119])
2022/04/25(月) 17:57:03.33ID:W8GcUQ3oM 成田悠輔ってどうよ?
503デフォルトの名無しさん (ワッチョイ ab63-UtWS [180.22.54.207])
2022/04/26(火) 01:25:38.26ID:Kn8thUra0 回帰の勾配ブースティング木の勾配がMSEの微分で残差となるのは理解できたのですが、
分類問題の場合の各決定木の勾配って何になるのでしょうか?
分類問題の場合の各決定木の勾配って何になるのでしょうか?
504デフォルトの名無しさん (ワッチョイ db6e-7xH5 [138.64.67.32])
2022/04/26(火) 06:10:44.32ID:+JXXpgOw0 mse
505デフォルトの名無しさん (ワンミングク MM4f-7xH5 [60.45.221.227])
2022/04/27(水) 14:32:11.91ID:iTC4QIl5M lecunとbengioとhintonは普通の研究者のひとつ上のレベルにいるのな
大体の技術の先駆者で驚愕
最近のlecunのインタビュー読んだけどまだアイデアがあるみたいだな
arcfaceでひーこら言ってる俺とは違いすぎて挫折感ハンパない
大体の技術の先駆者で驚愕
最近のlecunのインタビュー読んだけどまだアイデアがあるみたいだな
arcfaceでひーこら言ってる俺とは違いすぎて挫折感ハンパない
506デフォルトの名無しさん (ワッチョイ 8b5f-/zPW [14.12.4.1])
2022/04/28(木) 01:23:19.89ID:jP1CmVa/0 割と微妙かな。いうほどクリティカルな論文は出してないんじゃ。
507デフォルトの名無しさん (ワンミングク MM4f-7xH5 [60.45.221.227])
2022/04/28(木) 13:28:27.59ID:oc5VTTvkM 東大がディープフェイク検出アルゴリズムを出したみたい
508デフォルトの名無しさん (アウアウウー Sa47-mHJH [106.154.70.243])
2022/04/28(木) 13:39:10.55ID:moo4Gf/Ba まばたきしないとか髪ぼやけるとか、人間なら検出できるって言ってたからな
そのうちディープフェイク側が精度上がるだろ
そのうちディープフェイク側が精度上がるだろ
509デフォルトの名無しさん (ワッチョイ 8b5f-MOU1 [14.12.4.1])
2022/04/28(木) 14:29:37.14ID:jP1CmVa/0 てかそうやって進歩させるのがGANのコンセプトではあるわな。
510デフォルトの名無しさん (ワッチョイ db6e-7xH5 [138.64.67.32])
2022/04/28(木) 20:37:53.29ID:bi7reEEy0 違う
511デフォルトの名無しさん (ワッチョイ 8d7c-PvPk [122.218.227.106])
2022/05/07(土) 06:55:36.29ID:u2uFhB8a0 Qiita のこの記事、実にいいなぁ
機械学習でなんとかしようと安易に考えるな
https://qiita.com/nonbiri15/items/cfc6909ff71273b63f5e
ディープラーニングなら学習すればできるんでしょ、と言う奴、どっか遠くの星にでもに行ってほしい
機械学習でなんとかしようと安易に考えるな
https://qiita.com/nonbiri15/items/cfc6909ff71273b63f5e
ディープラーニングなら学習すればできるんでしょ、と言う奴、どっか遠くの星にでもに行ってほしい
512デフォルトの名無しさん (ワッチョイ 8d7c-PvPk [122.218.227.106])
2022/05/07(土) 07:29:24.11ID:u2uFhB8a0 たとえば、お客さんが受け取った帳票が領収書か請求書かを自動判別したい場合、
今まで受け取った領収書と請求書の画像を学習データにしてDLに学習させて、できた簡単とか言う奴いるけど
・未知の帳票フォーマットに対して有効なのかそれ?
・受け取った帳票は全部印字・記入済なんだが、そんなんで学習していいのか?(未記入帳票は不要なの?)
そんなんには怖くってまかせられないんだが、おいらの感覚は合ってるよね
今まで受け取った領収書と請求書の画像を学習データにしてDLに学習させて、できた簡単とか言う奴いるけど
・未知の帳票フォーマットに対して有効なのかそれ?
・受け取った帳票は全部印字・記入済なんだが、そんなんで学習していいのか?(未記入帳票は不要なの?)
そんなんには怖くってまかせられないんだが、おいらの感覚は合ってるよね
513デフォルトの名無しさん (ワッチョイ 8d7c-PvPk [122.218.227.106])
2022/05/07(土) 07:52:28.76ID:u2uFhB8a0 たとえば文字枠のある用紙に書かれた手書き文字を OCR する場合
・手書き文字だから枠からはみ出すし、はみ出す位置もさまざまだし、
・文字枠も1桁ごとだったり3桁ごとだったり点線だったりキリがない
こういうのは対象画像をそのまま(枠付きで)DLに学習させても、読めますよなんてとても言えんと思うんだが。最近はそうでもないのか?
昔は専門家がデータ眺めてうんうん唸ってロジックを考えていたが、そういうのも大切だよねと
・手書き文字だから枠からはみ出すし、はみ出す位置もさまざまだし、
・文字枠も1桁ごとだったり3桁ごとだったり点線だったりキリがない
こういうのは対象画像をそのまま(枠付きで)DLに学習させても、読めますよなんてとても言えんと思うんだが。最近はそうでもないのか?
昔は専門家がデータ眺めてうんうん唸ってロジックを考えていたが、そういうのも大切だよねと
514デフォルトの名無しさん (ワッチョイ 8d7c-PvPk [122.218.227.106])
2022/05/07(土) 08:12:58.95ID:u2uFhB8a0 あと、学習データで評価してお客に報告するアホ技術者?もシリウスβあたりに左遷して欲しい
スキャンしなおしたら同じ紙でも別データだよね、とかいうやつも
正読率80%はぎりぎり最低ラインで、どんな方法を使ってもこの程度はいきます
95%を超えるあたりからが勝負です。頑張りましょうね。と言いたい
スキャンしなおしたら同じ紙でも別データだよね、とかいうやつも
正読率80%はぎりぎり最低ラインで、どんな方法を使ってもこの程度はいきます
95%を超えるあたりからが勝負です。頑張りましょうね。と言いたい
515デフォルトの名無しさん (ワッチョイ 9d6e-xesJ [138.64.67.32])
2022/05/07(土) 12:37:56.46ID:Gp5QHcLl0 simclrはしんくらーで良いの?
516デフォルトの名無しさん (ワッチョイ 6204-cfd4 [131.213.243.150])
2022/05/07(土) 13:07:42.38ID:TDwBHkCb0517デフォルトの名無しさん (ワッチョイ 8d7c-TPhO [122.218.227.106])
2022/05/07(土) 13:59:18.26ID:u2uFhB8a0518デフォルトの名無しさん (ワッチョイ 6204-cfd4 [131.213.243.150])
2022/05/07(土) 14:17:45.58ID:TDwBHkCb0 学習データの妥当性や追加のデータが必要かどうかも普通は打ち合わせしとくよね?
最終的なアウトプットを出す為に必要なデータもエンジニアから提案あるよね?
最終的なアウトプットを出す為に必要なデータもエンジニアから提案あるよね?
519デフォルトの名無しさん (ワッチョイ 0202-zDU0 [59.138.123.33])
2022/05/07(土) 14:31:19.87ID:9e79BjZl0 学習データが1000万件ぐらいあれば話が変わってくるけど
現実にあるのはせいぜい1万件、ひどいと100件ぐらいで
何とかしてくれと言ってくる
現実にあるのはせいぜい1万件、ひどいと100件ぐらいで
何とかしてくれと言ってくる
520デフォルトの名無しさん (ワッチョイ 6204-cfd4 [131.213.243.150])
2022/05/07(土) 14:35:10.26ID:TDwBHkCb0 無茶なこと言ってくる人多いからね
最初にはっきりさせておかないと後々面倒になるんだよ
今は周りも大分理解が進んできてるけどさ
最初にはっきりさせておかないと後々面倒になるんだよ
今は周りも大分理解が進んできてるけどさ
521デフォルトの名無しさん (アウアウウー Sac5-e+q+ [106.154.64.98])
2022/05/07(土) 14:51:30.69ID:cvuJwPv2a 「100件でやれ」といわれて「それじゃ少なすぎてできない」というのは簡単だけど
本当にできないとは限らないからな
そこが難しいところなんだよ
「やる気になれない」とか「俺には無理」ってだけ
本当にできないとは限らないからな
そこが難しいところなんだよ
「やる気になれない」とか「俺には無理」ってだけ
522デフォルトの名無しさん (ワッチョイ 8d7c-PvPk [122.218.227.106])
2022/05/07(土) 15:00:50.77ID:u2uFhB8a0 >>518
学習データの妥当性って基本的にベンダー側が確認するもんだよね?
お客さん的には、領収書と請求書が見分けられる提案が貰えれば、他はどうでもいい。
ベンダー側の危機感知能力に依存するんじゃないだろうか。
しくじると悲惨。しかも試験運用では完璧だったりする。
学習データの妥当性って基本的にベンダー側が確認するもんだよね?
お客さん的には、領収書と請求書が見分けられる提案が貰えれば、他はどうでもいい。
ベンダー側の危機感知能力に依存するんじゃないだろうか。
しくじると悲惨。しかも試験運用では完璧だったりする。
523デフォルトの名無しさん (ワッチョイ 6204-cfd4 [131.213.243.150])
2022/05/07(土) 15:02:08.44ID:TDwBHkCb0 自分の研究開発テーマだったら取り組む
他部門からの依頼だと確証が持てないから断るかな
他部門からの依頼だと確証が持てないから断るかな
524デフォルトの名無しさん (JP 0Hca-dy93 [103.163.220.76])
2022/05/09(月) 20:40:18.05ID:nBUQfFjcH 初心者の質問ですみません
学習中にバッチサイズを変更すると、lossとaccuracyが変わってしまうんですが、
バッチサイズによって収束値が変わるってことでしょうか?
それだとバッチサイズの設定が結果の精度に影響しませんか?
学習中にバッチサイズを変更すると、lossとaccuracyが変わってしまうんですが、
バッチサイズによって収束値が変わるってことでしょうか?
それだとバッチサイズの設定が結果の精度に影響しませんか?
525デフォルトの名無しさん (ワッチョイ ee10-UDwQ [153.243.43.6])
2022/05/10(火) 08:13:30.90ID:/XkHfgKF0 >>524
影響するよー。だからハイパーパラメータの調整はバッチサイズも含むんだよー。ミニバッチが内部的に何やってるかはググってね。でも、ざっくり、学習パラメータ最適化時のサンプリングサイズだと思えばいいよー
影響するよー。だからハイパーパラメータの調整はバッチサイズも含むんだよー。ミニバッチが内部的に何やってるかはググってね。でも、ざっくり、学習パラメータ最適化時のサンプリングサイズだと思えばいいよー
526デフォルトの名無しさん (JP 0Hca-tbBW [103.163.220.100])
2022/05/10(火) 08:51:59.10ID:NCnPeIRkH >>525
ありがとうございます
やっぱり影響するんですね
そうなると、モデルの作り方、パラメータの設定方法、必ず正しいというやり方がないので、
初心者にはハードルが高いですね
もうある程度適当にエイヤーでやってみるしかないですね
ありがとうございます
やっぱり影響するんですね
そうなると、モデルの作り方、パラメータの設定方法、必ず正しいというやり方がないので、
初心者にはハードルが高いですね
もうある程度適当にエイヤーでやってみるしかないですね
527デフォルトの名無しさん (ワッチョイ ee10-cfd4 [153.243.43.6])
2022/05/10(火) 08:59:18.09ID:/XkHfgKF0 >>526
正しいやり方はないけど、単純なアルゴリズムでベースラインモデル作って評価基準を作り、独自のモデルがそれと比較して優位かを確認しながら進めるという、方法論のテンプレはあるよー。
今ならAutoMLを使うのもいいねー。対応しているタスクならだけどねー
正しいやり方はないけど、単純なアルゴリズムでベースラインモデル作って評価基準を作り、独自のモデルがそれと比較して優位かを確認しながら進めるという、方法論のテンプレはあるよー。
今ならAutoMLを使うのもいいねー。対応しているタスクならだけどねー
528デフォルトの名無しさん (JP 0Hca-wvgW [103.163.220.95])
2022/05/10(火) 09:43:02.83ID:Kl+PeJSAH529デフォルトの名無しさん (JP 0Hca-IBC7 [103.163.220.59])
2022/05/10(火) 11:29:37.64ID:a3woWy82H tpot自動すぎて怖いwww
エポック数すら指定しないし
追加学習したほうがよさそうなのにこれ以上は過学習になるんだろうか
エポック数すら指定しないし
追加学習したほうがよさそうなのにこれ以上は過学習になるんだろうか
530デフォルトの名無しさん (ワッチョイ 5102-U1YL [118.154.96.7])
2022/05/10(火) 13:14:08.17ID:zWCxNbfy0 バッチはサイズだけでなくサンプルのまとめ方が重要になる場合も
たとえば数字の文字認識をする場合は1つのバッチに0-9のサンプルがバランスよく
含まれるようにした方が学習がうまく行く
逆に、0だけ、1だけとかでバッチを作ってしまうとなかなか収束しなくなる
たとえば数字の文字認識をする場合は1つのバッチに0-9のサンプルがバランスよく
含まれるようにした方が学習がうまく行く
逆に、0だけ、1だけとかでバッチを作ってしまうとなかなか収束しなくなる
531デフォルトの名無しさん (ワッチョイ 9d6e-xesJ [138.64.67.32])
2022/05/10(火) 13:20:34.71ID:OS09Ye+10 前にtpot使ったけどボロボロだったぞ
532デフォルトの名無しさん (JP 0Hca-4Pmz [103.163.220.96])
2022/05/10(火) 14:00:41.96ID:J0ydLFpDH >>531
正直あんまり収束してない感じなので追加学習させたいのですが、やり方がわかりませんw
正直あんまり収束してない感じなので追加学習させたいのですが、やり方がわかりませんw
533デフォルトの名無しさん (ワッチョイ 7d5f-oYRD [106.73.226.99])
2022/05/10(火) 18:02:27.33ID:A/IfvceU0 >>530
確かにそういうこと起こりそうだけど、なんか指摘してる論文てあったっけ?
確かにそういうこと起こりそうだけど、なんか指摘してる論文てあったっけ?
534デフォルトの名無しさん (ワッチョイ ee10-cfd4 [153.243.43.6])
2022/05/10(火) 18:17:38.04ID:/XkHfgKF0 >>533
具体的な論文は把握してないけど、時系列予測で考えると直感的な理解が得られ易いと思うよー
具体的な論文は把握してないけど、時系列予測で考えると直感的な理解が得られ易いと思うよー
535デフォルトの名無しさん (ワッチョイ 5102-U1YL [118.154.96.7])
2022/05/10(火) 18:35:36.21ID:zWCxNbfy0 >>533
俺も論文とかはわからないが教科書に載ってるレベルの話なような
バッチのサンプルでまとめて勾配を計算するので、サンプルのバランスが悪いと
ウエイトがあっちに行ったりこっちに行ったりしてしまうが、
バランスが良いとあるべき方向に真っ直ぐ進みやすい、ということかなと直感的には理解している
俺も論文とかはわからないが教科書に載ってるレベルの話なような
バッチのサンプルでまとめて勾配を計算するので、サンプルのバランスが悪いと
ウエイトがあっちに行ったりこっちに行ったりしてしまうが、
バランスが良いとあるべき方向に真っ直ぐ進みやすい、ということかなと直感的には理解している
536デフォルトの名無しさん (ワッチョイ 8d01-U1YL [122.255.141.199])
2022/05/10(火) 18:51:37.71ID:gcxSlYEt0 ・日立、週休3日で給与維持 生産性向上へ働き方改革 時間から成果へ転換
・日立、最低勤務時間を撤廃 「週休3日」も可能に
・2022年の新入社員、79.8%がテレワーク オフィスの必要性は?
・日立、富士通、NEC…「ジョブ型雇用」を大企業が続々導入する理由
・日立やNECが導入へ 「週休3日」は人材獲得の切り札
・リクルートグループ、週休「約3日」に。4月から年間休日を145日に増加へ
・カルビー/国内社員3900人を対象に副業解禁
・日立、最低勤務時間を撤廃 「週休3日」も可能に
・2022年の新入社員、79.8%がテレワーク オフィスの必要性は?
・日立、富士通、NEC…「ジョブ型雇用」を大企業が続々導入する理由
・日立やNECが導入へ 「週休3日」は人材獲得の切り札
・リクルートグループ、週休「約3日」に。4月から年間休日を145日に増加へ
・カルビー/国内社員3900人を対象に副業解禁
537デフォルトの名無しさん (アークセー Sx91-PvPk [126.151.83.114])
2022/05/10(火) 19:37:35.64ID:rAiWhgPwx >>535
確率的最急降下法だから、偏った方向に突き進むのは良くないとか、そういう次元の話だと思っていた
確率的最急降下法だから、偏った方向に突き進むのは良くないとか、そういう次元の話だと思っていた
538デフォルトの名無しさん (ワッチョイ 9d6e-xesJ [138.64.67.32])
2022/05/10(火) 19:43:41.75ID:OS09Ye+10 そういうことかと
539デフォルトの名無しさん (ワッチョイ 5102-U1YL [118.154.96.7])
2022/05/11(水) 02:35:50.86ID:n/T4USjf0 確率的勾配降下法と最急降下法が混じってないか?
最急降下法 : 全サンプルで一度に勾配を求めてウエイトを更新
確率的勾配降下法:1サンプル毎に勾配を求めてウエイトを更新
ミニバッチ勾配降下法:ミニバッチ毎に勾配を求めてウエイトを更新
んで >>524- あたりから話してるのはミニバッチ勾配降下法についてね
最急降下法 : 全サンプルで一度に勾配を求めてウエイトを更新
確率的勾配降下法:1サンプル毎に勾配を求めてウエイトを更新
ミニバッチ勾配降下法:ミニバッチ毎に勾配を求めてウエイトを更新
んで >>524- あたりから話してるのはミニバッチ勾配降下法についてね
540デフォルトの名無しさん (ワッチョイ 8d7c-maJN [122.218.227.106])
2022/05/11(水) 03:49:48.40ID:2hlm/96F0 ごめん訂正ありがと
541デフォルトの名無しさん (ワッチョイ 9d6e-xesJ [138.64.67.32])
2022/05/11(水) 06:58:42.56ID:168GVk5R0 ミニバッチも偏ってたら駄目じゃない?
542デフォルトの名無しさん (ワッチョイ 8d7c-maJN [122.218.227.106])
2022/05/11(水) 09:33:13.11ID:2hlm/96F0 駄目だよね
偏ったサンプルの気持ちいい場所に捕まってしまう
偏ったサンプルの気持ちいい場所に捕まってしまう
543デフォルトの名無しさん (ワッチョイ 5102-U1YL [118.154.96.7])
2022/05/11(水) 09:43:34.76ID:n/T4USjf0 確率的勾配降下法でもミニバッチでもサンプルの与え方が偏るのはダメ
普通は学習ツールがランダムシャッフルしてくれるから気にしなくてもだいたいうまく行くが
性質の違うデータの種類がいっぱいあるような場合はランダムに任せてるとバッチ内のサンプルが
偏りやすくなる場合がある
そのため、たいていの学習プラットフォームではバッチを生成する処理を上書きするための
手段が用意されてたりする
バッチの処理順序はランダムでok
普通は学習ツールがランダムシャッフルしてくれるから気にしなくてもだいたいうまく行くが
性質の違うデータの種類がいっぱいあるような場合はランダムに任せてるとバッチ内のサンプルが
偏りやすくなる場合がある
そのため、たいていの学習プラットフォームではバッチを生成する処理を上書きするための
手段が用意されてたりする
バッチの処理順序はランダムでok
544デフォルトの名無しさん (ワッチョイ ee10-ojei [153.131.102.129])
2022/05/11(水) 13:57:20.69ID:SfomTu1y0 ミニバッチでもバッチのデータと全データで勾配方向が違うから確率的になるけどな
バッチサイズが小さいとそのズレは比較的大きくなる
バッチサイズが小さいとそのズレは比較的大きくなる
545デフォルトの名無しさん (ワッチョイ 7d5f-oYRD [106.73.226.99])
2022/05/11(水) 15:02:21.52ID:F52sGOdk0 でもその差を理論的だったり実験的に検証してる論文はないんじゃない?
546デフォルトの名無しさん (アウアウウー Sac5-e+q+ [106.154.72.157])
2022/05/11(水) 15:06:03.86ID:xW75jOAua さすがにあるだろ。80年代にありそう
547デフォルトの名無しさん (ワッチョイ ee10-ojei [153.131.102.129])
2022/05/11(水) 16:21:53.90ID:SfomTu1y0 学習に使う全データは実際に発生するデータの部分集合である事は変わらない
全データで勾配を計算したとしても母集団の情報を使っている事にはならないから確率的勾配降下とも解釈できる
あくまでも学習データに限定して最急降下というだけ
未知データに対する汎化能力で見ると最急降下になっているかは分からない
全データで勾配を計算したとしても母集団の情報を使っている事にはならないから確率的勾配降下とも解釈できる
あくまでも学習データに限定して最急降下というだけ
未知データに対する汎化能力で見ると最急降下になっているかは分からない
548デフォルトの名無しさん (ワッチョイ 5102-U1YL [118.154.96.7])
2022/05/11(水) 20:06:44.40ID:n/T4USjf0 それはなんかズレてるような
学習データでしか学習しない(勾配を求めて降下させることもない)んだから母集団とか持ち出さなくても
確率的と最急降下の本質的な違いは、確率的に学習することによりローカルミニマムを抜け出す
チャンスがあるかどうかなのでは
そういう意味ではミニバッチ法も確率的だというのはあってると思う
学習データでしか学習しない(勾配を求めて降下させることもない)んだから母集団とか持ち出さなくても
確率的と最急降下の本質的な違いは、確率的に学習することによりローカルミニマムを抜け出す
チャンスがあるかどうかなのでは
そういう意味ではミニバッチ法も確率的だというのはあってると思う
549デフォルトの名無しさん (ワッチョイ 9d6e-xesJ [138.64.67.32])
2022/05/11(水) 20:15:05.10ID:168GVk5R0 サイコロふってサンプル選んでミニバッチ作ることが確率的なの?
550デフォルトの名無しさん (ワッチョイ 5102-U1YL [118.154.96.7])
2022/05/11(水) 20:32:09.62ID:n/T4USjf0 サンプルの選び方によって勾配が変わるので学習の方向はあっち行ったりこっち行ったりする
でもどちらかと言うと正しい方向に進む確率の方がちょっとだけ高い
そういう意味で確率的、なんだと思う
これはアニーリング問題と同じで、分子を最初は大きくランダムに動かして
(でもちょっとだけ正しい方向に進みやすくして)少しずつ動きを小さくしていくと
最も安定したところに収束する
分子の動き=温度で、温度を十分にゆっくり下げると最適解に到達することが証明されてる
だからDLでも学習率(温度と等価)の下げ方が重要なんだが最近は自動になって便利だね
でもどちらかと言うと正しい方向に進む確率の方がちょっとだけ高い
そういう意味で確率的、なんだと思う
これはアニーリング問題と同じで、分子を最初は大きくランダムに動かして
(でもちょっとだけ正しい方向に進みやすくして)少しずつ動きを小さくしていくと
最も安定したところに収束する
分子の動き=温度で、温度を十分にゆっくり下げると最適解に到達することが証明されてる
だからDLでも学習率(温度と等価)の下げ方が重要なんだが最近は自動になって便利だね
551デフォルトの名無しさん (ワッチョイ ee10-ojei [153.131.102.129])
2022/05/11(水) 20:57:45.21ID:SfomTu1y0552デフォルトの名無しさん (ワッチョイ 8510-hJAo [114.163.141.1])
2022/05/11(水) 23:37:55.47ID:cJjkDDOX0 過学習
意味: うまくいかないときの言い訳
意味: うまくいかないときの言い訳
553デフォルトの名無しさん (アウアウウー Sac5-e+q+ [106.154.69.155])
2022/05/11(水) 23:47:40.71ID:xXaj6qvMa 過学習できるってことはうまくいってるってことだよ
554デフォルトの名無しさん (テテンテンテン MM82-xesJ [193.119.144.94])
2022/05/12(木) 09:15:39.58ID:24mxIbhrM 初期の学習率てどうやって決めれば良いの? それとオプティマイザも
555デフォルトの名無しさん (テテンテンテン MM82-xesJ [193.119.144.94])
2022/05/12(木) 09:16:43.48ID:24mxIbhrM adam選んどきゃ正解なの?
556デフォルトの名無しさん (アウアウウー Sac5-e+q+ [106.154.69.155])
2022/05/12(木) 11:51:42.19ID:ssfk6Zuqa ユニット数とかすべてひっくるめて、無限にある組み合わせの中から適当に選んで試しまくってよさげなのを決めるしかないよ
autokerasみたいなの使って半自動で探すのもいいけど、制限も多いから自力(コーディング)で探すのが楽
autokerasみたいなの使って半自動で探すのもいいけど、制限も多いから自力(コーディング)で探すのが楽
557デフォルトの名無しさん (スップ Sd02-hJAo [1.75.155.91])
2022/05/12(木) 15:04:07.76ID:mMTw6/Aad 過学習なんて言葉いい加減禁句にしてほしい。
エラソぶったおっさんが学会でわかった口して過学習、過学習‥‥‥ブツブツ。、
(苦笑)
エラソぶったおっさんが学会でわかった口して過学習、過学習‥‥‥ブツブツ。、
(苦笑)
558デフォルトの名無しさん (スップ Sd02-hJAo [1.75.155.91])
2022/05/12(木) 15:07:39.54ID:mMTw6/Aad ただの造語に騙されないように‥‥‥
559デフォルトの名無しさん (ササクッテロル Sp91-YKh1 [126.234.43.89])
2022/05/12(木) 15:30:13.49ID:TPnOtntRp オーバーフィッティングならいいのか?
560デフォルトの名無しさん (JP 0Hca-Ix6I [103.163.220.94])
2022/05/12(木) 17:20:58.10ID:l5soNYRaH たとえばオセロや囲碁などのボードゲームではビットボードが使われてると思うんですが、
学習をさせるときは配列にビットを展開しないといけないんでしょうか?
それともインプットをビットボードの数値にしてもうまく学習できますか?
展開するとしたら結構な計算量とメモリ消費量になると思うのですが、現実どう処理されてるんでしょうか?
学習をさせるときは配列にビットを展開しないといけないんでしょうか?
それともインプットをビットボードの数値にしてもうまく学習できますか?
展開するとしたら結構な計算量とメモリ消費量になると思うのですが、現実どう処理されてるんでしょうか?
561デフォルトの名無しさん (アウアウウー Sac5-e+q+ [106.154.69.155])
2022/05/12(木) 17:40:20.64ID:ssfk6Zuqa bit単位で扱うことはないな。画像データのほうがはるかにメモリ食う
具体的にはゲーム処理は1マス1enum(内部的には4byteかな)でやるし、学習データは1マス1floatの割り当てでやる
オセロなら8x8マスだからfloat[64] 用意して自駒あるとこ1、敵-1、何もなしzero、入力マスク用にbool[64]用意して駒おけるとこだけtrueにして
lstmも何も使わない単純なPPOに突っ込むだけで一日で勝てないとこまでいくよ
具体的にはゲーム処理は1マス1enum(内部的には4byteかな)でやるし、学習データは1マス1floatの割り当てでやる
オセロなら8x8マスだからfloat[64] 用意して自駒あるとこ1、敵-1、何もなしzero、入力マスク用にbool[64]用意して駒おけるとこだけtrueにして
lstmも何も使わない単純なPPOに突っ込むだけで一日で勝てないとこまでいくよ
562デフォルトの名無しさん (ワッチョイ 0202-zDU0 [59.138.123.33])
2022/05/12(木) 18:07:08.93ID:XThBUtns0 配列のほとんどの部分が0なので
疎な配列、疎行列あたりのライブラリを使って
メモリを節約する
疎な配列、疎行列あたりのライブラリを使って
メモリを節約する
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 今年の漢字 [ぐれ★]
- 【おこめ券】物価高対策の“おこめ券”全米販は1枚477円で販売へ 鈴木農水大臣「国民の皆様に活用いただきやすいよう工夫いただいた」★2 [ぐれ★]
- 神田沙也加さん元恋人で元俳優の前山剛久 六本木のメンズラウンジ勤務を報告「真叶(まなと)です。よろしく」 [muffin★]
- 高市首相の答弁書に「台湾有事答えない」と明記 存立危機発言当時 ★5 [蚤の市★]
- 【麻雀】プロ雀士の岡田紗佳さんが勝訴、点数計算めぐる発言は「違法とは言えず」 大宮簡裁 [征夷大将軍★]
- ミス・ユニバース フィンランド代表の「つり目」写真が波紋… 本人釈明も批判やまず 協会謝罪「徹底的に検証」へ★3 [冬月記者★]
- 虫歯の味ってわかるよね
- 元チーズ男性「変わりたい気持ちがあれば誰だって変われる。」パシャッ👉10万いいね [329329848]
- 【ネトウヨ訃報】大都会名古屋さん、みんなが羨む都市のはずなのに何故か名古屋駅の再開発が頓挫 [784715804]
- 【ニコチン】1日何箱吸ってるかかいてけ
- 参政党議員「クジラの肉を食べないのは流通や販路に問題があるからだよね?」 [592058334]
- VTuber叩きが大流行してる理由、1枚の画像で解説される…!! [858219337]
