【統計分析】機械学習・データマイニング21
レス数が1000を超えています。これ以上書き込みはできません。
機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured >>1
だよんがキモい
まあ、最初に書いたのは俺だが どうせ入れ子なのに過去スレ全部貼るのは流石に意味分からん頭悪すぎだよね 前スレしか貼らなかったらアクセスするのにO(n)かかる >>13
タイムアウトの場合って
計算量どうなるの? 今更で過去議論しつくされてるのかもしれないけど、TensorflowをWindows10で使用しているけれどほとんど支障がありません
ArXivの実装も見様見真似でできるしたまにGitにあがっているのもLinax用であろうがべつに使えないModuleもそうないし
それでもやpっぱUbuntuがいいの?いまから環境変えたくないんだけど変えたほうがいい理由ってあるのかな? 入れちゃって不自由なくて、他の人が困らないならいいんじゃね >>15
ベストではないけど、10なら問題なし
OSはMacだけが間違い。いらん手間が増える >>15
linux のスペルさえ間違う人はwindowsがいいだろ >>15
そもそもわざわざ有料のOS に固執する理由がわからない。
1 台ならともかく、例えば部署丸ごとならそれなりのコストがかかるしね。
けど、Linux が苦手な人に替えるべきなんて誰も言ってないと思うよ GPU複数台タワーグラッドで計算させてたけど、転移学習主体になてシングルで事足りてます。OSが無料かどうかが論点なのかな? Linux搭載PCが量販店で普通に新品で売ってるなら選択肢に入るけど新品だとwinかmacしか選択肢がない
で、わざわざ買った有料OSを抜いてLinux入れるかと言われるとwinでやりたいことできるならwinでいいじゃないか、となる それな、わざわざ入れるのは意味不明
自作PC組むようなオタクならリナックス
市販のPC買う一般人はwin使えばいい PCと携帯でID同じになってくれればいいなと思ったけどだめでした
自作でWin10Proをわざわざいれてやってるんだけど
>17さんの言うみたいにベストでない理由はなにかあるんですかね?
個人的にはhorovodの分散学習がLinux対応だけどWinでKerasでもできるし
GPUパフォーマンスあがってきてBatch_size増やす必要もなくなってきたので不満がないのですけど
ぶっちゃけbusinessとacademicとpersonalを全部両立した環境って結局Winが使いやすくて
TensorflowではこのmoduleがWinだと使えないぜってのがあれば先に押しててほしいなと
最近Tensor-hubを使うようになり、その機会にtf.estimatorも使うようになると、
いままでちまちま書いてたのが馬鹿らしくなりました
もうKerasもいらないくらい 追記
academicだとやたらMAX_OSが多い
昔DTMでMAC使ったことあるけど逆にdirectoryのruleが曖昧で悩んだ記憶があるlevel
MACがやばいとあったけどWSでもあいつらMACでやるし
逆にWin; Linuxは見たことないな
結局なんでもいいんじゃないの?
platformがTensorflowなら だから言ってんじゃん
オタクはリナックス一般人はwinパリピはmac >>28
おいおい
TensorflowGPUの最新版はmacOSサポートしてないんだぞ 今日もDNNのWSでMacでDemoされたけど
なんか良くわからなくなってきたよ 今月はnumpyとpandasとmatplotlibの勉強するから応援してくれよな
そんなのわざわざ勉強するのアホじゃねっていうのは心折れるからやめてくれよな >>33
コーセラ2周目で止まってる…
たかだか10分くらいの動画見終わるのに巻き戻したりしてて1時間くらいかかる >>32
いくら勉強しても十分ってことはないからいいと思う お前らがエスパーじゃなかったらどこ探せばいいんだってんだよ
なんかさみしいね 誤差逆伝播はcourseraの例の機械学習コースでは詳細スルーしてるから、詳細気になる場合は同じくAndrew先生のやってるディープラーニングコースを見ると分かりやすい
こっちは有料だけど動画見るだけなら無料でいける >>39
そういうの見てどうのこうのよりGitのcodeをtraceしたほうがぜったいいいとおもうんだけど https://www.coursera.org/learn/neural-networks-deep-learning
この講座の2週目の誤差逆伝搬法では、
計算グラフを図示
→簡単な数値を入れてざっくり説明
→数式の説明
→Pythonコードを書いて説明
→コードをベクトル化して高速化
の順に説明してくれるから分かりやすかった 日立のAIって、この程度しかやってないの?
http://www.nhk.or.jp/ohayou/digest/2018/04/0405.html
Fがベンチャー以下なのは知ってるけど、日立は接点ないからレベルが解らん >>52
個人で勉強してqiitaに書いてる人と大してレベル変わらんな
これで商売になるのなら自分も十分やっていけそうで自信ついた >>52
料理1品あたり1000枚だけで足りるのかね? 過学習してそう
というか自社で写真取らなくてもネットから拾ってくればいいと思うが
データ利用だから知財的にも問題ないだろうし >>32
ついでにsympyとscipyも勉強しろ。 はーマジでopencvの画像bgrなのクソ
普段DL関連では全く使わんしクリップで一瞬使っただけだから盲点だったわ
通りで検証でもテストでも高スコアなのに実用でゴミみたいな予測叩き出してた訳だ
お陰で過学習疑ってデータ数3割も増やして拡張も工夫した2週間が無駄骨だった5%くらいスコア上がったけどよお
こんなクソみたいに初歩的なことやらかす奴おらんやろけど一応気を付けなはれや コンテストに研究者送り込むより何に使うか考えるほうが難しいよ >>65
その通り
技術力の高さよりも、上手く活用した人間が長期的には勝つ 日本企業は技術力の高さもその活用も他国に負けてるからこのザマなわけだ ライブラリとか充実してて誰でも出来るのは良いけど分析するのに当たってとりあえずモデル作って結果出しました!みたいなのが多くて統計だったり数学的知識がないまま使ってる人が増えてる感じするね
それが良いか悪いかは分からんけど >>70
ほとんどのAI専門家自体が、統計知識や周辺知識に欠けていながら
「利用者が統計知識もしらずに・・・」とか言っているのが現実 DRAMのデータバスのbit順間違って結線してても一応そのまま動くからな >>71
俺もそのうちの1人なんだけどさ
これでは何の意味もないし説得力もないなと思って統計だったり色々勉強し始めて、自分もそうだったけどとりあえずデータ投げてモデル作って結果だしてって雑だし乱暴だよね リアルはKaggleと違って、何が入力値になるか探すところから始まる。
データへアプローチする為には統計の知識は必須だから、
ライブラリ使いが増えてもAI普及の助けにはならないな >>63
テストも含め学習検証時はkeras内蔵のioライブラリ一本でやってたからね
実用時に一部処理をopencvに任せたらkonozama
テストスコア高い時点で過学習じゃないって気付けよって話だわマジで >>75
だめでしょ
でも、AIの利用者はそれを知らなくても使えるところに一つのメリットがある
ともいえるので、なんか微妙なところもある。
数理的には統計の方が難しいし、自動化できない問題がある。
なぜ数理的に難しい部分が出現するかといえば単純なことで、
少ないデータを対象に考えられているため。 最近は勝手に分析して特徴量を自動的に作るソフトとかも出てるけど実際使ったことないからどんなものかは分からない
でもその手のソフトが宣伝文句通りに動作するなら片っ端からデータ突っ込むだけでいいんだよね? >>81
そう。
まずい飯を入れれば
たくさん残飯が出てくる。 AUC高い!って今日同僚がキャッキャ騒いでたけどいつのまにか良いモデルを作る事が目的になってる人結構いるよね 適用できるモデルがかなり限定的
というかそもそも現在の制御技術でも可能なレベル >>85をショボいと理屈を持って断じることができる人材が増えてほしい D-Waveの量子コンピューターで機械学習したらどうなるのかも気になるが、さっぱり解らん New-Waveで機械学習したらどうなるのかも気になるが、さっぱり解らん 非線形最適化だろうが確率分布のピークが複数あろうが、今のNNならかなり高速に最適化できるからな 量子プログラミングを全然知らないのに
適当なこと書くのは恥ずかしいからやめような。真に受ける人もいるかもしれないんで もう何でもかんでも機械学習とかAIって呼ばれる時代だから仕方ない ネタないこの世の中において久々に「遊べる感」や「進化感」が感じられる分野だからな
そりゃあ、猫も杓子も機械学習に飛びついて飯を食おうとするわな 猫も杓子も
「禰宜(めこ)も釈子(しゃくし)も」が変化したという説、「女子(めこ)も弱子(じゃくし)も」が変化したという説、または猫や杓子は日常生活において目につきやすいからという説もある Jupyterをサポートした「Python in Visual Studio Code」10月版がリリース
https://news.mynavi.jp/article/20181109-721502/
今までは別タブでしか結果表示出来なかったんだっけ
これの使い心地良ければブラウザでjupyter notebook編集するよりは楽そう トランプでどうやって遊ぶのといわれたら
だれもが自分の好きなトランプの遊びを選択する
そのトランプの遊びがくだらないものであっても
それはその特定のトランプの遊びがつまらないのであって
トランプの遊びすべてがつまらないワケではない
新しいトランプの遊びかたを探すのもありだ
遊びだからな つまり遊びで割り切らないといけない もともとこのインチキな分野にはなんのメリットもない kaggleこなせば仕事でも活かせる部分ってあるのかね
そもそもkaggleすら出来ない奴は論外なのか その人のポジションによる
kaggleのメリットはひたすらデータ解析して高スコアモデルの作成の追求に没頭できること
一方でそもそもそんなモデルを作ろうと考えるに至るまでの課題抽出のプロセス、モデル作成のためのデータ取得、
完成したモデルをどう事業に使うか、といった部分は完全に無視することになる kaggleに登録したけど
忙しくてその後何もやってない。
kaggleやるヒマあるならキチンと
統計学の勉強したほうがいいと思う。 「きちんと勉強する」の基準が難しくて真面目な人ほど勉強ばかりに熱中して実践的なことが見に付かなくなる
なので理論の勉強しつつ並行して実践するのが一番
kaggleも勉強の一環と考えて上位入賞を意識しすぎなければいい 俺はもう15年もデータ分析の仕事してる。
実践はやっていける自信持てたけど
理論武装を積み上げないといけないと思ってるところ。
企業で統計学を教えることもあるけど
まだまだ理論は未熟ですよ。 >>115
自分が真面目かは分からないけど刺さる言葉だ…
勉強しても不安でずっと参考書見て参考のコード書いてってばかりで実践力みたいなものは皆無だと思う
あと上でも統計学を勉強するべきって言ってくれてる人もいるけど、区間推定とか仮説検定とかそういうのは低レベル過ぎる? 理論とかイラネ
そんな無駄ならことする暇あるなら手を動かして一つでも多くデータを集めろ >>119
機械学習で使うかと言われると使わない。
ただし、顧客からp値を出せと求められる場合もあるので常識として押さえておいた方がよい。 >>121
なるほど
データ分析が出来る人になりたいなと思うから抑えといた方が良さそうだね
ここに居る人たちは分析メインの人よりシステム作ったりしてる人が多いのかな 理論分かってた方がどこをどう直せば改善するとかわかるようになるんじゃないの 決定木ってデータのスケーリングだったりは必要ないって解説サイトにも書かれてるけど全くやらないのがデフォルトなの?
それとも文字とかはダミー変数とかに置き換える基本はやるべきなの? >>124
他のモデルと純粋に優劣を図りたい時に条件を揃える目的でスケーリングすることはあるかも知れない(無意味だけど)
カデゴリカル値の変換は決定木の場合もやらなくちゃいけない。変数の数がやたら増えると好ましく無いため、get_dummiesよりはtarget based encodingがいいよという人もいる。 >>120
> 理論とかイラネ
> そんな無駄ならことする暇あるなら手を動かして一つでも多くデータを集めろ
そういう人って、少し景気が悪くなれば必要なくなる。
PCが使えれば高卒でもできるから。
ま、そういうレベルの職場もまだ多いから、
それで食っていけるならいいんじゃないか?
おれはイヤだけどね。 インフラ系開発からそっち行きたいんだけど中々入り込めぬ >>126
理論とか高卒の作業以下って言ってるんだけど
上でも誰か言ってるけど課題抽出やどう事業に応用するのかが大事なのであって理論じゃ飯は食えない 最近は、転職するのがとても難しいですね。
良い人材を採用したいといいながら、
人材紹介会社に丸投げですから。
人材紹介会社というのが何をやってるのか
わかりませんけど、そういうのに登録しても、
高学歴で20代でなければ、
ほとんど良い転職は紹介してもらえないようです。
つか、紹介先が人売り企業ばかりです(笑)
そのほうが高く売れるんですよ。
紹介手数料を多くもらえる。
だから、普通の人には下請け企業や
実質的な派遣会社ばかりを紹介してきます。 >>128
実践は俺のもっとも得意とするところ。
ちゃんと書いてあるだろう?
読めないのか?
それに加えて理論ということだ。
日本語読めないか? >>128
課題抽出や応用って理論が無いとできないと思うんだが
理論がいらないのって下請けの単純作業くらいじゃね 客が馬鹿なところでは、
ヒストグラムと折れ線グラフで分析終了ですね。
実際、そういうところ多いです。
だからと言ってそれに甘んじて理論の勉強をサボっていると、
そのうちメシが食えなくなるということでしょう。 >>133
だからさ、日本語読めないなら半島へ帰りなよ。
データ分析専門の会社なんて在日朝鮮人ばっか。 >>135
そうそう。
客が納得する単純なグラフを用意するのも仕事の内ですから。
結局は客の要望で仕事するしかないわけで。 >>133
客の要望が理解できないド素人なんだろうが、
まあ、そういう馬鹿でも今はメシが食える。
いいなあ(笑) >>132
見極め大変そうだな
普通の客にそんなん出したらバカにしてんのかって怒られるぞ それでも怒らず満足してくれる客がいるってことだろ
30点で満足してくれるのに同じ金で80点取ろうとする必要はない >>130
その実践のために理論なんてものを覚える暇があるなら1つでもデータ数を増やす方が役に立つという主張ダナ
逆に理論なんて無用の長物がどう実践に役立つのか教えて欲しいもんだわ
あんなの暇人研究者()のオモチャだろ >>143
言いたいことはわからんでもないけど、
理論でデータを増やる場合があるんだよね。
それが重要だったりするんだよ。
教えてやろうか? まずバカは相手がなにをしたいかが読み取れないからな
所詮、ドカタ作業員 >>143が頭空っぽにしてても実践出来るのはその暇人研究者()のおかげなんだが >>144
「理論でデータを増やる場合があるんだよね。」って日本語変じゃないか? >>147
ちょいと変だけど意味は通じるだろ?
理解できない? >>147
手を動かしてるだけのFランの馬鹿には理解できないと思う。
だから学歴を書いてくれる?
学歴に応じてわかるように書いてやるから? cross-validation: [0.5 0.375 0.71428571 0.8 0.6 ] 0.5978571428571429
交差検証したときにこういうときってどうしたらいいですか?
データ数が少ないってのはあるのですが… tensorflowって複素数のデータを使った学習できますか?
実数=複素数*重みみたいな式を作りたいんですけどどうすればいいですかね 複素数をcsvから読み込みたいんですけど、
tf.train.string_input_producerの後でデコードする時に
record_defaultsに複素数を定義できません
複素数を読み込むにはどうすればいいですか >>158
データ型があるんだから必要なら書き換えればいいだろ >>144
理論でデータ拡張??
いったい何のことを言っているのか例あげてみてよ
>>146
そりゃそうだろ
あいつら理論で遊んでお金貰ってるんだからそれくらい貢献して当然 データ水増し(augmentation)の手法なら色々出てるんだから知りたければ自分で調べればよい >>163
誰にもの言ってるのそんなの勿論知ってる
それらのうちの一体どれが理論によってなされてるのか教えてって言ってるんだけど 寂しいね
要る/要らないで切り捨てていったら自分の世界がどんどん狭くなるよ >>166
ウソはいかんな。
知らなかったくせに。
ホント馬鹿のくせに「おれは天才だ病」に
かかってる奴は始末におえない。
「おれは馬鹿です」って認めるまで何も教えない。
でも、お前は絶対に認めない。
ヒストグラムと折れ線グラフだけ作ってなさい。 >>172
どうやらどこかで調べて理論なんて使ってないって分かったみたいダナ
よく知りもしないのに噛み付くんじゃないゾ 物体認識(検出)で同一のオブジェクトを再検出したくない場合は、
監視カメラのトラッキングシステムのように対象にIDを採番する方法しか無い? ↓機械学習ブーム終了してた
スイッチ向けにプロセッサーを提供するコンピューター・グラフィックス用半導体メーカーの米エヌビディアは15日、
11月−19年1月期(第4四半期)の売上高は27億ドル(約3070億円)上下2%の見通しと発表。
アナリスト予想の平均34億ドルを下回った。
同社株は時間外取引で急落した。
松井証券の窪田朋一郎シニアマーケットアナリストは、「エヌビディアが好調ではないということは、
スイッチも追加で発注するような状況ではないという連想につながる」と述べた。 特徴選択で単変量統計で選択する場合とランダムフォレストベースで選択する場合で選択され特徴量が全く違うみたいなことってある? Tensorflow-gpuてオンボードグラフィックでもうごくのなインテルなのに
CUDAいれるときはGPUつんでたけど >>175
objectのlocalizationもしたいんだよね?
画像処理技術の延長だとfmapのvariance分布を追っかけてtraceしてたけどSSDとかを使えばIDなんて要らないと思うよ
要するに無数に切ったDefaultBoxの数と大きさをobjectを囲むBBに合うようにloss計算してるだけ なんか質問に対して答えが変なきがするので追伸
検出したBBのfmapのvariance peakをmaskにしてかくvarianceから差っ引いていけば重複なく数えられると思うけど
多重ガウス分布ってfilter波形の線形合成で表現できうるので >>182
マイニングって原理上、投入計算量に対して得られる対価がどんどん減ってくけど、
そのうち誰もマイニングしなくなって、仮想通貨システムの決済処理自体が
立ち行かなくなっちゃったりしないのかね
それともマイニングで儲けた人がちゃんと仮想通貨自体が永らえるように
儲けでなくてもマイニングはし続けて決済処理がちゃんと動き続けるようにするから
大丈夫ってことなのかね マイナーの損益分岐点になるとさっさと売り払って終了のお知らせだな
使うと減るような種類の仮想通貨もあるから一歩進めて
使うたびに手数料的に減少していけば新規採掘が復活して長期的に運用できるだろうな
そういうのはビットコインにはないみたいだな マイナーが売りに出した中古のGPU手に入れようとかセコいこと考えてたの思い出した 仮想通貨=マイニング、ではないから
あくまで信用を担保する一つの手段に過ぎない これって対応OSはLinux?
ラズパイ程度のハードで使えるのかな?
インテル、第2世代のUSB型AIデバイス「Neural Compute Stick 2」発表
https://japan.zdnet.com/article/35128696/ 以下のサイトのAIに意識を持たせる
ロボマインド・プロジェクトをどう思いますか?
https://robomind.co.jp >>188
ありがと
> OS support
>Ubuntu 16.04.3 LTS (64 bit),Windows 10 (64 bit), or CentOS 7.4 (64 bit) >>189
新井教授への苦言は同意
この女教授、袋叩きにあってるな >>189
どうせ在日系が
パチンコ屋の収益(勿論脱税)にて
作ったIT企業だろ?
在日パチンコ屋ときたら
皆揃って損正義のマネ 元々大した業績もないのに
妙に重宝されてるのが新井某
誰かの愛人? 予算を取る企画をつくるのが超絶に上手い
研究者より商売人のほうが向いてるのでは いることはいるけど数が少なすぎるのとアメリカ様に完全に差をつけられてしまっている お前らもgoogleブラックホールに飲み込まれますように。健勝を祈る >>187
届いた。2はまだラズパイには対応してない。
IntelのOpenVinoという環境で動作させるが、demoプログラムはintel cpu,intel gpu,Movidius,FPGAを容易に切り替えて試せる。
i3-8100とMovidius2を切り替えて試したがi3が数倍早い。 参考書ばっか読んでて実践らしい事なんもしてなかったからkaggle登録した
きっといい結果出なくて自分の勉強が無に帰す事になりそうで怖いけど頑張るわ >>199
アメリカ様にっていうか、今の機械学習は大量のデータが必要なのでプラットフォームを押さえてデータを収集してるGAFAが強くなるのは当たり前
もちろんAI研究予算とかの話もあるけどそれ以前の環境作りで負けてる
新井先生は機械学習界隈ではなぜか評判悪いけど日本がアメリカみたく大量のデータを集められることはこれからもないだろう、などちゃんと現状分析して少データから学習できる手法の研究に舵を取るなどしてる
東ロボについて書いた本とか食わず嫌いせずにちゃんと読むと結構納得するところあるよ GAFAが強いって言ってもその対象分野は割と限られているので、専門性の高いデータを持っているメーカーならそのメーカーの専門分野での勝負なら十分対抗できる
なのでいわゆるIT系ではなくメーカー所属で機械学習やる方が楽しいと思う 初歩的な質問なのですが、
過去のデータから未来を予想するという点で、
統計学と機械学習は似てると思うのですが、
なぜ、皆んな機械学習ばかり取り上げて統計学を取り上げないのですか?
データの豊富な時代だから分析が盛んになる事は分かりますが、
ならば統計学はダメですか? 異常検知ばっかりになりそうな気も
クラスタリングもあるか >>207
コマツの工事車両が備えたセンサーを通信で収集して異常検知した事例とか、メーカーの工場でセンサーを張り巡らせて歩留まりを向上させるとか、そういうイメージの話? 高速道路の橋脚の疲労具合を動画撮って解析するのもあったね >>209
統計学を理解していないものが作ったモデルの特性を理解出来ないでしょう。統計学は必須スキルだよ。表面的な作業だけ覚えても通用しませんよ。 >>209
機械学習の基本は統計学です。
しかし統計学はとても難しい学問です。
(つまり機械学習もその基本は本当はとても難しい)
現状は、統計学を知らないデータサイエンティストがほとんどです。
ですのでもし勉強できる機会があれば、
将来に備えて少しずつでも統計学を勉強される
ことをおススメします。
独学は難しいので、大学、大学院の授業を
受けたほうが良いです。 209ですが、統計学を知らないと基礎が分からないということなので、そういう方は既存の機械学習の手法を運用する事しかできず労働市場では評価は頭打ちということですよね?
つまり基礎の仕組みが分かってないから、既存の仕組みの問題点を改善することはできないですし。また、結果の解釈や適応する手法が妥当か分からないわけでしょうし。 いわゆる土方止まりかと言えばそうだろうね
ただ客も分かってないからブラックボックスな製品作って機械学習なりAI使ってますって謳えば仕事になるし、客も統計学んでないから結果の解釈もできないし、結果としてこの人は統計学んでるから高い給料払おうという根拠にもならない でも統計学学ぶより個々の案件でちゃんとドメイン知識学んだほうが性能上がりそう
両方が望ましいのは当然として 機械学習に数学はいらない
統計学は応用数学
機械学習に統計学はいらない transformerがrnnじゃないってところがわからない
トークンx_iを次々入力するんじゃないの? >>223
モデルの中身理解出来ないオペレーターは要らないから笑 どっちにしろ2級程度じゃモデルの中身とやらを理解できない件 >>228
いちいち頭悪いな。最低でもその程度の教養は必要だって話で十分とはいってない。統計を理解するに越したことはないというだけの話。こーゆうアホが国会で下らん質問するんだよな >>228
頭の悪いレスはもういらないから。負け惜しみで下らんことほざくなよ? まーた無駄な知識の話してるw
そんなもの必要性皆無なのにw >>216
同意。分からんと困りそうなのはベイズ理論くらい 普通に分析してればべイズになってるから
気にしなくていい Tensorflowを32bit windowsにも対応させてほしい 必要ないよ、チートシートみて適当にやるオペレーターだもん。 色んな知識を持っとく事は大事だと思うんだよね
上で出てる統計の知識にしてもドメイン側の知識にしてもさ
時間が取れるなら勉強すれば良いと思う
絶対無駄にはならない
ただ仕事だと悠長に出来ないからとりあえずライブラリ使いにとどまってしまうのも分かる 就職した時点で決まってしまうかね。
ステップアップ出来るのかな 日本では外資を除けば今いる企業より上位の企業には転職できないルールがあるので無理 keras使い初めたけどチュートリアルから進めない
なんだこれ難しすぎるゾ ルールねえ。yahooとか気にしなそうだがどうなんだろ >>202
>Neural Compute Stick 2
GPUと比べてコスパどうなの? >>248
yahooのヤクザ感半端ねーから。あそこはやべーぞ。 国内企業は通年採用だろうが賃金の面でも概ね外れ
実力あるなら外資一択 >>249
単純にコスパだけならGPUかと。
小さく省電力ってところに価値があると思っている。 あくまで貧弱なIoT機器の計算資源を補強する用途だろう せっかくlstmでやってたのに
構文木をだっさく取り入れちゃってどや顔してる日本人研究者カッコ悪い
transformerみたいな発想を産み出せなかったのが残念 日本の学術会だと新しいものは評価されない(できない)から仕方ない
既に評価されているものを組み合わせるか、重箱の隅をつつくしかない 大学教授は縁故採用が多い。
公募は形式だけで募集する前から決まってる。
そんなコネ馬鹿教授ばかりだから
新しいものなど認める訳がない!
まず馬鹿だから理解できないし、
新しくて有効なものを認めてしまうと
己の地位低下を招くから。 講座のボスの言うとおりにしてれば丸く収まるからなw 飽きたらない優秀な人はみんな外に出ちゃう 工学系だとFEMの理論知らなくても解析できるしAIもそんなもんでしょ 自然言語処理系に強いツールを紹介してもらえませんか?
とりあえず、文書の分類や意味の解析などをやりたいです。 >>261
GUIのアプリがいいのかなんらかの言語のライブラリがいいのか詳しく >>262
プログラムを使って色々カスタマイズしたいので、ライブラリーがいいです。
TensorFlowの自然言語処理拡張ライブラリーみたいなものがあれば・・・ 結局、機械学習の専門家ではなく、データを管理してる現場担当の人間がマイニングするのが一番効率がよい
学生らに言いたいがデータサイエンティストなんてなるなよ。企業じゃ使えないから >>263
自然言語処理ライブラリが弱いのが tensorflow の弱点。
そのために pytorch が急伸した経緯がある 医療に機械学習などデータサイエンスを結び付けて、
効率的な医療を実現するような仕事をしたいと考えている学生ですが、
医学部医学科の学生が(医学の勉強はもちろんやるとして)統計や機械学習などを学ぶことに意味はあると思いますか? 医者なら統計は知ってそう。薬学では統計使いまくると思いますよ。
技術者に丸投げしないためにも勉強した方がいいとおもいまふ。
以上、雑魚エンジニアの一般論的意見でした >>263
本当にDeepな手法でやる必要がある話なのかをまず考えてみては
TF使ってるくらいだからPythonで書いてるんだろうしgensimで実装されてるアルゴリズムを試してはどうだろう
分散表現を作るだけでも役に立つだろうし 開業医なら効率的な医療だって何だって自由にやれるんだろうけど、勤務医なら組織が大きければ大きいほど相当偉くなるまでは裁量なんてほぼなさそう Coloboratory使ってる人いる?
TPU使えるから12時間限定でも問題なさそうだけど 花の画像から、花びらやがく、茎などの部位を機械学習で着色する仕組みを考えています
今は手作業で200枚くらい正解データがあって、
花びらを赤、おしべめしべを黄、がくを緑、茎を青といったルールで色づけています
花は身近なタンポポなど野草がほとんどで18種類です
データが圧倒的に足りていないのもわかっているので
特定の花だけに限定して正解データを手作業で作る作業もしています
文字・数字認識や物体検知の課題では、画像と正解ラベルをセットで学習させていますが
私の課題の場合、ピクセル単位でどこが花びら=赤、茎=青、といったデータも作る必要があるのでしょうか?
線画を着色するGANsの仕組みが近いかなとも思い調べたのですが、
着色範囲がぼやっとしていて、私の課題にはそぐわないように感じました
実現可能性が低いのは承知のうえで、こういった課題の場合
どういう仕組みが考えられるのか、お詳しい方アドバイスいただけたらうれしいです
スレ違いでしたらすみません >>276
セマンティックセグメンテーションでググれ >>277
キーワードとても助かります
やはりピクセル単位でラベル付けが必要ということでしょうか
道路の白線を教師なし学習でやってみたという事例も読んでみましたが
元画像の色情報が重要ということで、いろいろな色がある花の場合難しいかなという印象でした
とりあえずこのアプローチで試行錯誤してみます
ありがとうございます
>>278
精進いたします >>276
pix2pixでセマンティックセグメンテーションするのはどうだろう?
データが大量になくてもそこそこ出来る(200枚だと流石に少なすぎるかもしれないが) >>269
機械学習を活用しようとしている一研究医師としては、意味があるとは思う。
ただ未来ではなく現在の機械学習技術をベースに話をすると、有用な成果を出すためには
機械学習の知識より医療の経験の比重が高い印象。
現在の機械学習技術は活用できる範囲がかなり限定的なため、何でもかんでも医療データを
突っ込めば成果が出るというものではない。
学生なら趣味として機械学習の本のサンプルプログラムを動かしつつ、応用が利く臨床医
となるために医学自体の勉強をより頑張る必要があると思う。 >>281
ありがとうございます
単語で調べたところ、猫が含まれた画像から猫の範囲を抽出する、という事例を見つけました
セマンティックセグメンテーションともに、自分なりに少し時間をかけて理解に努めます あくまでメインは専門に重点置いたほうがよい
機械学習はサブ 統計学の拡張として機械学習の概論を知っておけばいいというだけ。
細かい技術を知る必要は無い。 点数が付くようになったらセミナー(よくある10万ぐらいで2日の講習)を受けて知識をつければいいんじゃね OracleやCADの講習なら100万overがデフォ アマゾンのレコメンドシステムが
未だにクソの邪魔ものでしかないのに
クソのような教材に決まってる。
まったく興味ない グレースケールの画像を転移学習させたいのですが、良いデータセットないですかね?
グレースケールのはMNISTくらいで他はカラーの画像のデータセットしか知らないのですが TF probability をやり始めたけどさっぱりわからん… どうすりゃいいのw angular なんか分からなくないだろw
>>296
pytorch のやつやれ angular momentum とは角運動量のことである 交差検証についてなんですが、例えばアイリスデータでSVMで3分割の交差検証した時(3分割の平均が)94%〜97%ぐらいばらつきがあると思うのですが3分割の平均をさらに100回の平均とかして評価するって感じでいいんですかね? >>303
研究とかで発表するときはどういう値を使ってるのですか? Microsoft Facebookの人工知能ツール「PyTorch」への開発協力
https://aitimes.media/2018/11/20/1080/ 例えばkaggleとかなら初めからトレーニングデータとテストデータが分かれててテストデータとの答え合せで数値としての精度を用いてます。
自分で1つのデータを用いて精度を出したいときに、データが少なくてテストデータの選ばれ方にかなり影響を受けるというようなとときにはどういう風な値を用いればいいのかっていうのが聞きたいです。 >>306
テストデータの選ばれ方によって予測精度が全然違うみたいな時です。 バイアス・バリアンスでグクってみな
過学習気味だと思う 扱ってるデータの性質上データ数が少ないのは仕方ないのです…
今書いてるコードなんですが、
sklearnのcross_val_scoreでcvパラメータに層化分割を渡してます。(StratifiedKFold(n_splits=3, shuffle=True)
これでfor文で例えば100回回すと3つセットのスコアが100個出てきますよね?それで3値の平均のさらに100個の平均って感じで評価基準にしてます。3つセットのスコアの分散がそこそこ大きいのは仕方ないと思ってます。
これで良いのですかね。 仮にだが、同じテストデータを入力したとして、都度異なる結果を得るかもしれない。
そうなら気にしない。 >>314
まんま俺じゃねーか!
まぁケース買い直して難を逃れたけどな >>314
そのアニメおかしくないか?
その方向にガッ!とかいってひっかかるかな? 確かに。
おれは疲れているんだよ。
おれはおかしくなってる。 初めて来たけど新しくて注目されてる分野だけあってスレも活気があっていいね 新しい理論ではないけど、
計算機の進化で計算できるようになったのと、
データ分析が役に立つことが認識された
ことが大きいと思う。
理論として21世紀に出てきたものは
ほとんどない。
DLなんて50年前の理論たし。 基礎理論は昔に提唱されてたけど、実際できるようになってからの進歩は目まぐるしいよ
alphaGoとalphaGpZEROには恐れ入った 基礎理論とハードのスペックが揃えばそれだけで使い物になるわけじゃないからな ディープラーニングのG検定ってどうよ?
公式テキスト買って読んでるわ。 G検定でバーニーおじさんのルールってのが出たらしいけど、ググってもG検定関連の記事しか出ない
バーニーおじさんの出所ってどこなん >>233
落ちた人と比べたら受かった人はそれなりに理解していることが判るだろ
2級に合格した人が1級の能力を持っていないとは言えないけど
2級の能力を持っていることは判る
何も受けていない人は何も判らない
ゼロかもしれないし1級を超えているかもしれないし
判断する側からしたら区間推定の範囲を狭めることができる 人工知能の検定とか効果あるのか?
情報処理関連の国家資格のほうが有益だと思うよ 試験を受ける・受けないは自由だが機械学習専門で仕事にしてるような人が2級すら受かる能力がないとしたら大問題 資格は座学だからなぁ
本当にAI実技が出来るのかと
どっちかというと「会社で○年間人工知能の実務してました〜」
のほうが面接受け良いぞ
あとコラボラトリーやっと動かせた
思ったより簡単だったが
アップロードが少しめんどいな テストでは記憶が試されるが
別に覚えてなくても読んでわかれば全然問題ないはず >>334
自分で判ってると勘違いや自己暗示をかけているだけかもしれない 暗記しなくても調べれば分かるんだからいいっていうのは稀にしか使わないような複雑な公式とかならそれでいいんだけど
例えば統計検定2級までのような基礎的な内容に関してはそれではいけないだろう DLの検定はサンプルみただけでイヤになった、
と理論の先生が言ってた。 RX480で機械学習したいけど
plaidmlが認識してくれない
openclってRadeonソフトウェアいれてるだけだと動かないとかあります? 優れたAI開発者とは何ぞやと問いに対して、
海外では、アルゴリズムを開発できる人、Kaggleで上位を取れるような分析者、に加えて、
課題解決の為にAIを実装できる人というのが入ってくるが、
日本企業は、要件定義と開発は別物だという認識が強いのか最後のが出てこない。
つか、提案できるやつを引き抜いてくれないので、
導入事例が豊富なモデルの二番煎じしか出来ないのはつまらん ユーザー側が技術者に要件定義させないからな
知能指数がだいぶん違うだから先方の業務に関してもある程度的確な判断できるってことがわかってない モデルをユーザー指定にさせてるの?
それはまずいだろ
俺は要求精度だけだわ >>343
流行りのAIを採り入れたいけど結局は保守的ということかね プログラム書いたことないSIerが作った要件に従って下請けプログラマーがコーティングするだけなんだよな クロスエントロピー誤差の値がマイナスってありえないよね
本の通りにDCGANくんで学習させたら識別器の誤差がマイナスになるときあるんだけど 知らないうちにクロームの翻訳機能進化してんな 機電系技術記事みたいな簡単な英語ならほとんど問題ないくらいに訳せてる >>353
これを見て、翻訳機能をオンにしてみたけど、
英語の方が頭に入るレベルだった gmailの翻訳はよく分からんが妙に悪い
開発周りのページは大分読みやすくなった ganの生成モデルがよくわからないんだけど
潜在変数から画像を生成するのとかどういうことなの? >>352
あった、あったw
確率で区別するって意見が大体だったっけ
自分もそれでいいじゃんって思ってた
リンク先読んでもよくわからなかったけど
そんな単純な話じゃないみたいだね ロジスティック回帰とかSVMみたいに境界決めたいけどそもそも正負両データがないと境界を知りようがないから難しいということ 最近お仕事で機械学習しなきゃいけなくなってkaggleとかで勉強してるんだけどなんかものすごくもやもやする
ブラックボックスをいじって結果だけ出てくるの眺めてまたいじって改良されたらそれで良しみたいな……
プログラミングの問題みたいにきっちり正解があるとか、システムにこういう機能が必要だからそれを満たすコードを考えるとかならすっきりするのさ
なんていうか正解に至る道を自分で見通せない気持ち悪さみたいな いやそもそも正解も無いか。そこが気持ち悪いのかな
100%当てるモデルとかできるならいいんだろうけど現実的にないだろうし データには固有の性質があって、それを長く扱っている技術者だけがそういうことを知ってる。 kaggleで匿名化されてるデータやってても知見として得られるものないよ。 kaggleはそのへんが問題なんだよね 100%的中させる必要などそもそもない
人間だってミスして例えばメーカーでの検査ミスなら不良品を流通させてしまう
機械学習システムによって人間より十分に精度や実行速度が上がったりするなら明らかにメリットがある
にも関わらず人間より圧倒的に少ないミスを過剰に問題視する方がおかしい
また、ミスの原因がはっきりしないのが問題だと言う意見もあるが人間のミスの方が
どう考えても原因は曖昧であり、現在導入されている機械学習システムは所詮回帰分析を複雑化したものに過ぎず、
その係数を正確に知れる分だけよっぽど論理的に説明ができる 工業製品の検査は不良率○%以内って厳格に決められてるよ。 ヒヨコの雌雄は分からいけど猫と犬の見分けには自信あるぜ 我々はまずゴミの分別をちゃんと出来るようにはならねば。渋谷区45種類らしいぞ >>361
時間があれば
確率論→統計学→機械学習
と進めるべきなんでしょうね。
でも今どきはいきなりPythonですからね。
ま、客も分かってる人いないから。
もやもや解消には仕事を辞めて
6年間ほど死ぬほど勉強する必要あります。 医学部に受からんと、それに年寄りはマイナス加点だからね それらプラス
信号処理、システム同程、現代ロバスト制御、カーネル法、統計学、情報幾何あたりやっときゃよい だいたいの人がれべすぐえ積分です挫折するだろうけど >>381
測度論的アプローチは万人に必要ですか? 機械学習に数学は必要なし
したがって測度論など機械学習には全く必要ない みんな使ってるPCのスペックってどんなもん?
ボーナス入ったし買い換えようかと
今はi5、SSD128GB、メモリ8Gの学生用みたいなスペック >>387
法人向けはずっと上のものがある
dellのprecision tower7000シリーズとか
corei9がショボく感じる >>384
だな
野球やるのに、バットを作り方を知る必要はない ルベーグ分かってるけど機械学習には要らんなってことなのか、ルベーグ分からんけど機械学習で特に困ってないってことなのか 完備な距離空間作るために測度論が必要ってとこだけ理解できればもう要らない。同様の理由で確率論も要らない。
あと入りそうなのは確率微分方程式とかるまんふぃるたぐらいか。まあ、後者はリースの表現定理を理解できれば十分。 カルマンフィルターを知ってる俺って偉い、というところまで読んだ リースの表現定理は使いこなせるようになることをお勧めします >>393
横から訂正するよん
こんなことを知ってる毎月残業60hのエンジニアサラリーマンの俺ってば凄い 本当の一流なら例えば料理人だとラーメン作るのに小麦畑の土から拘るからな
単に腹を満たすためならそんなの不要だが本気でトップ狙うならそこまで考える必要がある 本当の一流は革新的で広く使われるモデルを提案できる人 そりゃイノベーターですな
そこ望むなら最低でも原理ぐらいは理解してないとだめやろね そんな難しい話は私には縁がありません
ひたすらお願いすることといえば、やさしい解析学ともっとやさしい線形代数の教科書を教えてほしい、ということです、ちなみに佐武で撃沈しています… カルマンフィルタとか必須な分野もあるから、統計学・数学必須かどうかは関わってる仕事による 日本のゴミのようなITの慣例に従うと、
AIエンジニアでさえ、統計も幾何学もマスターした40代のおっさんより、
専門学校でPython習っただけの20代の方が引き合いが多い。
人売りは必要なスキルなんて把握してないし そもそも派遣やSESで安く済ませようというような環境下で機械学習エンジニアを目指すこと自体が誤り 前処理で新しい特徴量作ったり、カテゴリ変数を数値に変換したりするじゃないですか
でそれを使ってモデルを構築するわけなんですけどこれなんで成立するんでしょうか
だってそれに対して入ってくるデータはモデル作成に使った特徴量は持ってないですよね
モデル作成って例えばa,b,cって3種類の特徴量があるデータとしたら
f(a,b,c)をコンピュータが内部で作ってくれて、だからそこに対象のa,b,cを持つデータを入れたら答えが返ってくる……みたいなイメージだったんですけど違うんでしょうか >>386
職場は自称データサイエンティストが
大勢いて、みなさん統計学に自信満々の
理系ばかりなんですけど、
実は全く分かってない人ばかりです。
あなたは分かってる?
統計学の論文は何本ぐらい書いてますか?
ま、客も分かってないから
いいんですけどね。 統計学の研究者になるわけでもないのに統計学の論文書く必要などない
赤青緑本が理解できていれば後は必要に応じて学べばOK >>409
前提となる条件がよくわからないが
>>なんで成立するか
a,b,cそれぞれの間に相関が無いベクトルに変換したからです。
相関が無いと判断される手法によって結果は異なる。
例えばPCAであればa,b,cの相関係数が最小になるように特徴量が分解される。
>>入ってくるデータは作成に使った特徴量を持ってない。
⇒???
言ってることがよくわかりませんが、前処理にて得られたベクトルに一度変換してください。 >>409の後半
>>f(a,b,c)を内部でコンピュータが作ってくれて〜〜a,b,cを持つデータを入れたら答えが返ってくる
⇒その認識で合ってます。
任意のA,B,C,D,E,F,‥‥ってデータ(ベクトル)があったとき、a,b,cに変換する関数を作成するのが前処理と考えたらよい >>418
なるほど‥最近
『データさいえんてぃすと』になるためのビジネス講座が流行ってるのですね。
受講による費用対効果は知らんけど。 >>421
答えになっていないぞ、検索もできないのか
データさいえんてぃすとってなに?
何ができるひと? >>421
対したこと出来ない人ってことはわかりました あと線形代数について、大学の一般教養より進んだところまでの学習をお勧めします。
特異値分解、ぺロンフロベニウス根などですね。
Google行列の話など面白く、なかなか応用性があることに気づくと思います。 対したことない人に負けないようレベルアップしてくださいな もう15年ほどデータ分析してますけど、
統計学や情報工学の知識が必要になった
ことはわずかです。
しかも基礎的な知識のみ。
客が理解できないことはできませんので。
専門家が増えて、分析の発注者側となってから、
専門的な知識が要求されるようになると思います。
それは20年先でしょうね。 データアナリシスとかいっても
仕事のほとんどはデータ抽出加工ドカタだからな
DA()w >>427
私は立場的にお客さん側の人間なのですが‥ 失礼。またずれた。
>>428
私は立場的にお客さん側の人間なのですが‥ 自分が低レベルの仕事しか任されていないだけなのを自ら晒して恥ずかしくないのかな 市場調査のヤツラとは関わったことがある
そいつらだったら大体どんなヤツラかは分かる
結構狭い業界だからな
そいつらはドカタからみれば客かもしれんが
その先にまた別の客がいる
その別の客をどこがもってるかだからな
当然ココで業界内での力関係の差はっきりみえる
超格差業界 まだ若い学生プログラマーには
学生のうちに知識と創造力の拡充をお願いしたいですね。
物事は簡単であるべきだが、簡単過ぎてはならない。 それなら結果出せなければ最低賃金レベルしか出ないけどな 外資の知り合い居るけど最低賃金なやつ聞いたことない。みな並以上 と日系の社長が申しております。
って返す方が気が利いてた。スマン ずっと平凡であるか、価値のある人間を目指すかの違いと思います。 わざわざ賃金水準教えてくれる時点で世間相場と比べてある程度自信ある人であるという偏ったデータしか計測できていないんだよな そんな呼び方が出来てたのかw
チャートみたいな存在になってんだな 行政機関はExcel形式での統計情報の配布をやめてほしいなあ。
XML形式かCSV形式で一般公開してほしい。 初心者でkaggle始めたばっかなんだけどさ
機械学習始める前のイメージだと生のデータをとにかく突っ込めば後は機械が判断してくれると思ってた
でも生のデータの欠損埋めたり、関係性を調べて新しい特徴量作ったり、なんか泥臭くない?
人力の部分が多いんだなってちょっと萎えてきてる。もっと何かすごい技術なイメージだったのに >>448
no free lunch定理という、どんなデータでもうまくいく万能のアルゴリズムは無いという定理がある
だからそういうデータに特化した処理や、特性に合ったアルゴリズムの選定といった泥臭い事をしないと精度が出せないのは仕方がない ディープラーニングや機械学習の数学って
中学生レベルでは無理? >>424
長谷川浩司先生の「線形代数」に載っている。 そもそも、最近の中学生は統計学も幾何学もしないんでしょ? >>453
別に大丈夫
微分積分と言っても結局はモデル構築が主なので、
そこまで深く知らなくてもよい
最小二乗法とかも言葉の意味知ってれば大体理解できる。後は関数に放り込むだけだし >>456
線形の方が微積より必要。マセマ でもやれ。 要らない派からマセマ派、ルベグまでやれ派と入り乱れてますな 仕事でデータ分析するには
数学は、ほぼ必要ないね。
理論的なこと聞かれたのって2、3回しかないし。
ただ、その2、3回聞かれたときに
ビシッと答えたからずっと高い報酬貰えてるんだと思います。 >>464
たしかに、利用する対象や場面によって、
その重要性は変化するから
一概にどちらといえないでしょうね。 >>447
excelからCSVやXMLに変換するのなんて簡単にできる事じゃね?
受け取る側は色んな人がいるんだからその中で多くの人が慣れ親しんでいる形式を採用するのは判る Excelはねえ。見た目優先で作ってセル結合やらされると、行によってカラムがズレたりして自動化出来なくなるのが問題なのよ Excelを一旦画像にしてAIで処理させた方がいいかもね? 初歩的な質問で申し訳ないんだけどディープラーニングの活性化関数って何のためにあるの?
階段関数は分かる。0か1の2択にしたいんだなって
でもシグモイドやrelu(の0以降)は連続値じゃないですか。なら入ってくる値をそのまま使っても何も問題ないんじゃないか
わざわざ関数に突っ込む意味あるんだろうかって思うんですよ 非線形関数に代入しないと線形変換しかできない。
行列の積と和を繰り返しても連立一次方程式にしかならんのだよ >>472-473
お二方の言ってることが全く理解できないので自分にはまだ早いことは理解できた
前のノードの値×重みを足し合わせたものを次のノードに送るくらいの認識しかないので線形だの連立方程式だの微分だの何が関係あるのだろうレベル >>472
>行列の積と和を繰り返しても‥
んなこたーない このへんが簡易な本を嫌うべき理由ですね。
簡便な例でもって納得した気になってしまう。 >>457 たとえば理論では絶対値たが、計算量を少なくするために二乗に換算すればいいとか、
私が知る範囲の機械学習では見ないけど、たとえば微分方程式を使うなら可能な限り級数展開で近似してから解く、とかじゃない?
機械学習の理論は東大、京大生に任せておくとし、私のようなヴァカは理論に突っ込んで課題をクリアするために、数学よりc++だな。pythonのほうがライブラリあって良さそうだが、産業用途では使えんからなあ。 高専のとき選択でニューラルネットワークがあってなんに使うんやと寝てたけど、いま普通にデータ突っ込んでるな。
いまいち検出器の選定がわかんないんだよな。入力データのバラツキとかの性質と、検出器の数学的性質を結びつけれる脳みそがあれば、どういう前処理をすべきかわかるし、捗るんだろな pythonだと産業用途で使えないという理由が分からないけど学習結果の利用という意味なら例えばtensorflowは言語依存のない形式で学習済みモデルを保存できる
というか機械学習フレームワークで検索上位に出るようなものならほとんどは言語依存ないフォーマットで出せるはず 〉〉480
たぶん研究段階ではpythonでいいけど、製品レベルに実装する場合は、
pythonではなくc等が主流だから、「製品開発者等では」ってことを
言っているんじゃない? モデルと実データをライブラリに食わせるCコード書くだけでいいのちゃう pythonのコード隠蔽したいのかな。
pythonを暗号化してテキストでもっておき、C++のプログラム内でメモリ上に復号、python本体に送ってキックするってことはできるよ。
メモリを覗かれてしまったらアウトだけどね。
pythonを完全に隠蔽したいならクラウドじゃないとできないな。 >>481
製品って具体的にどんなものかによる
組込的なものだとそうかもしれないけど
サービス的なものだと関係ない 基礎はやりたいフィールドのテッペンを概観でるレベルで十分
そこで大きな壁が何枚もある事を把握してから必要な基礎を潰していく
いつまでも基礎基礎いっててなかなか前に進まないのが日本教育のだめなとこだな
みんな染み付きすぎて疑問にもおもってない テッペン見てから必要なだけ降りたらええちゅうことね >>485
やりたいフィールドに限定すると、他分野の視点から見えるものも見えなくなる AIを使いたいんじゃない。
茄子の仕分けがしたいのだ。みたいな >>483 そこまでする人は最初からCで書くだろう。 >>490
名刺の会社にGrandmasterが2人もいるの不思議だよな
GAFAとかヤフーとかメルカリに行けばいいのにと思うけど、開発環境が魅力的なのかな >日本人の名刺なら「98%の精度で種別を判定できる」
う〜〜〜〜ん >>492
> 2020〜2021年ごろをめどに実用化を目指す。
はいはい >>490
この人なんで名刺に拘るんかな
他業種でも引く手あまたやないの >>499
給料良かったか、社風が合ってたんじゃないかな
勤務時間に勉強出来るとかじゃないとすぐに陳腐化してしまう 転職はIT系の中でさえあんまり遠くに行けないんだよ kagglerはGrandmasterになると目標がなくなって弱くなる説ある ディープラーニングで、ロト6等の数字選択式宝くじの予想をやる場合
過去の全ての当選数字のデータを
多分、教師なし学習をさせて
AIが自動で特徴を見つけて、次回の当選数字を予測させることをやりたいのですが
どんなアルゴリズムが最適なのでしょうか?
画像認識の場合はCNNですが、次回の当選数字の予測は?
よろしくお願いします。 こんなところで聞かなくてもググればLSTM使って予測してるの出てくるだろ 毎年の当たりくじ番号なんて互いに相関が無く、独立な事象過ぎてやるだけ無駄と思われる。それでもやる? マジレスするとrand()が最強
DNNと同等の精度が出る >>507
それな。
だが、本当に乱数なのかな?
乱数の検定が圧倒的に否定されたので、
誰かが当たり番号を操作してると思う。 ロトの乱数生成の手法調べたらいいのか
意外と運用適当だったりしそう 乱数生成が多少適当だったとしてもあからさまに偏ってるわけじゃないんだから儲け出すにはかなりの大金注ぎ込む必要があるだろうな 乱数はパチ台チェックしたりで意外と扱い馴れてる可能性も MT使うほどのことない
Xorshiftで十分
LCGsはウンコすぎてダメ XBoxというゲーム機で出たカルドセプトというゲームがあってのう
疑似乱数の質が低すぎて専門学校生が作ってるんじゃないかと疑われたんじゃ >>503
番号決めるのがサイコロ振ったりしてアナログな方法だったら
効果がないのでは?
コンピュータでやってるならチャンスあるかも 的がぐるぐるまわっていてそこに矢を射る機械を複数並べて決める 昔ロト3でなんとなならないか試行錯誤したなw
なんともならなかったけど。 123
431
137
だと「1」はジグザグに出やすく、
「3」はなだらかなカーブを描いて出現する、みたいな攻略(笑)方法があって
これを勉強する時間でバイトでもした方が良いな、と子供心に思ったものです 抽選機は電動攪拌式遠心力型抽せん機(愛称:夢ロトくん) >>525
この流れギャグだと思ってたんだけどまさか真面目に考えてたの マルクス経済学の学者の世界では
Aという現象が出て戦争が起きた
よってAが出ると戦争がが起こる
だから、Aを出すことを阻害しよう
という単純な考えが通用するみたい
それで博士等取れる確率が高いようなので
チャレンジしてみたらどうでしょう。
確率が念頭にないのに、博士号の確率は念頭にある
面白い世界です。 相関関係と因果関係をしっかりとわけないといけないのだ >>530
確率考えてないから因果にもならない
想定するのは、単にそういうことがあったというだけ 帰納法のプログラムの世界では起こりえないだけど、
因果関係と相関関係の混同は世に溢れている しかし、おまえらアフォだな
因果関係だと?
笑えるw >>530
>相関関係と因果関係をしっかりとわけないといけないのだ
そして次のことも理解しておくことですね
「因果関係の認定は主観的判断であり独断や偏見と何一つ変わらないこと」 因果関係を証明したければ実験すればいいだけのこと
原因だと推測したものを動かして予想通りに結果が変わればok >>541
相関関係を持つものについても、片方を動かせばもう片方も予想通りに動くのでは?
>>541 の方法では相関関係と因果関係を見分けられないのでは? コンビニ店舗数と人口密度に正の相関があったとする
何もない山奥に強制的に大量の人間を住ませればその人口密度に応じてコンビニが入ってくるだろう
しかし逆に誰もいない状態で山奥にコンビニ建てまくったとしてもコンビニ数に応じた人間が引っ越してくると考えるのは不自然だろう
つまり上記が正しい場合、人口密度→コンビニの因果関係はあるが、コンビニ→人口密度の因果関係はない
Aを変えればそれに応じてBが変わる時に因果関係があると言い、必ずしも逆が成り立つとは限らない >>544
因果関係知りたいのは原因を操作することで結果変えたいからで、そもそも原因を操作できないものの因果関係を知っても使い道なく自己満足で終わり >>543
>何もない山奥に強制的に大量の人間を住ませればその人口密度に応じてコンビニが入ってくるだろう
>しかし逆に誰もいない状態で山奥にコンビニ建てまくったとしてもコンビニ数に応じた人間が引っ越してくると考えるのは不自然だろう
それは「人口密度が最初に設定される」→「設定された人口密度に従ってコンビニ密度が決定される」
という因果律を先に読み手に想定させた上で話をしている、という意味で、先入観に囚われた推論でしかないのでは?
二つの数量的関係に相関があるかないかは統計処理を行えば客観的に判断できるのですが、因果関係は、我々の主観的判断=独断と偏見、が含まれているのです
独断と偏見、といういいかたはちょっと極端に偏っているかもしれませんね、因果関係、というものの見方そのものが、人間が進化していく上で獲得した思考の「癖」なのでは? >>542
目的の値をコントロールしたい
それを達成できるなら
本当の原因じゃなくても許容範囲じゃね >>548
なるほど
では因果律なるものは虚構であるのに、人はどうして因果律を設定して、例えば人を説得しようとする、とかするのでしょうか? >>547
車のアクセル開度の値と速度の関係は?
時間的にアクセル→速度になっている
アクセル開度が原因で速度が結果じゃね
人間が車を押したら速度は上がるけどアクセル開度は変わらない
速度→アクセル開度の因果関係はない >>549
虚構ってどんな定義?
因果律が虚構っていうのは本当? >>551
因果律は「人が因果があると決めたもの」という意味で虚構あるいは集団幻想みたいなものかと
>>550
「アクセルを踏むと車の速度が増大する」という因果律を人が決めたのではないですか?
客観的な言い方を追求するのならば「アクセルの踏み込み度合いと車の速度とは r = 1 の相関関係があります」にとどまるべきで、それ以上のいいかたは、主観が混じっているのです、純粋性を追求すれば、そういう結論になるかと >>554
根底にあるのは自然科学の法則じゃね?
法則が複雑に影響しているけど >>554
表現の方法は別でも可能だけど
法則自体は存在する
つまり因果関係と言っている
原因と結果の関係は存在する
あなたが言っているのは表現の方法が人間の決めた方法だ
と言っているだけ
表現の方法を変えても良いけど
他の人と知識を共有したり議論するのに不便 >>556
>>557
「自然法則」とはいいますが、実は確率的な表現しかできないことが現代では判明しているのでは?
ニュートン力学等は一見確定的、未来予言可能的だけれども、それはニュートン力学は近似でしかないためなのでは?
>>557
>法則自体は存在する
観測者によって変化するものを「存在する」といっていいのですか? >>559
で結局言いたいことは何?
因果関係が人間の解釈だとして
その結果何か有益なことがあるの?
観測者によって確率的に結果が変わる→存在しない
とは言えない
存在の有無とは無関係じゃね?ら >>559
>「自然法則」とはいいますが、実は確率的な表現しかできないことが現代では判明しているのでは?
初耳ですね。
何の記事ですかそれ? 会社でよく構造解析/磁界解析を行ってますが実物との精度はかなりよいです。
大学時代は多体原子シミュレーションの第一原理バンド計算やってましたが精度が悪いなんて思ったことないですね。
マクスウェル方程式やシュレディンガー方程式が自然界の法則から外れてるとは思えません。
自然界の法則ってこの流れでは何のことを指してますか? >>559
それはニュートン力学が適用できるのはマクロな領域だけである(ミクロな領域では量子力学が必要になる)、という問題であって自然法則全般の問題ではないと思われ お前らF検定とか使わんのだろうね
わかりきってる専門用語?
そうだよね! 量子力学使って確率的に扱わないといけないのは10^-34のオーダーのプランク定数が無視できない量を扱う時であって、
メートル単位やキログラム単位程度のスケールのもの扱って有意水準1%とか5%とかに設定しておきながら量子力学を気にしても誤差と区別できないので全く無意味 頭が良すぎるバカの典型
計算過程を楽にするために近似するなんてことはザラにある
近似が嫌いならロジスティック使わず全部ガウスでやれ そういうの頭が良すぎるって言わないしw
単に知識が扱いきれていないだけだな。 元々の>>542での相関関係と因果関係の話に戻せば、>>543の通りに強い相関関係があるからといって
必ずしも一方を変えれば他方が変わるとは限らないことは事実というか自明なので議論の余地はない 訪日外客数出典:JNTO
梅毒患者数出典:NIID
訪日外客数 梅毒患者数
2006 7334077 112
2007 8346969 162
2008 8350835 205
2009 6789658 196
2010 8611175 173
2011 6218752 248
2012 8358105 297
2013 10363904 419
2014 13413467 507
2015 19737409 1044
https://i.imgur.com/S5JIrCq.png
r=0.958533469
で、因果関係()があんのかどうか見分けてみろよ 2変数しか出さないんじゃ相関以上のことは言えないね 因果関係ってのは時間軸での変化なんだから、梅毒患者を増減させる施策を一切せずに強制的に訪日外客数増やして梅毒患者が増えるかの実験と、
訪日外客数を増減させる施策を一切せずに梅毒患者を強制的に増やしてから訪日外客数が増えるかの実験という時間軸情報を含む両実験をしなければ統計的には誰も何も言えない
ただし偏相関係数の絶対値を大きく低下させるような第三の因子を見つけられない限り、経験的には「訪日外客数増加→梅毒患者増加」の因果関係が自明なので
誰もそんな調査・実験には金を出さないだろうから経験的に得た因果関係が成立すると考えるしかない レベル低い質問で申し訳ないんだがPythonで画像認識をしたいんだがネット上での画像収集ってどうやったらいいんだ?例えば、猿の画像が大量に欲しい時に猿ってうったら猿の画像データを大量に保存できるようなものってどうやったら作れるんだ? >>572
女性より男性のほうが圧倒的に数が多いということは
女性のほうが男性よりもたくさん複数の異性と性交渉を行っているという結果ですね。 >>578
Googleの画像検索APIを叩くのではダメか? y=t*sin(t)にて
yとtの相関係数取っても相関係数が小さいのだが‥
これは相関ないと言ってよいかどうか(笑) >>583
それはあくまで"ピアソンの"相関係数の話
ピアソンの相関係数は線形な関係を見出すために存在しておりそれは定義を見れば明らか
非線形なものを扱いたければ良さげな物を探すか新たに作るしかない >>577
>「訪日外客数増加→梅毒患者増加」の因果関係が自明
因果関係ではないですよ、あくまで相関関係だけですね、因果関係をいうのであれば、訪日客の増加が梅毒患者増加に直結する理由が必要です >>562
>マクスウェル方程式やシュレディンガー方程式が自然界の法則から外れてるとは思えません。
うらやましいですね、マックスウェル方程式の方は理解できますが、シュレーディンガーはさっぱり理解できないです…
>自然界の法則ってこの流れでは何のことを指してますか?
私はニュートン力学を念頭においていましたが他の方はどうでしょうか? >>585
訪日した人が梅毒に罹っていて
その人から感染した
という仮説は考えられる >>588
因果関係を示すにはRCTとか、せめてRDデザインとか考えよう >>585
訪日客の増加が梅毒患者増加に直結する理由が欲しければ「訪日外客数増加→梅毒患者増加」の因果関係があると仮定してそのためのデータが得られる調査をすればいいだけだろ
>>574だけではこれ以上のことは言えないんだから因果関係が示したければ新たな調査をするしかない >>589
それはこれから原因となる事象を操作して
効果を確認する事ができる場合には有効だろうけど
過去のデータとか
原因となる事象を操作するのが難しい場合には使えないんじゃね?
訪日客を選別するの? >>591
そだねぇ、選別というのもありかな
自分がやるとしたら分解能あげて
県ごとの外国人の増減との比較かな >>592
選別は政策上実現が難しいんじゃね
観光客を増やそうとしている
観光客は移動するけどな G検定の公式テキストのアマゾンレビューひどいな。
これは詐欺に近いのでは?
このテキストだけでは合格できないよ。 >>583
データの前処理としてarcsinをかますと良い結果になるよ 都合のよいものにフィットするかどうかは始めはわからなくね? データを確認する前から適切なフィット関数など分かるわけがない
直線フィットすべきなのか曲線なのか、曲線だとして高次多項式で表すとすれば何次が適当なのか、
そんなことは実際にプロットなどして可視化したり次数を変えてフィッティングした結果の汎化性能を比較したりしない限り分からない JDLA初の“公式”テキストで、ぜひG検定合格を目指してください!(目指すのは個人の自由)
試験を知り尽くした著者陣がディープラーニングの基本から解説。練習問題付きなので、試験勉強に最適です。(実際の試験に出題されるとは言っていない)
この1冊で試験対策ができる!(合格できるとは言っていない) >>599
AIはG検定という試験があるんだ。
F検定の上を行っちゃうな。 まあ言いたいのは未知のデータから相関を語れないという話ね>>584>>595
サンプリングが等間隔でなかったりするとy=t*sin(t)ですらフィットは難しい
場合によっては無相関と断言するやつすらいる >>603
ん?
何のことを言ってるのやら。
具体的に言うてみ? こういうどうでもいい検定が出てくると
この業界も終わりかなーって思う
理事長 松尾 豊 東京大学大学院工学系研究科 特任准教授
理事 井ア 武士 エヌビディア合同会社 エンタープライズ事業部長
江間 有沙 東京大学 政策ビジョン研究センター 特任講師
岡田 陽介 株式会社ABEJA 代表取締役CEO
岡谷 貴之 東北大学大学院 情報科学研究科 教授
尾形 哲也 早稲田大学基幹理工学部表現工学科 教授
川上 登福 株式会社IGPIビジネスアナリティクス&インテリジェンス 代表取締役CEO
草野 骼j 株式会社ブレインパッド 代表取締役会長
佐藤 聡 connectome.design株式会社 代表取締役社長
南野 充則 株式会社FiNC Technologies 代表取締役CTO
渡邉陽太郎 株式会社PKSHA Technology
ろくなメンバーいないじゃんw 因果関係を見つけるために、何かのデータと何かのデータを
用意しなきゃならないが、時間は無限にあるわけじゃないし
データも集められるわけじゃない(例えばすでに破棄した過去のデータは分からない)ので
結局今は人間が関係ありそうなデータ、もしくは集めることが可能なデータを
持ってきて因果関係があるか?を検証する作業になってしまってる
「因果関係を見つける」のではなくて「因果関係があるか?」の検証になってしまっている。
そして因果関係がありそうと人間が判断するものはやっぱり因果関係があるわけで
人間が計算式作ってやってもそこそこ精度は出る。
未知の因果関係を見つけるのには相当時間がかかる。
つまり何が言いたいかというと、機械学習でメリットが有るかどうかは運次第だし
データに因果関係があるとわかっていても、それを集めるのには時間(コスト)がかかるので
機械学習やってビジネス的に儲けがでるかはトレードオフの問題に落ち着く
当たり前だけど銀の弾丸じゃないんだよね。
数年後には、宇宙の中から新しい星を探すように「因果関係があるもの」を探す人たちと
判明した因果関係に関係があるデータを集める人・販売する人たちに分かれるだろう G検定の資格とったらslack招待されるっての聞いたから
11月に取ったんだけどslack招待されない…
誰か入った人いる? >>608
現役で活躍してる人は忙しいから仕方ない E検定って受験資格が教会認定の講座修了者で
ちょっと調べたらその講座が30万円とかなのな
インチキ臭え >>609
機械学習の学習結果の妥当性証明に因果関係の証明が常に必要なわけではないぞ
よくある画像による製造品の不良判定なら因果関係なんて気にする必要ないし >>613
それも製造品の形や重さが他と違っていたら不良ってことだろ?
でも物によっては形や重さが違っていても不良とは限らない。例えば料理とか。
人間がこの製品は形や重さが違うなら不良と考えるから、
形データ(つまり画像)や重量を入力としてるわけで
結局それは人間が因果関係を判断して入力データとして与えてる
機械学習でどれくらい違っていれば不良とみなすかを機械で判定できると思うが
人間が○%と値を入力してもそれほど大きな違いは出ないだろう
それに最初は人間が、これはOK、これはNGって判断する必要があるだろ?
まあOK、NGと判断する作業は今も人間がやっているわけで、
機械学習のための追加のデータ取りのコストはかからないと思うが
なんていうか、そんだけだよねーって感じなんだよ
新しいものを作るっていうよりか、単に精度を上げるための
データ入力者になった感じで、面白みがない。
技術は完成されいて、あとは道具を使うだけ >>616
迷路を解くアルゴリズムはとっくの昔にあるよ・・・ 最適化の対象としてうまく数式に落とし込むのはまだ人間の役目だよね >>608
使えなさそうw
ろくでもないラインナップだなw kaggleのタイタニックで勉強していざ他のもやってみようと思ったんだけど
カーネルでほかの人の見ないことには何も手が動かせない
どこに着目してどういう特徴量作ったらいい、どのパラメータでどんなestimatorを使えばいい
そういうのがまったく思い浮かばない
生データ渡されてまずどこから手を付けるみたいな方法論勉強する方法orいい参考書ないですか
こういう処理をするにはこういうコードとかそういう本はいくらでもあるんだけど >>608
見事に馬鹿ばかりだな。
資格ビジネス狙いのクズ朝鮮人ばっかw >>614
別にあなたが面白いと思わなくても
役に立つならそれを使う人には価値がある
あなたはあなたが面白いと思うものをやれば良い
他のことがあなたにとって面白くなくても
あなたがやる事は変わりない
他にケチつけずに好きにすれば良い >>620
与えられた課題に対して解決方法が知りたいなら、キーワードはモデリングかな
ある程度考え方の基礎がないとモデリングは難しい
勉強方法としてはKaggleとかの方法をそのまま別の課題に適用して、自分の引き出しを増やすことから始める
ある程度こなせるようになって、それでもまだ足りないなら原理を学ぶ必要があるので、統計学や時系列分析、ベイズモデリングのような入門書を読む
高度な数学まで勉強する必要はないけど、自分の言葉で説明できるくらいまでは理解と経験が必要 kaggleで言うなら、機械学習のアルゴリズムより典型的なアルゴリズムの方が面白い 機械学習なんて正確性無いし、機会がやる必要ないよね 他人に説明しやすければ、メリットはデカイんだけどな >>622
役に立たないなんて言ってないよ。
ソートライブラリみたいなもんだなってこと
ソートしたいときにライブラリ使っておしまい
ソートそのものについて研究することはないなぁってこと 資格商法っぽい気はしたがG検定取ったわ
松尾研究室有名だし、転職のときに使えそうだから E資格もそうだけど、未経験者が意欲をアピールするのには使えるよ E検定は内容としては演習問題も含めてコーセラのディープラーニングコースに似てるかな
どうしても日本語で勉強したい人くらいしか需要無さそう 機械学習とかつまんね
数学当たり前とか言ってるけど、他の情報科学だって必要だし、気取ってんじゃねえよ Neural Ordinary Differential Equationsってどうよ? >>623
参考になりました。とりあえず量をこなすところからですか
しかしまいったなー明日プレゼンなのにろくなもん出せそうにないな >>642
参考書を忘れていました
月並みだけどPRMLは良い本ですのでKaggle等の課題と並行して読むのがよいと思います
日本語の訳本が出ていて「パターン認識と機械学習」という本です エロ系のデータセットってある?
モザイク消しを深層学習で出来るか試してみたい。 >>644
さすがにないだろ……聞いたことない
海外から無修正画像をスクレイピングしてきて自分でモザイク修正してデータセット作るしか データセットが洋モノに偏ってあそこだけ洋っぽくなりそう たしかにモザイクから復元するのに利用してる先行研究はあったはず データセット無いかー。今考えてる方法は
1.洋物無修正動画をVottでマンコチンコトレーニングデータを作る。
2.yoloとかで自動モザイク装置作ってモザイクを入力としたDCGANでトレーニング
3.モザイク認識ソフトを作ってモザイクを切り抜き、切抜き箇所を2.にかけて出力を元画像と合成
GLCICは学習コストが凄そうなのでできれば回避したい。他に良いアイデアあったら教えて >>650
サンクス、Partial Convolutionsというのがあるのね。
これだと複数のモザイク箇所にも対応できそうだね。 もしかして、マンコチンコトレーニングしなくても無修正画像をPartial Convolutionsでトレーニングすれば良いだけだったりするか?
光が見えてきた気がする >>658
人間の想像といい勝負
真実は誰も分からないのだから >>658
モザイクの向こう側にある真実を探求するつもりはないよ。違和感なくモザイクが消えればそれで良いと思ってる。
極端な話、機械が妄想して全員綺麗なマンコになってもいいと思う。 >>658
モザイクかけた時点で情報は失われているから元通りに復元するのは不可能
想像でそれらしく補うしか無い 荒くなってはいるが黒塗りとかじゃないんだし完全に情報失われてるわけじゃないでしょ 本物そっくりのCGでもわいせつ物扱いになったし
そのうちモザイクも違法になるかもしれんね
画像から欠けた部分を補完する技術はあるし
どうせそう遠くない未来に、動画の欠けた部分を
補完する技術も一般的になるでしょ?
「欠けた部分」を「モザイクパターンになってる部分」に置き換えるのも
そう難しいことじゃないだろうし、モザイクの部分を本物そっくりのCGに
リアルタイムに置き換える。その時に色情報を使用すればよりリアルになる
結局の所補完した画像はCGなのだが、CGがわいせつ物扱いになるしなぁ
より本物に近いCGを作れるモザイクから違法になって、
最後には黒塗りもアウトになるかもな。
ん?その流れで行くと、水着や下着もアウトかもしれん
今の技術で裸に見える画像(水玉コラ)を補完したらどうなるんだろうか?
流石に誰かやってるよな? よりリアルな補完画像画像(よーするにコラだなw)が
誰でも簡単に作れるようになったら、誰でもわいせつ物が作れると同時に
逆にリベンジポルノ流出とかでもあれはコラだって
言い張れるようになるかもしれないな
写真(そのうち動画)がなんの証拠にもならない時代 >>655
モザイクから元の顔に戻せるように見えてるけど
似顔絵捜査員とどちらがすごいんだろうかね
情報量自体は被害者の記憶を言葉にしたほうが少ないと思う
たったあれだけで、それなりの精度をだせるなら
訓練すればモザイクから元の顔を書く
モザイク捜査員が生まれるかもしれない! >>665
暗号化しなくても、モザイクでアップしておいて
あとは利用者が勝手にどうぞ。
なんてのが出来ちゃうわけだ。 機械学習とはもう無関係なくなってきたが、モザイクどころかなにもないところから
コンピュータが人工知能で作り出した本物そっくりなCGはわいせつ物になるんだろうか? 猥褻物判別AIは、生成されたCGに対して反応するわけだから
そのCGを生成するための元データ(=モザイク画像)を配布したら・・・?
未来もまだまだ、法律の抜け道と無理やりな法解釈のイタチごっこが続きそうだな >>668
本物そっくりだから、本物と区別できない
だから、本物かもしれない
よってわいせつ物
かな〜 >>658
著作権上は機械学習は人間の道具として扱われる
でも機械学習のコードを丸パクリした場合はほとんど定義されていない
この辺りしっかり決めておかないと非常にマズイ事になる気がする 漫画だってわいせつ物になりえるんだからCGもものによってはなるでしょう。 わいせつの3要件
徒に性欲を刺激・興奮させること
普通人の正常な性的羞恥心を害すること
善良な性的道義観念に反すること ワイ動画見ただけじゃ興奮しないんだが。猥褻物なぞ無いキリ 児ポだって大多数の人は興奮しないから猥褻物に該当するかどうかみたいな議論あるしな 猥褻物を描く機械じゃなくてモザイクを消す機械だから問題無いのでは?
消した画像を公開できる状態にしたら流石にダメだろうけど。 Winnyやマイニングスクリプトで検挙される国ですし winnyは開発者が捕まるのがありえなかったよなー
マイニングスクリプトはモバイルはマジでやめて欲しいぞ。電池無くなる
PCで一部リソース使うぐらいならいいけど 名前忘れたけど反転系モザイク解除ソフトも捕まってたな
あれもソフト作る側には問題無いのに 一般的なセキュリティの紹介記事書いただけでウイルス公開したことにされて有罪食らう国だし Winnyの件を考えると、モザイクを消す学習済みモデルを配布するだけで逮捕されそうだよね。
でもまあ学習前のソース配布は問題ない筈だから
(類似や同じネットワークモデルを利用した他のソフトも違法になるため)
学習用無修正画像を自前で用意できればなんとかなりそうではある。 何らかのサービスを提供する場合は海外鯖に置いていても運営元が日本にあると判例上アウトだよね アルファ碁の深層学習の仕組みについて
わかりやすく教えて下さい。
従来のようにモンテカルロ木探索も使われているのはわかりますが
深層学習をどう利用しているのか、いまいちよくわかりません。
深層学習は、画像認識ならわかりますが
これをどう囲碁に利用しているのかイメージが出来ません。
この点をわかりやすく教えて下さい。
よろしくお願いします。 kernel読んでたらデータの標準化って出てきたんだけどこれやってもいいもんなんですかね
たとえば[1, 2, 3, 4, 5]だと[-2, -1, 0, -1, -2] / √2になるそうで
でもこれだと例えば最後の要素が最初の要素より4大きいっていう情報は欠落するじゃないですか
データの絶対値って重要じゃないんですかね >>685
DMMだかfc2の無修正エロサイトは日本語で紹介してるから日本扱いでautoって無茶な判例だった それは標準化の仕方が間違ってる
[-2, -1, 0, 1, 2]/√2
が正しいから大小関係は残る >>687
よくある標準化は学習データを平均=0、分散=1にしてその時に使った係数を残しておいてテストデータにも適用する
分散を変える以上は差の絶対値が変わるのは仕方ないが同じ係数をテストデータに使うのが重要で、結局同じ比率で調整されるので問題はない >>680
> winnyは開発者が捕まるのがありえなかったよなー
winnyは開発者は、考え方が厨二だったからなぁ
この世界は腐っている。一度滅びなければいけない。
新世界を作るために、私は滅びの道具を作った。
だからな。
世界を良くする道具を作ればいいのに、
なぜか滅ぼす道具を作って「お前らあとは頑張れ」だもんなぁ。
あんなんだからWinnyは何も変えられなかった。 生きてたら仮想通貨やってただろうな
まああれも結局マネロン用途だろうからまともではないか ソフトイーサはいいところ攻めてるような。捕まらないような持って行き方は色々あったろうに ソフトイーサは単なるVPNじゃん。OpenVPNと変わらない このブログの人の勤め先ってNTTデータとかCTC?
http://biz-and-deep.hatenablog.com/entry/2018/03/01/001228
外資系じゃなそうだけど、
この頻度で新規AI案件を取ってきて回してる大企業って思い浮かばない >>698
NTTデータじゃないと思う。こんな下流は回らない
にしても日本はIT関連の営業レベルが低すぎる。
*やばいエンジニア
以下は本気でヤバイ ここに書いてある中で、一つだけ賛成できないのは
データ(分析対象になるデータ)の件。
それこそ、生の形でデータを受取り分析者側で加工から
やることが私は必要だと思っている。
そもそも顧客のデータを信じるところから始めてはいけない。
今は、ネットのデータだったり、データが集まりやすいし
さらにデータベース化されているケースが多い。
それに甘んじたまま分析に入ろうとする人が多いのは
私は疑問。 >>700
どれに対して言ってるのか知らないけど
機械学習はデータをコンピュータを使って高速に演算するものなんだから、
データが重要なのは当たり前だよ。
でも "機械学習" ではないけどね。俺が機械学習に興味が薄いのは
結局最後にはデータをどうするか?の話になってしまうのがわかってるから。
機械学習のアルゴリズムがーではなく、○○データを加えることで精度がー。とかいう流れになる
行き着く先は、データの売買ビジネスだよ。
今はデータが有るようで無いからね。
例えば売上データはあるが、あるのは売上データだけだ。コンビニとか
年齢層入力してる(してた?)が曖昧だし、ポイントカードで情報抜き取る必要があるが
全員抜き取れるわけじゃないし、別の店で買う場合もある(つまり売れるはずの商品がわからない)
精度をあげるためのデータがわかってる。だけどそれらを集めるには
他社と協力していろんなデータを集めて統合しなければいけない
個人情報の保護がある時点で難しいし、ライバル会社と協力なんかしないだろ?w
となると第三者のデータ売買会社からデータを買うことになる。
その始まりの姿がTポイントカードだろう >>700
> 今は、ネットのデータだったり、データが集まりやすいし
> さらにデータベース化されているケースが多い。
ぶっちゃけ無いよ。
データベースの用語風に言えば、今データベース化されてるのは
マスターデータ。機械学習で必要なのはトランザクションデータ
トランザクションデータはほとんどデータベース化されていない
せいぜい自社の過去のデータが、必要最小限だけ残ってる程度
大企業以外、統計的に役に立たない
(正確に言えば人間が予測した精度と大差ない) >年齢層入力
元コンビニバイトだけど、忙しいと全部「10-20代」を叩くのが当たり前。タバコと酒でエラー出るからな
忙し店は若者向けで入力してる可能性が高い、というか当たり前 >>701
そういう話をしたわけじゃないんだよね。
残念ながらデータは足りなくてあたりまえだから。 >>703
そうですね。
その問題はもう25年前から出てきている話題 >>703
そうそう。信用できる過去のデータは少ない。
そういう意味でも「今はデータが有るようで無い」
データが間違ってるんだから、そこから学習しても間違った答えになる
まあ結局は確率でしか答えが出ないんだから、
ある程度は正解するんだけどねw
で、精度をあげようとすると、データの質がーって話になって
正しいデータを入力するよう徹底してくださいとか、
修正できるなら修正してくださいとか(例えば明らかなタイポとかなら修正できる)
そういう話に行き着くので、つまらねぇなぁと >>706
そうなんです。
それを知るためには、まず本当の生データを分析するところから
はじめないと、ならないんですよ。 >>702
>大企業以外、統計的に役に立たない
>(正確に言えば人間が予測した精度と大差ない)
それ自体の分析から始めないとあかんのよ
それを使えるようにしてゆくのが仕事 機械学習の有用性はラプラスの悪魔がだけが知っている >>708
分析までは良いんだよ
これぐらいの精度でした。おしまい。
という仕事なら
実際には精度の向上が求められ、人間がやるよりもいい結果を
得られるようにするのが目的。
仕事でやる場合は、これぐらいの精度でした。
もっと精度をあげるにはどうすればいいですか?
と話が続く
つまらないのはそこからだね
重要で大変だけど、人海戦術でつまらない作業の始まり AIが本当に人類を超えるなら、そのゴミデータもaiも捨ててくれるんだけど
それはもう・・・ >>710
>分析までは良いんだよ
>これぐらいの精度でした。おしまい。
>という仕事なら
な、あほな 異常値を通常は起こりえない値として捨てるべきか、
それとも一回だけだが攻撃された形跡があるぞと重要視するか >>712
だから、そこでおしまいじゃないから、
あとはつまらなくなるって言ってるんだよw
機械学習とは関係ない作業の始まり どういう層やユニットをどこに幾つ追加すれば更に精度が上がるか、どんな特徴量を追加すればいいか、これらを考慮しながらアップデートしていくのは機械学習の本質だろ データを変えないでそれをやるってこと?
パラメータ変えてやってみて、結果見るだけだし
特徴量っていうのは結局画像解析や音声解析の分野の話でしょう? 画像解析や音声解析の道具として機械学習を使うっていうのは別に良いんだよ?
本来やりたいのは「画像解析」であり「音声解析」だから
機械学習をテーマとして考えると、つまらない作業もしくは
関係ない作業の話になるなぁと 機械学習の素養のある人が一定の根拠に基づいてパラメータ変えるのと、お手軽ソフトでポチポチやって理解した気になった素人が錬金術的にパラメータ変えて一喜一憂するのは天と地ほど違う >実際には精度の向上が求められ、人間がやるよりもいい結果を
>得られるようにするのが目的。
>仕事でやる場合は、これぐらいの精度でした。
→精度がクソ
if(バイト){
上司に報告;
} else {}
>もっと精度をあげるにはどうすればいいだろう?
>と話が続く >>718
そうなると、機械学習というよりパラメータ職人だよねw
で、そういう職人いらずにするのがディープラーニングでしょ?
人間がやるよりもコンピュータの膨大な計算能力を使って
富豪的に処理したほうがいい。 あーすまん途中で書き込みtiちゃった
バイト君・外注の場合は上司に報告して終わり
社員は結果を出す必要がある
俺は当時、バイトで外注だったから「あーどうしよもないっすw最小二乗法でも-1であらゆるでーたと関係ないっす」と答えたな
小売はマジであらゆる変数と関係なかった(災害やセール日は除外。巨大な災害の日は店自体閉じた扱い)
びっくりした >>720
>で、そういう職人いらずにするのがディープラーニングでしょ?
違う
データ職人いらずにするなら、今度は計算式職人になる
今の所は全く関係のないのないデータは除外しないと適切なデータは出せない
仮にデータをいじらずにだそうすると、莫大な費用がかかる。googleならだsルかもしれんが
仮に気温を含めた小売のデータを出すと、フィンランドでは常にマイナスになるだろうな で、ディープラーニングにしろ、人間が膨大なパラメータの組み合わせで検証するにしろ
コンピュータの膨大な計算能力を使うにもコストがかかるわけで、
将来は(すでにそうなってるかもしれないけど)
目的を達成するために
機械学習のコスト VS 機械学習を使わないコスト
というコスト対決の話になって、割にあわないぁと判断されることが多くなると思う
機械学習しなくても(現状でも)それなりの精度で予測できてるわけなんだから >>722
おいおい、違うって言うなら、違う根拠を書いてくれよw >>724
君はディープラーニングには職人不要だと確信しているんだからその根拠となる論文・書籍・記事などを示せば反対意見など一切封じられると思うけど >>724
すまない、今売上に関する学習やってたのでd若干適当に書いた
用途によると結論付いた
教師ではなく報酬だろう
・報酬あり
alphagoがまさnそれ
報酬ないと適当に置くだけ
・教師なし
ヒューまりティクスを使うしかないが、
これにしてもやはり報酬と言い換えるしか無いだおる
mnistにしても教師か報酬アリでないとなんだかよくわからない結果になる >>682
むしろ犯罪として認定されうるほどのプログラミング技術に憧れます、私も逮捕されたい… >>692
>この世界は腐っている。一度滅びなければいけない。新世界を作るために、私は滅びの道具を作った。
名言にして至高ですね
世の流れに抗うことはほとんど不可能ですが、世の流れを加速させることはできる、偉人にしかできない技だとおもいますね >>693
サイコパスは自己の利害損得計算に優れているだけ(ただその手段は特異的ですが)で、それは winny とは違うでしょうね ディープラーニングが上手くいくのは、上手くいくまで人間が地道にチューニングしてるからだ、みたいな論文あったよね 動きがあるとモザイクがチラチラするだろ?
それを時間積分するモザイクによる低解像度化画像から
と高精細化できるだろうに
あほどもが。 QZは読まずにスルーしてるからいいけど
それ以外のも糞だったわ >>691
標準化するデータセットによって平均値や分散が変わる
から訓練データセットとテストデータセット
でも平均値や分散が変わるかも知れないけど
訓練データセットの平均値と分散を使って
テストデータやテストデータセットの標準化処理をする
って事だよね >>701
ビジネスに直結する以外のデータ活用用途もあるけどな >>706
データ採取にAIを使う様になる
無人店舗とか
顔判別→ID
年齢もAIで推定
今人間が推定しているのをAIで推定する
手間が省けるし漏れも少なくなるし分散も小さくなるだろう
同一企業グループ内なら顔IDで名寄せできる
他企業間とかの話になると法律とか変える必要があるかも >>710
つまらない作業をAIとかでやる様にすれば良い >>717
あなたが想定している機械学習のテーマは
SVMのアルゴリズムとか
BPとかAEとかの学習アルゴリズム
に限定したものなんじゃね
実際の社会に影響を及ぼすには
それだけだは不十分
昔のコンピュータだと今の機械学習も実現できていないだろう
将来量子コンピュータとか実現したら
また状況は変わるだろう
BPとか使わずに量子コンピュータで最適な結合荷重を見つけられるかも知れない >>720
ディープラーニングも結合荷重を見つける
パラメータ職人だけど
それを比較的精度よく見つけるアルゴリズムを
開発できた
他の機械学習のパラメータを特定するアルゴリズムを
あなたが開発すれば良いだけ >>723
そんな事は既に他のビジネス領域では起きている >>740
なるというより
もうやってることだからね
一般化していないだけで 今年も2つほど人の脳神経に新しい仕組みが発見されたから
そういうのをどんどん理論化して取り入れると
性能UPしそうだよね
脳の詳細な解明にはあと100年かかる
らしいから俺たちの5代あとぐらいには
面白い世界になっていそう。
ただ、それまで人類は生き残れないだろうと
言われてるけどね >>746
見たくないものから目を背け
不満をつぶやいて自分は何も提供できないんだな 幼稚園児が「あっちは●●電車〜」「こっちが●●線に乗り換え〜」とか
規制ラッシュの混雑の中で大声で叫んでてうるさかったが
親がえらいね〜ωωωとか普段からあやしてるんだろうな
誰でも知ってることを大声で喚いても恥ずかしいだけなんだが ブログに書きなよ
建設的な意見欲しいならそっちの方がいいだろ
そしてリンクを貼ってくれ AIつくってる会社は所詮はソフト屋だから儲からない
AI使ったサービスつくってる会社が儲かる >>757
サービス会社がAI作成する会社を買収しまくってるの知らないの >>758
AIを専門とする会社は基本的に、いくつか残るだけでお
あとはどこかに買収されてゆくでしょう。 こらん ビルの灯りが消えて行くよ
もうすぐ始発が走り出す
さよならだね
君の肩を叩くことも出来ないまま
ドアの前に 二つの段ボールケース
社員証は机の上 AIゆえに人は苦しまねばならぬ!
AIゆえに人は悲しまねばならぬ! 機械学習難しい
mnistすら何やってるか分からんから、
チュートリアル動かしてるだけだ。小学生でも出来るわ
みんなどうやって覚えてるの? ディープラーニングによる創作について。
多くの画像(顔など)データを入力→別人の顔を生成は出来るのに、なぜ
多くの文章データを入力→小説を創作は出来ないの? >>766
俺は自動生成のエロを作りたいんや・・・AIにより無限に湧き出るエロ動画が作りたいんや・・・! 時間軸がある表現が難しいから。
現状の機械学習だと反射に近い事しかできない。 >>767
機械学習は時系列を覚えるのが苦手
あと、商業的にもあまり美味しくないってのもある >>771
時系列に特化したLSTMもあったけど?
言語理解が出来たら、強いAIそのものだろうけど。 >>756
>>692
> この世界は腐っている。一度滅びなければいけない。
> 新世界を作るために、私は滅びの道具を作った。
気に食わないから、全部殺してしまえ。という発想 >>774
>気に食わないから、全部殺してしまえ
現実の社会のからくりは複雑で、「全部壊してしまえ」と思っても、なかなかそういうことは出来ないですね
むしろ、そういう「全部壊してしまえる」部分を見つけることができる、というのは、それだけで賞賛に値するでしょう
あなたは現時点での社会の脆弱な部分を指摘することができますか?そしてその脆弱性を突く方法を考案できますか?
人は「良心のためあえて指摘しない」と気取りますが、実は「指摘できない」ものなんです、無論私も今のところはそういう脆弱性を指摘できません
そういう意味で、私は「滅びの道具」を作ってしまうこと自体に稀有な着想を感じるのです >>775
何が言いたいんだ?
だからサイコパスだって言ってるんだが 殺そうと思って毒薬を作りました。
毒薬を作れる技術を評価してくださいってか? 世界が腐ってるなんて言ってたっけ?
デジタルデータに対する著作権の概念が限界に来てるから新しいシステムを試さないかって感じだったと思うけど × デジタルデータに対する著作権の概念が限界に来てるから新しいシステムを試さないか
○ デジタルデータに対する著作権の概念が限界に来てるから、古いシステムを壊す道具を作った。新しいシステムはお前らが作れ
だからサイコパスだと言ってる >>776-777
>何が言いたいんだ?
@そもそもあなたの持つサイコパスの定義が間違っており
Aあなたはあなたの主観的思考に沿わないものを一律にサイコパス呼ばわりしているだけ
だいたい「サイコパス」という最近考案された目新しい概念をチョイスすること自体が「考える前に安易に流れている」という感じを受けますね。
>殺そうと思って毒薬を作りました
実は毒薬を作るのは難しいんですよ、特に人に仕掛けて実際に殺人を行ってしま「える」ような実効性のある毒薬は
「毒薬を作りました」という概念を考えることは簡単でも、毒薬そのものを実際に作るのはかなり困難です
概念を頭の中で操作することは誰でもできますが、その概念に対応する実体を操作するのはかなり難しい
私はあなたの持つ概念と実体の乖離を指摘しているのです >>779
>○ デジタルデータに対する著作権の概念が限界に来てるから、古いシステムを壊す道具を作った。新しいシステムはお前らが作れ
>だからサイコパスだと言ってる
ちょっと論理が飛躍しているような気がします、どういう点を「サイコパス」だと考えたのでしょうか? サイコパス(精神病質者)に見られる共通した20の特徴
http://karapaia.com/archives/52164745.html
20.表面上は魅力的で口達者
19.自信満々でよく自慢話をする
18.刺激を求める
17.慢性的に平然と嘘をつく
16.ずる賢こく人を操ろうとする
15.良心の異常な欠如
14.他者に冷淡
13.自分の行動を制御できない
12.衝動的
11.無責任
10.自分の過ちを決して認めない
9.寄生的な生活
8.性関係の乱れ
7.幼少期からの異常行動
6.現実的な長期にわたる目標がない
5.行動に対する責任が全く取れない
4.短い結婚期間、多数の離婚歴
3.青年期の非行
2.仮釈放の取消
1.犯罪面での多才ぶり 6.現実的な長期にわたる目標がない
とか、まさに当たってるよな
新しい仕組みを考えずに、12.衝動的 に まず壊そう
他人が作った著作物に 9.寄生的な生活 して
5.行動に対する責任が全く取れない
15.良心の異常な欠如 して 16.ずる賢こく人を操ろうとする >>782
それらは反社会的な人間の誰にでもあてはまるようなことを漫然と並べているだけではないですか?
反社会的な人間の中でも特に「サイコパス」に当てはまること、「サイコパス」にしか当てはまらないこと、を指摘しているものを挙げてみてはいただけませんか? 反社会的な人間の誰にでもあてはまるようなことが
金子にも当てはまった >>784
なら、お前のサイコパスの定義言って、
それがどう当てはまらないのかを説明するべきだな >>783
>新しい仕組みを考えずに、12.衝動的 に まず壊そう
いや、だから、「壊すこと」自体が難しいといっているのです。大抵は、個人が破壊できるのは部分的な範囲にとどまり、広い範囲を壊すことは通常はできないものです
>他人が作った著作物に 9.寄生的な生活 して
それは winny の作者自身はしていないのでは?
>5.行動に対する責任が全く取れない
「責任」という概念を説明いただけませんか?
>15.良心の異常な欠如 して
日本語が変ですよ、もしかして韓半島の国籍をお持ちですか?
>16.ずる賢こく人を操ろうとする
操られてしまった人は、操る人に対して「ずる賢く」という感情を持つものです、単に「操られてしまった人よりも操った人の方が賢い」という事実を示しているにすぎません >>786
>なら、お前のサイコパスの定義言って、
>それがどう当てはまらないのかを説明するべきだな
私のサイコパスの定義は、
「サイコパス」という定義そのものが意味がなく、「サイコパス」に対応する(反社会的)人間像を持つ実体は、「サイコパス」がどのような定義であれ、存在しない
ですね >>787
> いや、だから、「壊すこと」自体が難しいといっているのです。
だから、難しいからなんだよ?
サリンだって作るのは難しいだろうが >>788
> 「サイコパス」という定義そのものが意味がなく、「サイコパス」に対応する(反社会的)人間像を持つ実体は、「サイコパス」がどのような定義であれ、存在しない
それは世間一般の定義ですか?
それともお前が考えたものですか?
世間一般の定義であれば、検索してから
あんたと同じことを言ってるサイトを見つけてきてください ID真っ赤にしてる奴はサイコパスってことで、
サイコパス以外の人は誰も異論ないと思う。 たった5回書き込んだだけでサイコパスになるのかよw よくわからんが、データマイニングでサイコパスは見つけられたのかね? 途中からNGにしてたけどまだやってたのか
年末とは言えさすがに非生産的過ぎるな LSTMって普通のディープラーニングに過去に行った予測結果も係数付きで追加するだけなのでそこまで高度なことできないぞ なんだって◆QZaw55cn4cのような災厄がこのスレに憑りついてしまったんだか・・・ >>799
他のスレが救われてるから、ここにくぎ付けにしとけよ。 まったくダルビッシュみたいだ
・・・・あれは、紗栄子パスだったか >>798
おまえそれ読んで分からんの?
前からある分析方法に
別の名前つけただけ。
そゆのよくあるよ、 まぁLSTMに希望を見出す気持ちは分かる
俺もそうだったしおかんもそうだった エロ小説は目標として置いておいて、
とりあえずダジャレからやってみたらどうか? ダジャレはqiitaでちょっと前にやってた人がいたはず
どう学習させるかで全く結果は変わるだろうけど ダジャレは脳の高機能を使っている
ダジャレを言う人は脳の機能が衰えている
この問題に終止符が打たれそう 脳みそとして
ディープラーニングするか
チープラーニングするか
この辺りの違い? 駄洒落は脳の高機能な連想の結び付きが無ければ出来ないが、それを判断して抑止する機能が壊れている人が言ってしまう。 高機能な連想てのは難しそうだなあ。
仮に >811 が100万回ダジャレを言ってそれをLSTMに食わせても、
辞書を記憶しただけになったりするのかな。 >>812
おー、なるほど!
作成と出力が別なのね、確かにそうだ、これは気づかなかった >>810
林家木久扇なんか脳の機能が衰えているんだろうな。笑点メンバー全員か? 要は、私の場合
最低でも出力側が壊れてるってことだな するとダジャレを作る奴とそのダジャレを評価する奴が必要になるね
面白さを評価するってのはどうやりゃいいんだ? >>816
笑点は老人向けの番組じゃないかな
正直、ちょっと全体的に良くわからない。視聴率は凄いのが更に良くわからない
>>818
SNSなどで人間に見せて点数を付けてもらう
ヒューリスティクスだっけな
alphaGoみたいにAI同士でやってたら人間には理解できないものが出来そうだ ★ さくらももこと山本KIDが早死に、来年も30万人死ぬ、放射能の影響で、無関心で年越しですか?
2008年 12808万人 + 5万 △ △
2009年 12803万人 − 5万 ▼ ▼
2010年 12806万人 + 3万 △
2011年 12780万人 −26万 ▼▼▼▼▼ ▼▼▼▼
2012年 12752万人 −28万 ▼▼▼▼▼▼ ▼▼▼▼
2013年 12730万人 −22万 ▼▼▼▼ ▼▼▼
2014年 12709万人 −21万 ▼▼▼▼ ▼▼▼
https://blog.goo.ne.jp/jpnx05/e/a618afaa0113f2a33fbc495f48a2b8c4
【2019年、人類覚醒】 世界教師が帰還した……紅白、RIJIN、駅伝、五輪、TPP……競争を止めるために!
http://rosie.5ch.net/test/read.cgi/liveplus/1546223584/l50 NPO法人 ここからねっと 池亀厚子 詐欺師
町田まごころクリニック 鹿島直人 詐欺師 リポジトリ持ってきてなんか長いな〜新しいアルゴリズム使ってんのかな〜と思ってたらCPU版のtensorrflowになってた
なんでやねん >>820
視聴率の調査世帯は三世代または
四世代家族が多いと聞いてます。
つまり老人が含まれてる割合いが高い
のでしょう。 >>835
データセットが無いから陰核と乳首は学習して無いぜって説明にかいてあった
mannkoに見えるのはシワの延長だろうな
使ったのはDeepCreamPy、楽しかった 機械学習で地震の正確な予測って出来ないのかな?
データが足りな過ぎるか・・・ 地球ができて50億年、多くてその内の1000年ぐらいしかデータないしな >>837
マントルまでセンサーぶっ刺せれば、予測精度の高いデータが拾えるかも。
というか、現状の地震予知研究って予算使いまくって何のデータをこねくり回してるんだ? >>833
フォトショ職人を上回る日がくるのだろうか
誰かコンペやってよ >840>842
これ大人の顔だからいいけど、幼女の写真だと割とマジでヤバくなったのでさすがに公開できなかったという経緯もある
>842
この精度でいいなら、速度なら100%上回る
慣れたら1分でできるからな。使ったツールはMSペイント
操作に数秒、変換は数秒
もっと精度を上げるなら、まずこれをつかってからやると仕事が早いだろうな
短距離走vsマラソン選手みたいで、あまり比較は出来ないと思う >>843
精度上げたらこのツール爆売れだろうな
プレステージは間違いなく買う 桃太郎だっけ
国内の会社に全部断られて
結局インドに何億か払って
デジタルモザイク作ってもらったとか >>844
普通に既存技術で行けると思うよ
vgg16の裸体版とNVIDIAのPConvで一発 いや、単に童貞をこじらせたヲタクの巣屈と化す のみかと >>841
データは誰かが収集しているから得られる
センサーを設置したり何を観測すれば良いのか研究してるんじゃね?
宇宙から来る粒子線を使ってレントゲンみたいな感じで火山の内部を探る研究とかもあったはず >>833
近い将来こういうのもっと精度がよくなって、スマートグラスみたいなものに搭載されると
思うとやっぱり世の中捨てたもんじゃなと思う。 ユニクロが女性向け光学迷彩アウターを売り出す未来が見えるぜ >>857
スマートグラスだと対象の動きも使えるから、
さらに高精度が期待できそう。
学術的に夢のある話ですなぁ いつも薔薇色に萌えて
この胸ときめく
機械からAIへ
私はHENT
いえいえ >>838
49億年分くらいは食わせても無駄なデータ
今は第三大陸移動期 人工知能の成果は政治の予測まで判断できる。すごいなぁ
http://news.livedoor.com/lite/article_detail/15829215/
北朝鮮の金正恩(キム・ジョンウン)朝鮮労働党委員長の発言や周辺の状況などを人工知能(AI)を使って分析したところ、
北朝鮮は「核・経済並進路線」を放棄しておらず、2020年に核保有国になることを目指しているとの結果が出た。
壇国大学政策科学研究所と社団法人サンド研究所、世宗経営諮問研究チームが先日「テキストマイニング技法」と
「システムダイナミクス理論」によって金正恩氏の「核戦略」を共同で分析した。テキストマイニングとはAIを使って
ビッグデータからキーワードとなる言葉の頻度や意味などを分析する技法で、2016年に米国の大統領選挙で
トランプ大統領の当選を予測したことでも知られる。システムダイナミクスは複数の事象間の動態的な関係を把握し、それを視覚化する理論だ。
金正恩氏による2013年3月の「核・経済並進路線」の演説文、16年5月の「朝鮮労働党第7次大会報告書」、
そして昨年4月の朝鮮労働党全体会議で発表された新たな「経済発展路線」などを研究チームが分析したところ
「金正恩氏は非核化の意志が非常に弱い」との結果が出た。たとえば核関連の発言で「核開発の意志」を示す
「核武力」「核兵器」などの言葉はその使用頻度が「非核化関連の用語」よりも非常に多かったという。
テキストマイニングの専門家として知られる世宗経営諮問のキム・ギュイル氏は「金正恩氏の発言を分析すると
核保有国で使われる表現が多いが、それは核の放棄ではなく核軍縮が目標のようだ」との見方を示した。
サンド研究所のチェ・ギョンヒ氏は「時間が過ぎるほど北朝鮮は内部の結束と体制維持の手段として核をさらに利用するだろう」
「核開発は金正恩氏の地位を支えると同時に、権威体制の強化にも大きく寄与してきた」とコメントした。 >テキストマイニングとはAIを使って
>ビッグデータからキーワードとなる言葉の頻度や意味などを分析する技法で
なんか、素人を馬鹿にした説明になってるね 常に核を放棄しないと出力する意味の無いプログラムで正解するからな AVとジュニアアイドルの写真を読み込ませて、ローカルで自動生成するのは後何年かかるのか
Xデーから規制されるまでのボーナスタイム、待ちわびています ハングルのテキストマイニングって難しいんよ。
日本語の様にはいかない。言い換えれば出来ることは少ない。そのままでは・・。
なもんで日本語に一度翻訳してから、テキストマイニングをするとか、まともな
解析するにはそういうテクニックもあり得るし、やられている。
日本語のテキストを句読点もなくひらがなで羅列した文章を、テキストマイニング
しなさいとやられてもんにゃ〜、御免こうむるが、ハングルじたいがそういう言語
なんで、相当大変。
ハングルだけでやるときは、辞書が必須なんだろうな・・わからんけど。
じゃないと分かち書きみたいなこともできない。 ハングルは同音異義語の判別がつかないのが問題とどっかで読んだ事がある。
漢字が使えれば簡単に解決出来るのにと大学教授が嘆いていたとか。 ハングルは実質全部カタカナらしいね
=ハングルハゼンブカタカナラシイネ
そのままではテキストを学習することは無理があると思う。出来るのかな?知らんしヤリたくもないけど
ってかなんで日本語なんだ、英語なら自動で分かち書きだからすごく楽なのに >>871
英語が楽なのは分かち書きだけで、それ以降は日本語の方が楽。
だから、日本語で構文解析的なテキストマイニングは行われているが
英語ではほとんど行われていない(あきらめてる)。
米国の有名大学などでもチャレンジしているが、すげ〜時間がかかって
使い物にならないんだってさ。 >>872
結局は英語がサイキョサイキョサイキョというね >>872
ほー、英語の構文解析のほうが遥かに楽かと思ってたよ。 >>876
いや、私も、以前にとあるこの分やの高名な方から聞いて、初めて知った
次第なんですよ。その面は日本語の方がしっかりしていてやりやすいと。
英語は同じ単語が異なる品詞として頻発してしまう部分に一つの問題があるらしい。
それを、外語大のやはり有名な(これは言語研究の方で有名)方に話したら
至極納得されていた。なもんで、私もそうなんかと思った次第。
ちなみに中国語は、日本語の難しさと英語の難しさの両方を持っているそう。
見方を変えれば、英語は文法など気にせず、データ量に任せて「えいや〜〜」で
機械学習、AIに任せちゃえ!の方が合っているのかもしれないし、実際そういう
流れですよね。 言語なんてのは自然発生したものなので
自然そのもの。
自然には矛盾はなく、ただただ複雑なだけ。
よって大量のデータで当てはめを
するしかないのですよ。
構文解析は例外だらけで
あまり役に立ちません。 構文的には日本語のほうが遥かにファジーなのにAI的には格構造の貧弱な英語独特の曖昧さが問題なのか。
面白いっちゃ面白い。独仏は覚えてしまえばまぎれの少ない分英語より易しいとはよく言われたものだ。 ・形態素解析が楽
・話者が多い
・例外が少ない
これらを満たすのはスペイン語かな >>879
将来的な方向性はわかっていての話ですよ >>885
PythonでできることをC言語でやるなら何でもできる >>879
単純に技術側面だけをみるとそう考えがちなんですが
実際の適用場面では、まるきり新出の熟語などのワードを的確にとらえるには
ラーニング等の時間的負荷が大きく、その辺りをしっかりとしないと本格的な
商用適用ではそれでは不足というこを知っておくと良いかと思います。 スレの内容に向いているかといえば日本刀で薪割りする感じかw
言語としてはCが一番好きだけど、学習やマイニングはpythonとかRでやりたい。 I think that that that that that boy wrote is wrong.
あの少年が書いたあのthatは間違っていると思います。 >>891
Google翻訳すごいな。thatをたくさんくっつけても
スルーしてくれるんだ。
I think that that that boy wrote is wrong.
I think that that that that boy wrote is wrong.
I think that that that that that boy wrote is wrong.
あの少年が書いたのは間違っていると思います。
これでもほぼ同じ意味になってる。すごいや。
I think that that that that that that that that that boy wrote is wrong.
あの少年が書いたことは間違っていると思います。 C言語で機械学習とか毛根のためにやめといた方がいいと思う >>895
C言語の機械学習ライブラリがあれば良いんじゃないの?
一々コンパイルしないといけないから面倒だろうけど Cのレイヤーの低さは大変だよ。
メモリ管理とか機械学習と全然関係のない部分でハマるから。
PythonでもRでも使ってドメインに近い所だけで完結させるのがお得 ああでもIoTのモノ側で組込みCでやらねばいかん世界はあるのかなあ。 いわゆるエッジ側で学習の必要がなければ
FPGAとかで処理すれば良いと思うけど
学習するならソフトウェアが必要な気がする
エッジ側の処理能力とかメモリとか次第だろうけど >>896
Tensorflow for Cというのもあるけど誰が使うんだろう
C++ならまだ使う気もするけどライブラリと情報が揃うまでは使いたくない
mallocとかガーベッジコレクション今更頑張るのとか
csvファイル読み込むのに専用の関数を一から書くのとか
日付とか全部time型に直して処理するのとか
特定条件でマスクしたりソートしたりする場合全部実装するのとか
グラフ描画したい場合にGUIライブラリと連携させたり
一旦外部ファイルに落としてgnuplotとか使うのとか
考えれば考えるほど面倒くさくて髪が抜ける >>900
多分グラフ表示とかしないんじゃね?
人間が見るわけじゃなくて
センサとかからのデータ使って動的に学習する
人間はセンター側でまとめて管理する エッジ側で学習させるとかいうのはほとんどの場合商品デザインが間違っている
普通は学習済みモデルを入れてエッジでは推論させるだけで事足りるだろう 機械学習アルゴリズムでとか、そういうのがCの利用場面ではなく
あくまで、システムに近い部分の役割で使うんでしょう。
米国の大規模なパッケージやDBの会社もJavaが出た時Java試したが
フロント系以外はみんなCにもどちゃったんで、役割分担でしょうね。 強化学習だと現場で動くんじゃない?
データと結果を通信する方法もあるけど通信の費用や時間もかかるし あと逐次学習したらデータを貯めておく必要が無くなると思う
観測したら学習してすぐ捨ててしまえばいい
人間もいちいち紙にメモしないし >>895
> C言語で機械学習とか毛根のためにやめといた方がいいと思う
毛根なんて死なないなんて〜言わないよ絶対〜
っというメロディが頭に浮かんだ 裸画像のデータセット、ご存知ないでしょうか
ヤフーで見つけたと思ったのですが、見失ってしまいました
ラベルにfrontsex,backsexなどがあったと思います すいません、データセットじゃなくてモデルファイルでした アダルトサイエンティストという言葉に出会いました
考えた人素晴らしい >>908
あくまで基本部分にあたるシステム回りの話。
javaは遅くて使い物にならないもので。 WRNCHATって何?
あとGPUってどれ?
https://www.google.co.jp/amp/s/pc.watch.impress.co.jp/docs/news/event/1163/725/amp.index.html
> Cascade Lake-SPは、新たにVNNI(Vector Neural Network Instructions)と呼ばれるAVX512の拡張命令に対応し、従来世代よりもよりディープラーニング/マシンラーニングの処理が高速になる「Intel Deep Learning Boost」などの新機能が搭載されている。
> 説明のなかで、WRNCHATというソフトウェアを利用し、GPUよりもIntel Deep Learning Boostを有効にしたXeonプロセッサのほうがが5倍速いというデモを行なった。 >>920
物性の相というのは理論的にあんま面白くないと思うんだけど、
どこが面白いの? qiitaに真面目な機械学習系記事書いたけど何も反応ない
ランキング入りしてるのがツイッターレベルの初心者の感想文ばっか。
いいね押し合いするクラスタみたいのが存在してるのかね。やる気無くした。 同じorganizationの人同士でいいね押し合うからそういう所属の人がいいね数が多くなりがちという記事が以前qiitaに上がってたな >>924
いいねの数=内容の薄さ みたいな所あるからね >>932
あ〜。
的を得てるかもしれないな。
とはいえ、「いいね」が実際どういう人かわかれば、マーケットともいえる。
「どうでもいいね」もあるかもしれんけど。 >>924
ちゃんとした専門的な記事なら、そんなすぐチヤホヤされることにはならんでしょ 対象読者少ないし
中身のある記事だったら、むしろ1〜2年後でも実務者から参照される ワイも最近1年前のバイオ系の記事参考にしてゴニョゴニョしてる。イイネは1桁だね Qiitaはストック数も公開してほしい
投稿者ですら普通には見れなくてAPIからしか参照できないのは意味不明 >>924
どの会社がヤバイのか分かる
発注者目線では大変参考になる >>924
ギフハブに英語ドキュメントで公開してみたらどう? いいねだと刹那的な評価でインパクト重視になるしリピート率とか見てみたい >>945
記事に対するリピートだと
何回も見ないと判らないって事じゃね
判りやすく表現するのが良いところだと思う ユーザーを評価していいねの重み付けを変えたほうはいいかも 俺の経験上、いいねやRTを増やしたければ、偏差値30をターゲットにしないだめ
偏差値70をターゲットにすると、日本人の2%しかいないからね 偏差値60のワイは30向けの情報にイイネはしないぜー >>951
偏差値30がプログラミングなんかやるか? 日本ではアメリカみたいに低学歴にPythonと基本的な統計学を叩き込んで機械学習エンジニアに育てるみたいなの動き無いの? java教え込んでIT土方にする組織は山ほどあるけど 機械学習の利用が人海戦術で進められるなら勝手に土方がやるんでない ではデータセットを作りましょう。各自担当ターゲットを街で探して写真を撮ってきてください。最低でも1万枚 >>957
頭悪〜
その辺のドライブレコーダの動画を画像にすれば一瞬で終わる 何を扱いたいかにもよるけどドラレコ映像が必ずしも母集団を表せるとは限らないということ >>954-956
大手企業は、Python 土方を、2千〜数千人雇う それ単に今の非正規労働者がPython使うようになるだけであって、直接雇うわけじゃないから給料も労働環境も雇用形態も変わらないよ 機械学習のライブラリを使うだけなら数学とかの知識はあまり要らないから大卒雇っても賃金が高いだけで無駄、と思ってる企業がやってる事だから、賃金が安いままなのは当然 将来、AIで結果を出せる企業はダイキンみたいに自社社員を育てて内製化していくと思う ダイキンのPython 土方は、社員で、2千人とか >>967
よほど余裕が無いと厳しそう
基本的には外注になるんじゃないかなぁ
>>968
何か嫌な事でもあったのか? どのデータが必要かは内部の人でないと分からないんじゃない? ま、独自にAIアルゴリズムを作ってというフィールドは残るでしょうが
いま一生懸命自分でバンバンという人の多くは、その仕事はなくなるでしょうね。
独自に作って提供されても信用されないですよ。
いちいちアルゴリズム検証、その通りにできているか検証なんてやってられんもんね。
逆に残ったところは強いといえるかもね。 >>971
>いま一生懸命自分でバンバンという人の多くは、その仕事はなくなるでしょうね。
>独自に作って提供されても信用されないですよ。
>いちいちアルゴリズム検証、その通りにできているか検証なんてやってられんもんね。
これは今の営業事務そのもの
特に小売はインバウンドが大きすぎて指標が全く無く、検証も評価も何もできない状態なんだ
若干内部情報を好評すると、年間売上3%上昇すればいいところ、年間30%上がったり、10%下がったりしている
何の通例も憶測も通じない状態 >>955
Julia 教え込んでIT土方にしたら。 ここ実務者どれぐらいいるんかな
てかMLもしくはデータサイエンス従事者って国内ではまだまだ少ないような
流行ってるってんで本業の傍らに始める人も多そうだし >>974
Python学んでもう新しいプログラミング言語覚えないと心に決めたが
Julia見て行列計算の簡便さとスピードの速さで早くも心が揺らいでいる >>978
Juliaよく知らないけど、やっぱ速いんだね。
ちなみにどのくらいPythonと速さ違う?
自分はRが好きで使ってる。パイプ演算が楽しい。 >>980
GPU使わないコードで何も考えずにガウシアンプロセスさせてみるとnumpyで書いたコードと2〜3割違う
書き方がまずい可能性も大だけど、行列の転置をarr.conj().Tとかnp.matmulとか、そのあたりを細かくロスしてそうなんだよね
Pythonも@演算子が使えるようになって多少は綺麗になったけど、juliaはmatlabっぽくて行列演算の可読性がすごくいい
名前がちょっとアレなんで敬遠してたけど、実際にコードさわると食わず嫌いだったと痛感している
GPU周りのライブラリが充実しているのでしばらくはPython使うけど、将来は食われるかもなぁと素直に感じた >>984
なるほど、ありがとう。
名前がアレとはJuliaでググるとAV女優出てくるってことかな >名前がアレとはJuliaでググるとAV女優出てくるってことかな
ビデオをみて、パイは3.14じゃないという事実を知った >>975
大手も実装より分析止まりが多い印象
製造の目視検査も人手不足なら
キューピーみたいにAI使えばいいのに、普及しないな ここにきている人は、機械学習というよりAIという側面の人ばかりじゃないかな プログラムというより産業利用寄りの人もけっこう来てるのかな ほぼいないと思う
そもそも実務上で参考になる話も興味を呼ぶ話も
ないから仕方ないでしょう。
主に学生じゃないでしょうか。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 70日 11時間 48分 9秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。