【統計分析】機械学習・データマイニング21
レス数が1000を超えています。これ以上書き込みはできません。
機械学習とデータマイニングについて何でもいいので語れ若人
※ワッチョイだよん
次スレ立ての際は、一行目冒頭に
!extend:on:vvvvv:1000:512つけてね
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング20
https://mevius.5ch.net/test/read.cgi/tech/1533635797/
VIPQ2_EXTDAT: default:vvvvv:1000:512:----: EXT was configured >>835
データセットが無いから陰核と乳首は学習して無いぜって説明にかいてあった
mannkoに見えるのはシワの延長だろうな
使ったのはDeepCreamPy、楽しかった 機械学習で地震の正確な予測って出来ないのかな?
データが足りな過ぎるか・・・ 地球ができて50億年、多くてその内の1000年ぐらいしかデータないしな >>837
マントルまでセンサーぶっ刺せれば、予測精度の高いデータが拾えるかも。
というか、現状の地震予知研究って予算使いまくって何のデータをこねくり回してるんだ? >>833
フォトショ職人を上回る日がくるのだろうか
誰かコンペやってよ >840>842
これ大人の顔だからいいけど、幼女の写真だと割とマジでヤバくなったのでさすがに公開できなかったという経緯もある
>842
この精度でいいなら、速度なら100%上回る
慣れたら1分でできるからな。使ったツールはMSペイント
操作に数秒、変換は数秒
もっと精度を上げるなら、まずこれをつかってからやると仕事が早いだろうな
短距離走vsマラソン選手みたいで、あまり比較は出来ないと思う >>843
精度上げたらこのツール爆売れだろうな
プレステージは間違いなく買う 桃太郎だっけ
国内の会社に全部断られて
結局インドに何億か払って
デジタルモザイク作ってもらったとか >>844
普通に既存技術で行けると思うよ
vgg16の裸体版とNVIDIAのPConvで一発 いや、単に童貞をこじらせたヲタクの巣屈と化す のみかと >>841
データは誰かが収集しているから得られる
センサーを設置したり何を観測すれば良いのか研究してるんじゃね?
宇宙から来る粒子線を使ってレントゲンみたいな感じで火山の内部を探る研究とかもあったはず >>833
近い将来こういうのもっと精度がよくなって、スマートグラスみたいなものに搭載されると
思うとやっぱり世の中捨てたもんじゃなと思う。 ユニクロが女性向け光学迷彩アウターを売り出す未来が見えるぜ >>857
スマートグラスだと対象の動きも使えるから、
さらに高精度が期待できそう。
学術的に夢のある話ですなぁ いつも薔薇色に萌えて
この胸ときめく
機械からAIへ
私はHENT
いえいえ >>838
49億年分くらいは食わせても無駄なデータ
今は第三大陸移動期 人工知能の成果は政治の予測まで判断できる。すごいなぁ
http://news.livedoor.com/lite/article_detail/15829215/
北朝鮮の金正恩(キム・ジョンウン)朝鮮労働党委員長の発言や周辺の状況などを人工知能(AI)を使って分析したところ、
北朝鮮は「核・経済並進路線」を放棄しておらず、2020年に核保有国になることを目指しているとの結果が出た。
壇国大学政策科学研究所と社団法人サンド研究所、世宗経営諮問研究チームが先日「テキストマイニング技法」と
「システムダイナミクス理論」によって金正恩氏の「核戦略」を共同で分析した。テキストマイニングとはAIを使って
ビッグデータからキーワードとなる言葉の頻度や意味などを分析する技法で、2016年に米国の大統領選挙で
トランプ大統領の当選を予測したことでも知られる。システムダイナミクスは複数の事象間の動態的な関係を把握し、それを視覚化する理論だ。
金正恩氏による2013年3月の「核・経済並進路線」の演説文、16年5月の「朝鮮労働党第7次大会報告書」、
そして昨年4月の朝鮮労働党全体会議で発表された新たな「経済発展路線」などを研究チームが分析したところ
「金正恩氏は非核化の意志が非常に弱い」との結果が出た。たとえば核関連の発言で「核開発の意志」を示す
「核武力」「核兵器」などの言葉はその使用頻度が「非核化関連の用語」よりも非常に多かったという。
テキストマイニングの専門家として知られる世宗経営諮問のキム・ギュイル氏は「金正恩氏の発言を分析すると
核保有国で使われる表現が多いが、それは核の放棄ではなく核軍縮が目標のようだ」との見方を示した。
サンド研究所のチェ・ギョンヒ氏は「時間が過ぎるほど北朝鮮は内部の結束と体制維持の手段として核をさらに利用するだろう」
「核開発は金正恩氏の地位を支えると同時に、権威体制の強化にも大きく寄与してきた」とコメントした。 >テキストマイニングとはAIを使って
>ビッグデータからキーワードとなる言葉の頻度や意味などを分析する技法で
なんか、素人を馬鹿にした説明になってるね 常に核を放棄しないと出力する意味の無いプログラムで正解するからな AVとジュニアアイドルの写真を読み込ませて、ローカルで自動生成するのは後何年かかるのか
Xデーから規制されるまでのボーナスタイム、待ちわびています ハングルのテキストマイニングって難しいんよ。
日本語の様にはいかない。言い換えれば出来ることは少ない。そのままでは・・。
なもんで日本語に一度翻訳してから、テキストマイニングをするとか、まともな
解析するにはそういうテクニックもあり得るし、やられている。
日本語のテキストを句読点もなくひらがなで羅列した文章を、テキストマイニング
しなさいとやられてもんにゃ〜、御免こうむるが、ハングルじたいがそういう言語
なんで、相当大変。
ハングルだけでやるときは、辞書が必須なんだろうな・・わからんけど。
じゃないと分かち書きみたいなこともできない。 ハングルは同音異義語の判別がつかないのが問題とどっかで読んだ事がある。
漢字が使えれば簡単に解決出来るのにと大学教授が嘆いていたとか。 ハングルは実質全部カタカナらしいね
=ハングルハゼンブカタカナラシイネ
そのままではテキストを学習することは無理があると思う。出来るのかな?知らんしヤリたくもないけど
ってかなんで日本語なんだ、英語なら自動で分かち書きだからすごく楽なのに >>871
英語が楽なのは分かち書きだけで、それ以降は日本語の方が楽。
だから、日本語で構文解析的なテキストマイニングは行われているが
英語ではほとんど行われていない(あきらめてる)。
米国の有名大学などでもチャレンジしているが、すげ〜時間がかかって
使い物にならないんだってさ。 >>872
結局は英語がサイキョサイキョサイキョというね >>872
ほー、英語の構文解析のほうが遥かに楽かと思ってたよ。 >>876
いや、私も、以前にとあるこの分やの高名な方から聞いて、初めて知った
次第なんですよ。その面は日本語の方がしっかりしていてやりやすいと。
英語は同じ単語が異なる品詞として頻発してしまう部分に一つの問題があるらしい。
それを、外語大のやはり有名な(これは言語研究の方で有名)方に話したら
至極納得されていた。なもんで、私もそうなんかと思った次第。
ちなみに中国語は、日本語の難しさと英語の難しさの両方を持っているそう。
見方を変えれば、英語は文法など気にせず、データ量に任せて「えいや〜〜」で
機械学習、AIに任せちゃえ!の方が合っているのかもしれないし、実際そういう
流れですよね。 言語なんてのは自然発生したものなので
自然そのもの。
自然には矛盾はなく、ただただ複雑なだけ。
よって大量のデータで当てはめを
するしかないのですよ。
構文解析は例外だらけで
あまり役に立ちません。 構文的には日本語のほうが遥かにファジーなのにAI的には格構造の貧弱な英語独特の曖昧さが問題なのか。
面白いっちゃ面白い。独仏は覚えてしまえばまぎれの少ない分英語より易しいとはよく言われたものだ。 ・形態素解析が楽
・話者が多い
・例外が少ない
これらを満たすのはスペイン語かな >>879
将来的な方向性はわかっていての話ですよ >>885
PythonでできることをC言語でやるなら何でもできる >>879
単純に技術側面だけをみるとそう考えがちなんですが
実際の適用場面では、まるきり新出の熟語などのワードを的確にとらえるには
ラーニング等の時間的負荷が大きく、その辺りをしっかりとしないと本格的な
商用適用ではそれでは不足というこを知っておくと良いかと思います。 スレの内容に向いているかといえば日本刀で薪割りする感じかw
言語としてはCが一番好きだけど、学習やマイニングはpythonとかRでやりたい。 I think that that that that that boy wrote is wrong.
あの少年が書いたあのthatは間違っていると思います。 >>891
Google翻訳すごいな。thatをたくさんくっつけても
スルーしてくれるんだ。
I think that that that boy wrote is wrong.
I think that that that that boy wrote is wrong.
I think that that that that that boy wrote is wrong.
あの少年が書いたのは間違っていると思います。
これでもほぼ同じ意味になってる。すごいや。
I think that that that that that that that that that boy wrote is wrong.
あの少年が書いたことは間違っていると思います。 C言語で機械学習とか毛根のためにやめといた方がいいと思う >>895
C言語の機械学習ライブラリがあれば良いんじゃないの?
一々コンパイルしないといけないから面倒だろうけど Cのレイヤーの低さは大変だよ。
メモリ管理とか機械学習と全然関係のない部分でハマるから。
PythonでもRでも使ってドメインに近い所だけで完結させるのがお得 ああでもIoTのモノ側で組込みCでやらねばいかん世界はあるのかなあ。 いわゆるエッジ側で学習の必要がなければ
FPGAとかで処理すれば良いと思うけど
学習するならソフトウェアが必要な気がする
エッジ側の処理能力とかメモリとか次第だろうけど >>896
Tensorflow for Cというのもあるけど誰が使うんだろう
C++ならまだ使う気もするけどライブラリと情報が揃うまでは使いたくない
mallocとかガーベッジコレクション今更頑張るのとか
csvファイル読み込むのに専用の関数を一から書くのとか
日付とか全部time型に直して処理するのとか
特定条件でマスクしたりソートしたりする場合全部実装するのとか
グラフ描画したい場合にGUIライブラリと連携させたり
一旦外部ファイルに落としてgnuplotとか使うのとか
考えれば考えるほど面倒くさくて髪が抜ける >>900
多分グラフ表示とかしないんじゃね?
人間が見るわけじゃなくて
センサとかからのデータ使って動的に学習する
人間はセンター側でまとめて管理する エッジ側で学習させるとかいうのはほとんどの場合商品デザインが間違っている
普通は学習済みモデルを入れてエッジでは推論させるだけで事足りるだろう 機械学習アルゴリズムでとか、そういうのがCの利用場面ではなく
あくまで、システムに近い部分の役割で使うんでしょう。
米国の大規模なパッケージやDBの会社もJavaが出た時Java試したが
フロント系以外はみんなCにもどちゃったんで、役割分担でしょうね。 強化学習だと現場で動くんじゃない?
データと結果を通信する方法もあるけど通信の費用や時間もかかるし あと逐次学習したらデータを貯めておく必要が無くなると思う
観測したら学習してすぐ捨ててしまえばいい
人間もいちいち紙にメモしないし >>895
> C言語で機械学習とか毛根のためにやめといた方がいいと思う
毛根なんて死なないなんて〜言わないよ絶対〜
っというメロディが頭に浮かんだ 裸画像のデータセット、ご存知ないでしょうか
ヤフーで見つけたと思ったのですが、見失ってしまいました
ラベルにfrontsex,backsexなどがあったと思います すいません、データセットじゃなくてモデルファイルでした アダルトサイエンティストという言葉に出会いました
考えた人素晴らしい >>908
あくまで基本部分にあたるシステム回りの話。
javaは遅くて使い物にならないもので。 WRNCHATって何?
あとGPUってどれ?
https://www.google.co.jp/amp/s/pc.watch.impress.co.jp/docs/news/event/1163/725/amp.index.html
> Cascade Lake-SPは、新たにVNNI(Vector Neural Network Instructions)と呼ばれるAVX512の拡張命令に対応し、従来世代よりもよりディープラーニング/マシンラーニングの処理が高速になる「Intel Deep Learning Boost」などの新機能が搭載されている。
> 説明のなかで、WRNCHATというソフトウェアを利用し、GPUよりもIntel Deep Learning Boostを有効にしたXeonプロセッサのほうがが5倍速いというデモを行なった。 >>920
物性の相というのは理論的にあんま面白くないと思うんだけど、
どこが面白いの? qiitaに真面目な機械学習系記事書いたけど何も反応ない
ランキング入りしてるのがツイッターレベルの初心者の感想文ばっか。
いいね押し合いするクラスタみたいのが存在してるのかね。やる気無くした。 同じorganizationの人同士でいいね押し合うからそういう所属の人がいいね数が多くなりがちという記事が以前qiitaに上がってたな >>924
いいねの数=内容の薄さ みたいな所あるからね >>932
あ〜。
的を得てるかもしれないな。
とはいえ、「いいね」が実際どういう人かわかれば、マーケットともいえる。
「どうでもいいね」もあるかもしれんけど。 >>924
ちゃんとした専門的な記事なら、そんなすぐチヤホヤされることにはならんでしょ 対象読者少ないし
中身のある記事だったら、むしろ1〜2年後でも実務者から参照される ワイも最近1年前のバイオ系の記事参考にしてゴニョゴニョしてる。イイネは1桁だね Qiitaはストック数も公開してほしい
投稿者ですら普通には見れなくてAPIからしか参照できないのは意味不明 >>924
どの会社がヤバイのか分かる
発注者目線では大変参考になる >>924
ギフハブに英語ドキュメントで公開してみたらどう? いいねだと刹那的な評価でインパクト重視になるしリピート率とか見てみたい >>945
記事に対するリピートだと
何回も見ないと判らないって事じゃね
判りやすく表現するのが良いところだと思う ユーザーを評価していいねの重み付けを変えたほうはいいかも 俺の経験上、いいねやRTを増やしたければ、偏差値30をターゲットにしないだめ
偏差値70をターゲットにすると、日本人の2%しかいないからね 偏差値60のワイは30向けの情報にイイネはしないぜー >>951
偏差値30がプログラミングなんかやるか? 日本ではアメリカみたいに低学歴にPythonと基本的な統計学を叩き込んで機械学習エンジニアに育てるみたいなの動き無いの? java教え込んでIT土方にする組織は山ほどあるけど 機械学習の利用が人海戦術で進められるなら勝手に土方がやるんでない ではデータセットを作りましょう。各自担当ターゲットを街で探して写真を撮ってきてください。最低でも1万枚 >>957
頭悪〜
その辺のドライブレコーダの動画を画像にすれば一瞬で終わる 何を扱いたいかにもよるけどドラレコ映像が必ずしも母集団を表せるとは限らないということ >>954-956
大手企業は、Python 土方を、2千〜数千人雇う それ単に今の非正規労働者がPython使うようになるだけであって、直接雇うわけじゃないから給料も労働環境も雇用形態も変わらないよ 機械学習のライブラリを使うだけなら数学とかの知識はあまり要らないから大卒雇っても賃金が高いだけで無駄、と思ってる企業がやってる事だから、賃金が安いままなのは当然 将来、AIで結果を出せる企業はダイキンみたいに自社社員を育てて内製化していくと思う ダイキンのPython 土方は、社員で、2千人とか >>967
よほど余裕が無いと厳しそう
基本的には外注になるんじゃないかなぁ
>>968
何か嫌な事でもあったのか? どのデータが必要かは内部の人でないと分からないんじゃない? ま、独自にAIアルゴリズムを作ってというフィールドは残るでしょうが
いま一生懸命自分でバンバンという人の多くは、その仕事はなくなるでしょうね。
独自に作って提供されても信用されないですよ。
いちいちアルゴリズム検証、その通りにできているか検証なんてやってられんもんね。
逆に残ったところは強いといえるかもね。 >>971
>いま一生懸命自分でバンバンという人の多くは、その仕事はなくなるでしょうね。
>独自に作って提供されても信用されないですよ。
>いちいちアルゴリズム検証、その通りにできているか検証なんてやってられんもんね。
これは今の営業事務そのもの
特に小売はインバウンドが大きすぎて指標が全く無く、検証も評価も何もできない状態なんだ
若干内部情報を好評すると、年間売上3%上昇すればいいところ、年間30%上がったり、10%下がったりしている
何の通例も憶測も通じない状態 >>955
Julia 教え込んでIT土方にしたら。 ここ実務者どれぐらいいるんかな
てかMLもしくはデータサイエンス従事者って国内ではまだまだ少ないような
流行ってるってんで本業の傍らに始める人も多そうだし >>974
Python学んでもう新しいプログラミング言語覚えないと心に決めたが
Julia見て行列計算の簡便さとスピードの速さで早くも心が揺らいでいる >>978
Juliaよく知らないけど、やっぱ速いんだね。
ちなみにどのくらいPythonと速さ違う?
自分はRが好きで使ってる。パイプ演算が楽しい。 >>980
GPU使わないコードで何も考えずにガウシアンプロセスさせてみるとnumpyで書いたコードと2〜3割違う
書き方がまずい可能性も大だけど、行列の転置をarr.conj().Tとかnp.matmulとか、そのあたりを細かくロスしてそうなんだよね
Pythonも@演算子が使えるようになって多少は綺麗になったけど、juliaはmatlabっぽくて行列演算の可読性がすごくいい
名前がちょっとアレなんで敬遠してたけど、実際にコードさわると食わず嫌いだったと痛感している
GPU周りのライブラリが充実しているのでしばらくはPython使うけど、将来は食われるかもなぁと素直に感じた >>984
なるほど、ありがとう。
名前がアレとはJuliaでググるとAV女優出てくるってことかな >名前がアレとはJuliaでググるとAV女優出てくるってことかな
ビデオをみて、パイは3.14じゃないという事実を知った >>975
大手も実装より分析止まりが多い印象
製造の目視検査も人手不足なら
キューピーみたいにAI使えばいいのに、普及しないな ここにきている人は、機械学習というよりAIという側面の人ばかりじゃないかな プログラムというより産業利用寄りの人もけっこう来てるのかな ほぼいないと思う
そもそも実務上で参考になる話も興味を呼ぶ話も
ないから仕方ないでしょう。
主に学生じゃないでしょうか。 このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 70日 11時間 48分 9秒 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php レス数が1000を超えています。これ以上書き込みはできません。