探検
【統計分析】機械学習・データマイニング26
レス数が950を超えています。1000を超えると書き込みができなくなります。
1デフォルトの名無しさん (ワッチョイ efda-zBa2 [223.217.165.150])
2019/09/15(日) 09:23:06.34ID:bjsiNRs40機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです
■関連サイト
機械学習の「朱鷺の杜Wiki」
http://ibisforest.org/
Machine Learningを用いた論文一覧2018
https://shiropen.com/seamless/machine-learning/2018
2017年のディープラーニング論文100選
https://qiita.com/sakaiakira/items/f225b670bea6d851c7ea
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76
■前スレ
【統計分析】機械学習・データマイニング23
https://mevius.5ch.net/test/read.cgi/tech/1551352040/
-
【統計分析】機械学習・データマイニング25
https://mevius.5ch.net/test/read.cgi/tech/1561568018/
【統計分析】機械学習・データマイニング24
https://mevius.5ch.net/test/read.cgi/tech/1556674785/
-
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:----: EXT was configured
VIPQ2_EXTDAT: checked:vvvvvv:1000:512:: EXT was configured
876デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
2020/01/04(土) 20:19:20.64ID:ENDwxYLV0 ねー
文系出身のワナビーだろう
直感はどちらに分類されるのだろうね
文系出身のワナビーだろう
直感はどちらに分類されるのだろうね
877デフォルトの名無しさん (ワッチョイ cb01-uetj [60.86.178.93])
2020/01/04(土) 20:27:40.67ID:dVmT9Zd40878デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 20:43:29.49ID:m+tPynmQ0 >>876
帰納法
帰納法
879デフォルトの名無しさん (アウアウエー Sa3f-UAPS [111.239.66.98])
2020/01/04(土) 20:52:46.32ID:YBqf4hfGa 日本での研究者の評価というと、真っ先に思い浮かぶのが科研費
過去の論文の数を基に、今後の計画を立てて予算申請する
一応審査しているのは専門家
専門性の高い論文を書いているかどうかが評価の基準
情報公開は・・・評価されるのかな?
そういうのを書く項目がないような気がする
過去の論文の数を基に、今後の計画を立てて予算申請する
一応審査しているのは専門家
専門性の高い論文を書いているかどうかが評価の基準
情報公開は・・・評価されるのかな?
そういうのを書く項目がないような気がする
880デフォルトの名無しさん (ブーイモ MM8f-GLZk [210.149.253.43])
2020/01/04(土) 21:56:53.64ID:xLbjEwkrM 君たちG検定はとるの?
881デフォルトの名無しさん (ワッチョイ ab01-FlZP [126.25.131.86])
2020/01/04(土) 22:06:24.08ID:NL29rqkc0 >>856
そんなものはない。
あってもVC次元使った奴とかバウンドが実際のデータ数よりも圧倒的に多いものしか計算できなくて
全く使い物にならん。
テストデータのサンプル数も何回か試して精度が安定する個数に設定するってのが現状。
この仕事、やってない奴ほど理論でなんとかなると思ってんだよな。
そこが実際とのギャップになってめんどくさい議論を増やしてる。
そんなものはない。
あってもVC次元使った奴とかバウンドが実際のデータ数よりも圧倒的に多いものしか計算できなくて
全く使い物にならん。
テストデータのサンプル数も何回か試して精度が安定する個数に設定するってのが現状。
この仕事、やってない奴ほど理論でなんとかなると思ってんだよな。
そこが実際とのギャップになってめんどくさい議論を増やしてる。
882デフォルトの名無しさん (ワッチョイ cb01-UAPS [60.120.23.126])
2020/01/04(土) 22:16:11.54ID:Eq0fd+t90 相対性理論は帰納法で導かれたよ
883デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 22:31:38.39ID:m+tPynmQ0 相対性理論は
仮説推定⇒演繹法による検証⇒ローレンツ変換不変の前提のもとで100%正しい
仮説推定⇒演繹法による検証⇒ローレンツ変換不変の前提のもとで100%正しい
884デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 22:34:59.55ID:m+tPynmQ0 仮説推定の検証が実験のみか理論かで分かれる
885デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 22:36:39.92ID:m+tPynmQ0 >>881
それはお前及びお前が出会ってきた人間がヘボいだけ
それはお前及びお前が出会ってきた人間がヘボいだけ
886デフォルトの名無しさん (ワッチョイ ab01-FlZP [126.25.131.86])
2020/01/04(土) 22:39:40.66ID:NL29rqkc0 >>885
そうだな。お前みたいなヘボイ奴ばっか相手にしてる。
そうだな。お前みたいなヘボイ奴ばっか相手にしてる。
887デフォルトの名無しさん (ワッチョイ cb01-UAPS [60.120.23.126])
2020/01/04(土) 22:41:53.90ID:Eq0fd+t90 例えば一般相対性理論は慣性質量と重力質量は等価である等の
小さな原理から大きな理論を構築した帰納的思考によるもの
小さな原理から大きな理論を構築した帰納的思考によるもの
888デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 22:45:01.46ID:m+tPynmQ0 だから仮説推定の後すぐに演繹法による検証をやってるのがアインシュタイン
889デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 22:46:21.57ID:m+tPynmQ0 実験やってないんだよ
890デフォルトの名無しさん (ワッチョイ cb01-UAPS [60.120.23.126])
2020/01/04(土) 23:11:36.37ID:Eq0fd+t90 実験したとかしないとか関係ないし
891デフォルトの名無しさん (ワッチョイ 3b09-37P1 [122.223.158.203])
2020/01/04(土) 23:15:56.70ID:m+tPynmQ0 ??
892デフォルトの名無しさん (ワッチョイ ab27-eg9S [164.70.253.210])
2020/01/05(日) 06:22:18.52ID:+jir1/5X0 自然言語処理のツールの使い方を覚えたいんですが
具体例のあるブログ記事ってないでしょうか
keras とか ALBERT とか tensorflow とかでてくるんですが
どれもインストール方法とかの説明はあるんですが
はじめからセットしてあるモデルに対して精度を出力して終わりみたいなブログ記事ばかりで
実際に日本語で質問文を投げてAIが返答するようなプログラムの書き方みたいなのが一切出てこないです
どうやって勉強すればいいんでしょうか
情報系の大学院生でプログラムはそこそこ経験があるんですが
AIに関しては原理を講義でならっただけでtensorflow すら使ったことがないレベルです
もうじき就活がはじまるのでAIが使えるってだけで有利になるらしいので
サンプルシステムを作ってみたいと思ってます
具体例のあるブログ記事ってないでしょうか
keras とか ALBERT とか tensorflow とかでてくるんですが
どれもインストール方法とかの説明はあるんですが
はじめからセットしてあるモデルに対して精度を出力して終わりみたいなブログ記事ばかりで
実際に日本語で質問文を投げてAIが返答するようなプログラムの書き方みたいなのが一切出てこないです
どうやって勉強すればいいんでしょうか
情報系の大学院生でプログラムはそこそこ経験があるんですが
AIに関しては原理を講義でならっただけでtensorflow すら使ったことがないレベルです
もうじき就活がはじまるのでAIが使えるってだけで有利になるらしいので
サンプルシステムを作ってみたいと思ってます
893デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
2020/01/05(日) 06:28:31.48ID:kv6ApXZt0 それは世間的には基礎的かもしれないが
現行のAIはそこまで対応してないだろ
文書の内容を機械が理解するのは高度
とりあえず日本→英語の翻訳を実装してみれば手がかり、オリジナリティを得られるのでは?
一般的な、唯一の手法はないという前提だが、じぶんがしらないだけかもしれないが
現行のAIはそこまで対応してないだろ
文書の内容を機械が理解するのは高度
とりあえず日本→英語の翻訳を実装してみれば手がかり、オリジナリティを得られるのでは?
一般的な、唯一の手法はないという前提だが、じぶんがしらないだけかもしれないが
894デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
2020/01/05(日) 06:35:30.27ID:kv6ApXZt0 2019/08/19 05:01
AI翻訳が人間超え、言葉の壁崩壊へ
1人に1台、自動翻訳機、多言語“通訳”がポケットに
第1部:市場動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00001/
2019/08/20 05:02
AI翻訳が人間超え、言葉の壁崩壊へ
トランスフォーマー時代到来、翻訳技術から汎用言語系AIに
第2部:技術動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00002/
AI翻訳が人間超え、言葉の壁崩壊へ
1人に1台、自動翻訳機、多言語“通訳”がポケットに
第1部:市場動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00001/
2019/08/20 05:02
AI翻訳が人間超え、言葉の壁崩壊へ
トランスフォーマー時代到来、翻訳技術から汎用言語系AIに
第2部:技術動向
https://tech.nikkeibp.co.jp/atcl/nxt/mag/ne/18/00046/00002/
895デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
2020/01/05(日) 06:41:07.68ID:kv6ApXZt0 総務省・NICT主催「多言語音声翻訳アイデアコンテスト」(第2回)優秀賞決定!
多言語音声翻訳コンテスト運営事務局 2019年12月19日
総務省と国立研究開発法人情報通信研究機構(NICT)は、12月14日(土)TEPIAホールにて、
多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速するため、
世界の「言葉の壁」をなくす新しいアイデアを募集する「多言語音声翻訳アイデアコンテスト」(第2回)審査会及び表彰式を開催いたしました。
https://prtimes.jp/main/html/rd/p/000000002.000050519.html
多言語音声翻訳コンテスト運営事務局 2019年12月19日
総務省と国立研究開発法人情報通信研究機構(NICT)は、12月14日(土)TEPIAホールにて、
多言語音声翻訳技術の更なる普及や多種多様な翻訳サービスの出現を加速するため、
世界の「言葉の壁」をなくす新しいアイデアを募集する「多言語音声翻訳アイデアコンテスト」(第2回)審査会及び表彰式を開催いたしました。
https://prtimes.jp/main/html/rd/p/000000002.000050519.html
896デフォルトの名無しさん (ブーイモ MM0f-80IA [202.214.231.24])
2020/01/05(日) 06:55:10.09ID:24cr/O3JM 機械学習だと固有値って教本にやたら出てくるけど具体的にどこで使うの?主成分分析だけ?
897デフォルトの名無しさん (ワッチョイ ab27-eg9S [164.70.253.210])
2020/01/05(日) 07:05:39.44ID:+jir1/5X0 >>893
ツールを使うだけではBOT同志で会話するっていうのは無理で
かなり高度なチューニングの知識?がいるってことなんでしょうか
ライブラリに適当な文章大量に流し込めば勝手に知識獲得してしゃべりだすものかと思ってました
ツールを使うだけではBOT同志で会話するっていうのは無理で
かなり高度なチューニングの知識?がいるってことなんでしょうか
ライブラリに適当な文章大量に流し込めば勝手に知識獲得してしゃべりだすものかと思ってました
898デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
2020/01/05(日) 07:15:11.42ID:kv6ApXZt0 人工知能が2019年センター試験の英語筆記本試験で185点を獲得 2019年11月19日
人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。
NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。
近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。
しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。
不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。
そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。
https://pc.watch.impress.co.jp/docs/news/1219388.html
人工知能プロジェクト「ロボットは東大に入れるか」の一環として、大学入試センター試験の英語筆記科目に挑戦した結果、185点(偏差値64.1)の成績を収めた。
NTTコミュニケーション科学基礎研究所(NTT CS研)ではこのプロジェクトを自然言語処理および知識処理の基礎研究を進めるベンチマークとして捉え、自動解答に関する知見を積み重ねてきた。
近年は深層学習に基づく文書読解技術が進展しており、そのなかの最新技術であるXLNetは、大規模テキストによる事前学習をベースモデルに、問題の性質に合わせた移転学習を施すことで、異なる種類の問題を比較的少量のデータから効率的に解くことを可能にした。
しかし、学習に利用できるデータが大きく不足している問題や、解答に辞書的な情報が不可欠な問題では、十分な精度の解答が得られなかった。
今回NTT CS研は以下の点で改善を施し、過去3年間のセンター本試験/追試験に対して適用した結果、安定して偏差値60以上を達成したという。
不要文除去問題の高精度化
機械学習は正解と不正解のデータの両方を入力して学習するが、文章から不要な文を見つける比較的新しい「不要文除去問題」には適用できない。
というのも、通常の文章には不要な文が含まれておらず、学習に用いるデータを集めることが難しいためだ。このため従来のAIでは、本試験/追試験で15問中6問しか正解できなかった。
そこで、不要文を含まない通常の文章から、文の順序を組み替えて擬似的に不自然な流れを作成することで、大量の不要文除去問題を自動作成する手法を考案。
これにより15問すべて正答できたという。また、過去問や独自作成問題からなるベンチマークデータにおいても、正答率を60%から86%までに高められた。
https://pc.watch.impress.co.jp/docs/news/1219388.html
899デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
2020/01/05(日) 13:14:15.07ID:5vFDsLtv0 >>881
ないならつくるのが研究者の課題じゃ無いのかな?
ないならつくるのが研究者の課題じゃ無いのかな?
900デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
2020/01/05(日) 13:16:19.91ID:5vFDsLtv0 科学って帰納的に仮説を立てて実証することの繰り返しじゃね?
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う
その仮説を立てたりどんな実証方法があるかを考えたりするのにこれまでに判っている事を演繹的に適用して論理展開する
両方の思考が必要だと思う
901デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
2020/01/05(日) 13:17:44.79ID:5vFDsLtv0 >>882
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している
時間や空間が絶対的なものではなくて光の速さが絶対的だと言う仮定を元に演繹的に論理展開していったものだと理解している
902デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
2020/01/05(日) 13:19:41.39ID:5vFDsLtv0903デフォルトの名無しさん (ワッチョイ 9bda-UAPS [114.185.50.145])
2020/01/05(日) 13:31:19.77ID:98+Qbn7z0 マウント合戦
904デフォルトの名無しさん (ブーイモ MM7f-nmBI [163.49.211.159])
2020/01/05(日) 13:34:07.84ID:/FsL/PEZM 物理は実験が主だよ
アインシュタインみたいな理論屋は凄いけど実験で確認出来なかったら只の妄想
アインシュタインみたいな理論屋は凄いけど実験で確認出来なかったら只の妄想
905デフォルトの名無しさん (ワッチョイ 9bda-UAPS [114.185.50.145])
2020/01/05(日) 13:41:29.59ID:98+Qbn7z0 イタチ野郎
906デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
2020/01/05(日) 14:55:53.83ID:5vFDsLtv0907デフォルトの名無しさん (ワッチョイ cb01-uetj [60.86.178.93])
2020/01/05(日) 15:01:35.73ID:Xx30ZH0k0 >>897
(ヾノ・∀・`)ナイナイ
大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。
(ヾノ・∀・`)ナイナイ
大量に話しかけてやれば
そのうち
それっぽい応答するようになる、かもしれない
日本語対応Python3系のコードっていうと
ちょっと古いが、
unmoっていうのがある。
探して読んでインスコして遊んでみれ。
908デフォルトの名無しさん (ワッチョイ ef1d-iOMu [143.189.31.12])
2020/01/05(日) 15:38:21.14ID:rjC1FbEm0 ガチ勢はフツーの線形代数じゃなくて、行列の微分が自然に出てくる領域で、
一般相対論とスキルセットで親和性が高かったりする。
一般相対論とスキルセットで親和性が高かったりする。
909デフォルトの名無しさん (ブーイモ MMbf-eGyC [49.239.69.93 [上級国民]])
2020/01/05(日) 17:38:18.20ID:qqN6BGPlM >>906
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ
もちろん理論も大事なんだけど、物理の場合は理論がいくら発展しても実験で確かめられないと意味がないという風潮があるよ
電磁気力、弱い核力、強い核力を統一する大統一理論の有力候補の超対称性理論ってやつも、多分理論としてはかなり綺麗にまとまってるんだと思うけど、超対称性粒子が全然実験で検出されないからなかなか立場的に厳しいみたい
重力まで統一する万物の理論に関しては、例えば超弦理論なんかだと決めるべきパラメータが多すぎて、また実験も惑星規模の加速器を作ったりしなきゃいけないらしく、現実的にこの世界に適合する超弦理論が得られるかというと怪しいみたいで、物理学の仮説として取り扱うのすら反対意見があるらしいよ
910デフォルトの名無しさん (ワッチョイ efab-nmBI [39.111.85.105])
2020/01/05(日) 17:57:18.05ID:ZpTtXk4N0 >>909
風潮じゃなくてニュートン以来の原則が実験ですよ
何故か物理は数式で表せて、しかも美しい数式になるという所から、ここ100年ちょっとは美しさという指標で、理論だけでもドンドン発展させられたのさ
風潮じゃなくてニュートン以来の原則が実験ですよ
何故か物理は数式で表せて、しかも美しい数式になるという所から、ここ100年ちょっとは美しさという指標で、理論だけでもドンドン発展させられたのさ
911デフォルトの名無しさん (ワッチョイ efda-37P1 [223.217.162.112])
2020/01/05(日) 18:08:53.21ID:qL+E1kAs0 実験検証でのデメリットとしては、実験でよい結果が得られた⇒だから正しい⇒終わり
としてしまう人が発生すること。
たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。
○-○aveなんかはその最たる例ですね
としてしまう人が発生すること。
たまたま偶然よい結果がでただけの可能性を疑わない人がいるんですよね。
○-○aveなんかはその最たる例ですね
912デフォルトの名無しさん (アウアウウー Sa0f-qQU+ [106.154.126.11])
2020/01/05(日) 19:11:04.25ID:aadHI+RPa アニーリング方式は100%最適解が求まる類のものではないんじゃないの?
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど
ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな
量子の振る舞いの結果を計算結果とみなすってことだろうし
量子ゲート方式なら論理演算ができるのかもしれないけど
ノイマン型でも誤り訂正とかしないとミスは起きるし
量子ビットも誤り訂正とかの技術が確立されてきたらエラー率が下がるんじゃないかな
913デフォルトの名無しさん (ワッチョイ efda-37P1 [223.217.162.112])
2020/01/05(日) 19:22:52.95ID:qL+E1kAs0 >アニーリング方式は100%最適解が求まる類のものではないんじゃないの?
そのとおり。量子アニーリングで得た結果は最適解である保証はありません。
結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。
そのとおり。量子アニーリングで得た結果は最適解である保証はありません。
結果だけ切り取った結果、無駄な投資を生んでしまい、日本の量子コンピュータ検討の邪魔する結果となってしまいました。
914デフォルトの名無しさん (ワッチョイ efda-37P1 [223.217.162.112])
2020/01/05(日) 19:24:37.61ID:qL+E1kAs0915デフォルトの名無しさん (ワッチョイ ab01-FlZP [126.25.131.86])
2020/01/05(日) 19:43:23.83ID:6gmeklwC0 全くすれ違いだし
そもそもお前ら実験も理論もどっちもやってねーだろ。。
そもそもお前ら実験も理論もどっちもやってねーだろ。。
916デフォルトの名無しさん (ワッチョイ 0f10-qQU+ [153.131.102.129])
2020/01/05(日) 20:06:43.95ID:5vFDsLtv0 組合せ最適化問題を解ければ判別問題の学習結果を
より早くより正確に得られるようになるんじゃね?
より早くより正確に得られるようになるんじゃね?
917デフォルトの名無しさん (スッップ Sdbf-37P1 [49.98.159.214])
2020/01/05(日) 20:07:51.30ID:y5M6+8m0d918デフォルトの名無しさん (スッップ Sdbf-37P1 [49.98.159.214])
2020/01/05(日) 20:08:34.48ID:y5M6+8m0d >>916
それ以上はスレ違いですね
それ以上はスレ違いですね
919デフォルトの名無しさん (ワッチョイ ab01-FlZP [126.25.131.86])
2020/01/05(日) 20:49:34.82ID:6gmeklwC0920デフォルトの名無しさん (ワッチョイ ab27-eg9S [164.70.253.210])
2020/01/05(日) 21:17:01.17ID:+jir1/5X0 >>907
ありがとうございます!
ありがとうございます!
921デフォルトの名無しさん (ワッチョイ 0f63-bcBw [153.218.137.102])
2020/01/06(月) 06:54:23.54ID:KyZp9b9y0 いよいよ人間超え、AI最新事情 文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
2019/11/13
文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
かつてはディープラーニング(深層学習)の適用が難しいと言われていた自然言語処理の分野でも、人工知能(AI)が人間の認識精度を上回るようになった。
グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。
言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え(換言)、表現が異なる2つの文章の意味が同じかどうかの判断(含意関係認識)などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。
文章読解のスコアで人間超え
具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。
SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/01056/111200002/
2019/11/13
文章読解でもAIがついに人間超え、グーグルの「BERT」発表から1年で急成長
かつてはディープラーニング(深層学習)の適用が難しいと言われていた自然言語処理の分野でも、人工知能(AI)が人間の認識精度を上回るようになった。
グーグルが2018年10月に発表したBERTは、文章の「言語らしさ」を予測する言語モデルを「Transformer」というニューラルネットワークを多段に重ねて実装したものである。
言語らしさの予測は、AIが単語や文章を理解したり自然な文章を生成したりするうえで必要不可欠な要素である。
言語モデルの応用先としては、機械翻訳や機械読解、質問応答、言葉の言い換え(換言)、表現が異なる2つの文章の意味が同じかどうかの判断(含意関係認識)などがある。
グーグルのBERTは自然言語処理の世界に衝撃を与え、論文の発表からわずか1年で2200件以上も他の論文に引用されるほどになった。
これは、BERTが応用に関するベンチマークで人間の精度を上回る成果を上げたからだ。
文章読解のスコアで人間超え
具体的には機械読解のベンチマークである「SQuAD 1.1」で人間の精度を上回った。
SQuAD 1.1は米スタンフォード大学が作ったベンチマークで、「Wikipedia」の中にある140単語ほどの文章を読み解かせて、その文章に関する質問に回答させる。
正答は元の文章の中にフレーズとして存在する。正答の部分を正しく抜き出せるかどうかがポイントとなる。
SQuAD 1.1はタスクとして単純すぎるという指摘もある。
SQuAD 1.1よりタスクの難易度が高いベンチマークは「SQuAD 2.0」や「GLUE」など他にもあり、そうしたより難しいベンチマークではBERTは人間を上回れなかった。
しかしBERTが一部でも人間をスコアで上回ったことから、この分野の研究が一気に加速し、今ではBERTを改善した手法が、より難しいベンチマークでも人間超えを果たすようになった。
https://tech.nikkeibp.co.jp/atcl/nxt/column/18/01056/111200002/
922デフォルトの名無しさん (ワッチョイ 3bdd-BJMr [122.249.73.11])
2020/01/06(月) 16:22:20.03ID:7M4Z0nKv0 この手のテストに和文が無いからいまいちよくわからん
923デフォルトの名無しさん (ワッチョイ 6b54-hZl1 [180.235.0.69])
2020/01/06(月) 19:21:10.07ID:SSsR6M4H0 MSRの連中が描いた本(pdf)だってさ
Foundations of Data Science
https://www.cs.cornell.edu/jeh/book.pdf
日本の研究者はなーんもしない
Foundations of Data Science
https://www.cs.cornell.edu/jeh/book.pdf
日本の研究者はなーんもしない
924デフォルトの名無しさん (アウウィフ FF0f-p4uH [106.171.87.46])
2020/01/07(火) 15:50:31.93ID:2Dq0zKSWF925デフォルトの名無しさん (ワッチョイ 4f7c-I5PR [113.32.86.138])
2020/01/07(火) 16:00:42.05ID:8esPW0SX0 >>908
<・∇・>ニダ
<・∇・>ニダ
926デフォルトの名無しさん (ワッチョイ 5bda-2fhw [223.217.162.112])
2020/01/08(水) 03:38:16.27ID:LHUjt0c20927デフォルトの名無しさん (ワッチョイ 5bda-2fhw [223.217.162.112])
2020/01/08(水) 04:04:04.17ID:LHUjt0c20 >>908
ガチ勢は一般相対性理論なんて言わない。ゲージ曲率かファイバー束における写像の捻れで語る
ガチ勢は一般相対性理論なんて言わない。ゲージ曲率かファイバー束における写像の捻れで語る
928デフォルトの名無しさん (ワッチョイ b5da-lB9F [118.18.7.9])
2020/01/08(水) 10:16:28.43ID:XvkUwLSh0 イタチの屁
929デフォルトの名無しさん (ワイーワ2 FF13-Eg5K [103.5.142.233])
2020/01/09(木) 11:42:39.35ID:0RBXSUPhF https://hayabusa9.5ch.net/test/read.cgi/news/1578536733/
NVIDIA製GPUドライバーに深刻な脆弱性、いますぐIntelオンボードを利用に切り替えてください
NVIDIA製GPUドライバーに深刻な脆弱性、いますぐIntelオンボードを利用に切り替えてください
930デフォルトの名無しさん (ワッチョイ 5bda-2fhw [223.217.162.112])
2020/01/10(金) 00:41:45.45ID:xMwSVvEb0931デフォルトの名無しさん (ワッチョイ 5bda-2fhw [223.217.162.112])
2020/01/10(金) 02:20:32.44ID:xMwSVvEb0 まあ、学生さんはデータナンちゃらリストなんてうつつ抜かしてないで、各専門の基礎教科の習得に励みましょう。
機械学習なんてあくまで多数ある問題解決手段の1ツールに過ぎない。そもそも機械学習の習得なんて社会人からでも十分。
機械学習なんてあくまで多数ある問題解決手段の1ツールに過ぎない。そもそも機械学習の習得なんて社会人からでも十分。
932デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.68.64])
2020/01/10(金) 08:00:59.46ID:MP8EZybiM excelくらいのもんだね
933デフォルトの名無しさん (ワッチョイ fddd-fF6T [122.249.73.11])
2020/01/10(金) 11:21:21.64ID:dy6nGdDz0 数年後には無くなってそう>>データサイエンティスト
934デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.68.64])
2020/01/10(金) 11:33:30.82ID:MP8EZybiM 業務の一部として取り込まれる未来
935デフォルトの名無しさん (アウアウカー Sa61-xSig [182.251.143.133])
2020/01/10(金) 12:28:08.40ID:9hvTdV+ca データを元に業務上の判断をするのがデータサイエンティストの仕事
これは技術者にとって本質的な能力なのでデータサイエンティストという呼び名が無くなったとしてもこの能力を必要としなくなるわけではない
これは技術者にとって本質的な能力なのでデータサイエンティストという呼び名が無くなったとしてもこの能力を必要としなくなるわけではない
936デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.68.64])
2020/01/10(金) 12:31:18.21ID:MP8EZybiM データを元に判断するのは、豊臣秀吉もやってたそうだから今更感
937デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
2020/01/10(金) 12:35:48.58ID:K/lWprnk0 秀吉はデータサイエンティスト。
938デフォルトの名無しさん (アウアウウー Sa19-8whf [106.180.2.62])
2020/01/10(金) 12:47:28.71ID:ap2klRr+a 技術者にはもともとデータサイエンティスト的な要素があったのに、それだけが妙に持ち上げられた
そのうち、訳もわからずデータをライブラリにぶち込むだけの人をデータサイエンティストと蔑むことになるよ
そのうち、訳もわからずデータをライブラリにぶち込むだけの人をデータサイエンティストと蔑むことになるよ
939デフォルトの名無しさん (ワッチョイ 7d02-tgR8 [58.70.65.108])
2020/01/10(金) 13:15:10.43ID:W4/veIGi0 データサイエンティスト的なタスクって、
業務に携わってる奴がやるのが世界の普通のような
システム屋にやらせるから応用範囲が限定される
業務に携わってる奴がやるのが世界の普通のような
システム屋にやらせるから応用範囲が限定される
940デフォルトの名無しさん (ワントンキン MMa3-fF6T [153.248.186.192])
2020/01/10(金) 14:59:12.98ID:jdArXowMM マクロかexcelにツールがついて終わり
941デフォルトの名無しさん (ワッチョイ 239c-fZro [61.125.210.189])
2020/01/10(金) 16:48:37.09ID:3HDQydXj0 若手の自称データサイエンティストと話すと
linuxわかりませんとか言う人マジで多くて嫌になる
どこがのスクール出身なのか?
クラウドのjupyter notebook上でしかコード書いたことないらしい
マジで基礎がガバガバ
そこを身につけるのは地味で退屈だから最近の人はやりたがらないのはわかるが
linuxわかりませんとか言う人マジで多くて嫌になる
どこがのスクール出身なのか?
クラウドのjupyter notebook上でしかコード書いたことないらしい
マジで基礎がガバガバ
そこを身につけるのは地味で退屈だから最近の人はやりたがらないのはわかるが
942デフォルトの名無しさん (ワッチョイ 2390-ErPi [59.85.19.163])
2020/01/10(金) 16:53:19.80ID:XoWOAf9+0 ツールの話でマウントとろうとすると僕は馬鹿ですって自己紹介してるのと同じだからやめた方が良いよ
943デフォルトの名無しさん (JP 0Heb-WK+R [219.162.33.141])
2020/01/10(金) 16:54:28.69ID:iWyShsMIH エクセルで完結はさすがにない
944デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.68.64])
2020/01/10(金) 17:00:34.97ID:MP8EZybiM 分析から先の仕事メインならlinux知らなくてもいいかなと
技術者でなく、ただのビジネスマンだと思うが
技術者でなく、ただのビジネスマンだと思うが
945デフォルトの名無しさん (ガックシ 068b-Fdcu [133.15.250.10])
2020/01/10(金) 17:03:43.90ID:apRS/vPU6 リモートサーバにコード投げて動かすときくらいしかまともにlinuxコマンド使わんわ
vscodeで開発してるからvimも最低限しか使えない
vscodeで開発してるからvimも最低限しか使えない
946デフォルトの名無しさん (ワッチョイ fdb4-Tj/C [122.23.251.84])
2020/01/10(金) 17:03:57.42ID:6tzIS8Z40 自前で動かそうとしたらLinuxはあったほうがいいよ
947デフォルトの名無しさん (スップ Sd03-uhcM [1.66.97.8])
2020/01/10(金) 17:34:07.53ID:1UGZVEFGd948デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.64.31])
2020/01/10(金) 17:39:06.54ID:o1aiizUGM データサイエンス系の仕事手伝ってるけどSI屋が分析より下のレイヤーやるようになりそうな雰囲気
ETLとかの延長で出来るところまで
ETLとかの延長で出来るところまで
949デフォルトの名無しさん (ワッチョイ 239c-fZro [61.125.210.189])
2020/01/10(金) 17:43:26.30ID:3HDQydXj0 >>947
ウチはジョブキュー使ってコマンドで投げるから
最低でも一連の学習処理をシェル化して
入力ファイルを配置してサブミットするというのができないと詰むんだけど
大したことではないはずなのにわかりませんとかさあ
ウチはジョブキュー使ってコマンドで投げるから
最低でも一連の学習処理をシェル化して
入力ファイルを配置してサブミットするというのができないと詰むんだけど
大したことではないはずなのにわかりませんとかさあ
950デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.64.31])
2020/01/10(金) 17:47:52.64ID:o1aiizUGM kaggleみたいなUIにしとけばいいんかな
951デフォルトの名無しさん (ワントンキン MMa3-fF6T [153.248.186.192])
2020/01/10(金) 19:00:13.93ID:jdArXowMM msの技術力を侮ってはいけない
いずれexcelに付くよ
いずれexcelに付くよ
952デフォルトの名無しさん (JP 0Heb-WK+R [219.162.33.141])
2020/01/10(金) 19:03:54.70ID:iWyShsMIH そら小規模データならエクセルでも可だろうけど
ちょっと大きいデータ扱うと重たくてどうしようもないしょ
ちょっと大きいデータ扱うと重たくてどうしようもないしょ
953デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
2020/01/10(金) 19:16:19.21ID:9TebhQDM0954デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
2020/01/10(金) 19:19:06.71ID:9TebhQDM0955デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
2020/01/10(金) 19:20:16.63ID:9TebhQDM0 >>952
表示の更新とか完了するまで再計算を停止するとスピード上がる
表示の更新とか完了するまで再計算を停止するとスピード上がる
956デフォルトの名無しさん (ワッチョイ 0b10-xl+7 [153.131.102.129])
2020/01/10(金) 19:22:21.42ID:9TebhQDM0 ピボットテーブルとかはexcelの方が作業効率良くない?
GUIで操作できるし
GUIで操作できるし
957デフォルトの名無しさん (JP 0Heb-WK+R [219.162.33.141])
2020/01/10(金) 19:41:25.05ID:iWyShsMIH 議論するつもりはないけど、前処理やらバッチ処理するのもエクセルでやるんかな
958デフォルトの名無しさん (ワッチョイ dbab-ZFGq [39.111.85.105])
2020/01/10(金) 19:45:47.30ID:OuRZpUf20 VBAで数値積分する人もいるから、ありえる
jupyterの人も増えそうだけど
jupyterの人も増えそうだけど
959デフォルトの名無しさん (アウアウウー Sa19-vCMi [106.154.137.133])
2020/01/10(金) 19:55:10.38ID:hc3qGoBHa >>933
誰でもタイピングする様になってタイピストが居なくなったように、データサイエンティストもなるかもね
誰でもタイピングする様になってタイピストが居なくなったように、データサイエンティストもなるかもね
960デフォルトの名無しさん (ワッチョイ 6501-tgR8 [126.25.131.86])
2020/01/10(金) 20:00:51.64ID:gdjTauNe0 >>941
jupyter使いは信用するなってのがこの業界の鉄則だぞ。
jupyter使いは信用するなってのがこの業界の鉄則だぞ。
961デフォルトの名無しさん (ワッチョイ 5b1d-3ULX [143.189.31.12])
2020/01/10(金) 20:24:48.47ID:eyebCCoV0 filemakerとかkintoneの流れでexcellって消えていくのかと思ってた。
pythonも使えるようになってるっぽいし、pandasとかRとGUIが融合したみたいになっていくのか。
pythonも使えるようになってるっぽいし、pandasとかRとGUIが融合したみたいになっていくのか。
962デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
2020/01/11(土) 01:41:29.68ID:r5wulSj/0 Linux板でよくExcel対スパコンみたいな話してるけどな。
Excelはスパコンより性能が低いからもうWindows使わないみたいな。
Excelはスパコンより性能が低いからもうWindows使わないみたいな。
963デフォルトの名無しさん (ブーイモ MM43-ZFGq [49.239.67.10])
2020/01/11(土) 11:21:35.22ID:R+Z8VLSZM スコップとショベルカーみたいな関係かね。
自分は重機好き?だからWindows使いたくないんだけど、仕事ではWindows上でVirtualBox動かしてlinux+dockerしてる。
退勤時間はexcelで集計したりしてる
適材適所やね
自分は重機好き?だからWindows使いたくないんだけど、仕事ではWindows上でVirtualBox動かしてlinux+dockerしてる。
退勤時間はexcelで集計したりしてる
適材適所やね
964デフォルトの名無しさん (アウアウエー Sa93-rY/a [111.239.175.136])
2020/01/11(土) 11:41:24.42ID:vkWme/+ta Excelはあくまでデータとビューが同時に確認できることがメリット
明らかに一画面に収まらないぐらい大量のデータや大量のグラフが必要になるものをExcelで処理している時点で使い道を誤っている
一画面に収まらないなら素直にデータとビューを分離できる仕組みで処理すべき
明らかに一画面に収まらないぐらい大量のデータや大量のグラフが必要になるものをExcelで処理している時点で使い道を誤っている
一画面に収まらないなら素直にデータとビューを分離できる仕組みで処理すべき
965デフォルトの名無しさん (ワッチョイ e35c-Fdcu [115.36.244.223])
2020/01/11(土) 11:45:43.40ID:ucFJPBVI0 excel使うくらいならmatlab使う
966デフォルトの名無しさん (ワッチョイ 1501-GYCx [60.86.178.93])
2020/01/11(土) 12:35:50.32ID:WuYSTrVT0 >>962
テラワロスwwwwwwww
テラワロスwwwwwwww
967デフォルトの名無しさん (ワッチョイ 2390-tgR8 [59.85.19.163])
2020/01/11(土) 20:57:36.20ID:H7kAoHn50968デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78])
2020/01/12(日) 03:23:49.39ID:gh55rPFY0969デフォルトの名無しさん (ワッチョイ 0bbb-ZJ4Y [217.178.3.78])
2020/01/12(日) 03:26:42.09ID:gh55rPFY0 ライブラリ使わずに自分でAIプログラム書きました
といわれても、プログラムが信用できへんで
といわれても、プログラムが信用できへんで
970デフォルトの名無しさん (ワッチョイ 6501-ErPi [126.242.217.97])
2020/01/12(日) 04:33:11.51ID:Uj5X0q1W0 Excelのシートは業務のノウハウそのものなので、使われてきたシートのせいでシステム化が出来ないというのなら、インテグレータとして失格だと思うというか、普段なんでお金貰えてるの?と不思議に思う。
OAと言ってた頃はまさに詐欺で飯食ってたけど。
いま同じことしたら普通に詐欺で訴えられると思う。
OAと言ってた頃はまさに詐欺で飯食ってたけど。
いま同じことしたら普通に詐欺で訴えられると思う。
971デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
2020/01/13(月) 00:58:09.24ID:HVnwH/nI0 ≪株式会社学情 調査≫
『2020年卒 就職人気企業ランキング【速報】』
http://service.gakujo.ne.jp/files/7415/5374/1191/2020_ranking.pdf
IT・ソフトウェアの最上位
26位 アマゾンジャパン
AIとか若い奴は興味ないんだろうな
『2020年卒 就職人気企業ランキング【速報】』
http://service.gakujo.ne.jp/files/7415/5374/1191/2020_ranking.pdf
IT・ソフトウェアの最上位
26位 アマゾンジャパン
AIとか若い奴は興味ないんだろうな
972デフォルトの名無しさん (アウアウカー Sa61-xSig [182.251.149.138])
2020/01/13(月) 01:05:12.23ID:bgtYO71Ta 日本企業の技術系なら理系であれば何学部出身でも採用の可能性があるが
GAFAみたいな外資だと情報系で修士か博士取っていないと門前払いだからそもそも応募資格のある人数が圧倒的に少ないので仕方がない
GAFAみたいな外資だと情報系で修士か博士取っていないと門前払いだからそもそも応募資格のある人数が圧倒的に少ないので仕方がない
973デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
2020/01/13(月) 01:08:04.53ID:HVnwH/nI0974デフォルトの名無しさん (ワッチョイ 5501-ErPi [220.56.102.222])
2020/01/13(月) 01:21:36.71ID:HVnwH/nI0975デフォルトの名無しさん (ワッチョイ 6501-tgR8 [126.25.131.86])
2020/01/13(月) 01:55:13.05ID:xcD2sz0v0 20年前のgoogle考えたら、今はちっこいベンチャーなとこ(日本じゃなくて)行かんとダメなんじゃねーの?
976デフォルトの名無しさん (ワッチョイ 239c-fZro [61.125.210.189])
2020/01/13(月) 04:39:22.46ID:AqVlGfb/0 若いのになんでこんな保守的なんだろうなw
金儲けしたい訳でもなさそうだし
おじさん世代からすると今の若い奴なんていくらでも
多様な道があると思うのだが
金儲けしたい訳でもなさそうだし
おじさん世代からすると今の若い奴なんていくらでも
多様な道があると思うのだが
レス数が950を超えています。1000を超えると書き込みができなくなります。
ニュース
- バリ島で男子生徒ら集団万引きか、防犯カメラ映像が拡散 京都の大谷中学・高校が「窃盗行為」謝罪★4 [七波羅探題★]
- 【地震速報】青森県で震度6強 沿岸部に津波警報 ★6 [ぐれ★]
- 中国軍機レーダー照射、トランプ氏沈黙突く 試される日本外交 [蚤の市★]
- 【速報】気象庁は津波注意報すべて解除 [蚤の市★]
- 【サッカー】58歳カズ「オファーが来ている」 J3福島と近日中にも交渉 早ければ年内にも決断 [征夷大将軍★]
- 「日の丸にバツ印」掲げた大学生 あいまいな国旗損壊罪に「怖い」 The Mainichi [少考さん★]
- 働いて参ります
- ( ・᷄ὢ・᷅ )あ?
- 地震
- こんぺこ!こんぺこ!こんぺこ!🐰🏡
- 早大名誉教授「高市内閣の高支持率はデータ操作か、支持している日本人がアホなのか」👈核心を突いてしまう [868050967]
- ブタをぶったたく
