自然言語処理スレッド　その４

**デフォルトの名無しさん** · 2014/06/03(火) 05:40:00.54

前前スレ　自然言語処理スレッド　その２
http://mimizun.com/log/2ch/tech/1173105287/
前スレ　自然言語処理スレッド　その３
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。

**デフォルトの名無しさん** · 2015/08/08(土) 17:03:17.95

イヤイヤ、Javascriptはかなり難しいよ。

C++は基本的に型がハッキリしてるから、コンパイラが誤りをみつけてくれるけど、
Javascriptは実行しないとわからない。
テストを書いても簡単にすり抜けるし、毛が抜ける。

**デフォルトの名無しさん** · 2015/08/08(土) 17:30:12.22

JavaScriptよりC++がかんたんに思えるとしたら
それはおそらくC++をCに近い状態で書いている

**デフォルトの名無しさん** · 2015/08/08(土) 17:37:01.00

>>353
Cもかなり難しいよ。

C++が一番簡単だよ。
C++11以降はほとんど何の文句もない。
やりたいことがすぐできるようになってる。

元の話題に出てくる、MecabをもしもJavascriptで書くとかなったら
腹痛と吐き気に悩まされると思う。
誰でも。

**デフォルトの名無しさん** · 2015/08/08(土) 17:56:22.37

君がJavaScriptの書き方知らないだけでしょ

**デフォルトの名無しさん** · 2015/08/08(土) 18:24:19.95

>>354
＞Cもかなり難しい
C ⊂ C++ だからCのほうがやさしい

＞C++が一番簡単
おそらくC++とJSの学習量が違ってる
同じ学習量だったらJSのほうがやさしい

**デフォルトの名無しさん** · 2015/08/08(土) 18:32:46.48

>>356
イヤイヤ、C++が一番簡単。

Cなんてオーバーロードすらできないし。

**デフォルトの名無しさん** · 2015/08/08(土) 18:49:06.65

テスト書いててすり抜けの意味がわからない
jsの仕様わかってないだけやん

**デフォルトの名無しさん** · 2015/08/08(土) 18:58:24.44

>>356
一票！

**デフォルトの名無しさん** · 2015/08/08(土) 19:06:53.94

Javascriptは難しいよ。
テンプレートすらないし。

**デフォルトの名無しさん** · 2015/08/09(日) 08:06:39.17

頭がC++で凝り固まってるんだろ
多言語使えない可哀想なやつになっちゃったね

**デフォルトの名無しさん** · 2015/08/09(日) 14:40:14.70

動的型言語のjavascriptに対して、templateも無いから難しいって言ってる時点で、jsに対する知見がないわけで、、、
知見のない人が優劣判断なんて出来るはずもないと思うの、、、

**デフォルトの名無しさん** · 2015/08/09(日) 18:55:33.51

速度重視と言いながらmltonを使わずにc言語使っちゃう人が多すぎる
どこが速度重視なんだ

**デフォルトの名無しさん** · 2015/08/09(日) 20:52:48.18

JavaScript書き方が多彩すぎてつらい

**デフォルトの名無しさん** · 2015/08/09(日) 20:54:49.89

JavaScript書き方が多彩すぎてつらい

**デフォルトの名無しさん** · 2015/08/09(日) 21:27:14.38

大事なこと？

**デフォルトの名無しさん** · 2015/08/09(日) 22:32:14.42

本当にJavascriptで自然言語処理してるのか?

**デフォルトの名無しさん** · 2015/08/15(土) 01:46:01.15

動的型付けが簡単だと言ってる奴は書捨てしか書いたことないか脳内型推論が得意な天才

**デフォルトの名無しさん** · 2015/08/21(金) 09:53:06.85

田宮栄一かよ

**デフォルトの名無しさん** · 2015/08/23(日) 18:26:25.13

分布表現の正確な定義は？

**デフォルトの名無しさん** · 2015/08/31(月) 18:43:52.25

25000×25000＝626000000通りの「共起関係」、及び２９種類の「属性」を、人力で分析してアノテーションコーパスを作成すべき！

(3) 学習語彙：小学生用の国語辞典に登録されている語彙約 25000 語。語彙数は，『新教育基本語彙』[3]などを根拠とする。
小学生の理解語彙の上限を示すとされる。
http://www.nise.go.jp/kenshuka/josa/kankobutsu/pub_f/f-141/f-141_2.pdf

本研究では，意味の似ている語をまとめると共起ベクトルの距離は近くなるという仮定を前提に，単語間の共起頻度を用い
るのではなく，単語に付随する意味属性を利用する．単語の意味属性には，単語を意味によって分類整理したシソーラスであ
る分類語彙表を利用し分類語に適用する．
http://db-event.jpn.org/deim2015/paper/335.pdf

意味役割の種類
現段階での意味役割の種類を記述する．大きく 4 つの類にわけて，中分類で 29 種類を定義した．
さらにこれらに対して属性タイプが付与される形である．まず 29 種類を以下に示す．
構文類 ? 連語，外の関係，補語相当
対象類 ? 経験者，被使役者，対象，基準, 相互, 起点，着点，起点・着点，通過点，経路，方向
動作主類 ? 使役，原因，動作主，使役者，手段
条件周辺類 ? 限界，領域，場所，時間，条件，様態，程度，目的，順接，逆接
http://www.ninjal.ac.jp/event/specialists/project-meeting/files/JCLWorkshop_no6_papers/JCLWorkshop_No6_06.pdf

**デフォルトの名無しさん** · 2015/09/02(水) 08:44:33.62

ここって低レベルな話でもいい？

全文検索したくてSuffix Arrayを作ってみたんだけど
調べるとTrieというデータ構造もあるじゃない？

Trieで文字単位の全文検索の準備をする場合は
Trie構築時に文字列の開始位置を1文字ずつずらして切り出した文字列を入力すればいいの？

**デフォルトの名無しさん** · 2015/09/08(火) 17:07:13.89

新井　今の人工知能にとって一番難しいのは深い言語処理。例えば、人間が何かを命令してロボットがそれを
理解して何かをする場合、命令パターンが決まっていれば簡単です。ですが災害救助現場などで、人間が何か
の指示をして、ロボットが画像認識による状況理解と合わせて問題解決する場合は難しい。そして、
もっとも必要なのは深い言語処理です。
　数学や物理の問題に見られる非常に限られたフレームという縛りがある設定であっても、現段階の自然言語
処理では極めて困難です。でもそこが一番伸びしろが大きいことも事実です。
https://cakes.mu/posts/10730

**デフォルトの名無しさん** · 2015/09/12(土) 09:59:59.57

>>371
＞25000×25000＝626000000通りの「共起関係」

有り得る共起関係、有り得ない共起関係。

例えば「自動車に乗る」は○だが、「雲に乗る」は×。

**デフォルトの名無しさん** · 2015/10/01(木) 15:50:28.34

職業PGだけど専門が違います。
趣味で自然言語処理やりたいですがいいですか？

**デフォルトの名無しさん** · 2015/10/01(木) 15:55:49.74

　これを見てわかることは、Googleの翻訳は、図20でもとても理解し難いところがあったように性能はそこそこですが、
Yahooの翻訳は、人間が機械と同じ条件で行った翻訳にかなり近いレベルまで達しています。よって、
点数をみた限りでは、翻訳システムによっては、文脈まで考えなければこれ以上の上達は難しいことがわかります。
人間でも、文脈を考えるかどうかで10ポイント以上の差がついているので、機械翻訳がこれ以上人間並みに近づくためには、
文章の前後の繋がりを考えるという、計算機にとっては殊の外大きな技術的チャレンジが必要なことが、
このデータを基にわかったという実験結果です。
http://www.scat.or.jp/scatline/scatline98/pdf/scat98_seminar_01.pdf

**デフォルトの名無しさん** · 2015/10/02(金) 06:13:00.34

単語の使われ方の類似度をベクトルで表現したいんですが、どんな方法がいいでしょうか？
他の単語との距離空間をつくるのがいいと思ってるんですが

**デフォルトの名無しさん** · 2015/10/03(土) 20:05:53.04

今はword2vecが最も定番で安定してます
理屈も単純だし

**デフォルトの名無しさん** · 2015/10/25(日) 23:00:25.20

https://github.com/klb3713/sentence2vec
の実装を読んでるんだけど
skip-gramの実装が

word2vecの時の入力層=l2　出力層 =l1
なのに
sent2vecの時の入力層=l1 出力層=l2

になっててインデックスが逆になってる

なんか実装が怪しくないか？

**デフォルトの名無しさん** · 2015/11/14(土) 22:37:12.15

北大の入試問題と等価な ZF+ の式 (Zermelo‐Fraenkel)
http://www.ssken.gr.jp/MAINSITE/event/2015/20150828-hpcf/lecture-01/SSKEN_hpcf2015_anai_presentation.pdf

文頭から一気に訳す（形式変換）のではなく、細かく分割して質問応答システムで『前処理』しておくのはどうか。
「球面Ｓ」＝「中心点は？半径は？面積は？体積は？通る点は？　・・・ets」
「直線ｌ」「ｘｙｚ空間内」＝「法線ベクトルは？通る点は？　・・・ets」

今回の東大模試でも、『「（一つの）小石」を「３つの（いずれかの箱）」に「（ある条件で）移動させる」』を、
東ロボは全く把握できなかったようだ。ここでの「小石」というのは単にある条件で移動する「点」に過ぎないが、
物理の問題では「小石」がおもりの役割を果たしていたり、水中に沈めてその体積と浮力はいくらかなんて
ことが問われたりもする。文脈によって訳し分けるのは現状困難かもしれないが、入試で問われる内容
はパターンが限られており、ある程度の予測と候補の絞り込みは可能に思える。

**デフォルトの名無しさん** · 2015/11/15(日) 10:33:40.85

大学の授業の数学の課題はとけるのけ
自然言語解釈できなくてもいいけど

**デフォルトの名無しさん** · 2015/11/17(火) 22:57:26.06

成功報酬20000円の宿題出したよ
解いて行ってね
http://peace.2ch.net/test/read.cgi/tech/1432402159/

**デフォルトの名無しさん** · 2015/11/19(木) 10:25:00.56

確率の問題ってどうやって解くの？
QEでは解けないよね？

**デフォルトの名無しさん** · 2015/11/19(木) 14:04:39.52

>>383
＞確率の問題ってどうやって解くの？
＞QEでは解けないよね？

数学確率文章題の自動解答システムの開発
http://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/B2-3.pdf

**デフォルトの名無しさん** · 2015/11/19(木) 14:30:09.74

　句構造文法による解析，あるいは格文法解析，係り受け解析のいずれかが行われることが多い。
しかし，たとえば，図4に示すような比較的短い文でもいくつもの正しい解析が成り立つ。
長い文になれば可能な構造は爆発的に増え，そのうちのどれをとるべきかは非常に難しくなる。
その文が話された場面状況，あるいは文章の場合はそれまでに述べられてきたことから作られる
状況知識によって解釈されることになるが，現在の機械翻訳ではその状況を具体的に扱うことが
できていない。日本語に多い主語や目的語の省略について，前後2，3の文からそれを推定して
復元することが試みられている段階である。
https://www.jstage.jst.go.jp/article/johokanri/58/8/58_616/_pdf

**デフォルトの名無しさん** · 2015/11/19(木) 14:57:31.01

（物理的に・常識的に）あり得ない共起関係は、即刻に翻訳候補から外すアルゴリズムが必要。

「炎を食べる」「ヒマワリが跳ぶ」「自動車が泳ぐ」「犬が喋る」「クジラが走る」「テレビが躍る」「クラゲの骨」「ミミズの耳」・・・etc

**デフォルトの名無しさん** · 2015/12/26(土) 04:45:32.56

　さらに重要なのは、Unbabelの機械翻訳ソフトの精度が急上昇していることだ。Unbableには「機械が間違えた
翻訳と人間が修正した結果」というデータが猛烈な勢いで集まっている。このデータを「教師データ」にして機械学習
を実行すれば、「機械翻訳が間違えやすい文章のパターン」と「正しい翻訳パターン」を得られる。同社はこれら
の新しいパターンを機械翻訳ソフトに実装することで、翻訳精度を改善しているのだ。
　機械翻訳の精度は「BLUEスコア」という尺度で評価する。2014年3月にUnbabelが翻訳サービスを開始した当初、
同社のソフトが英語をスペイン語へと翻訳する精度は、BLUEスコアで「35」だった。それが現在は「45」にまで伸びた。
　「機械翻訳が人間と同レベル、BLUEスコアで65～70に到達するのは、当面は不可能だ。しかし機械翻訳の
精度が上がることで、近い将来、機械翻訳を併用した場合の人間による翻訳スピードを、毎時4000単語にまで早め
られるだろう」。Pedro CEOはそう見通しを語っている。
http://itpro.nikkeibp.co.jp/atcl/column/15/061500148/122100040/?ST=bigdata&;P=2

**デフォルトの名無しさん** · 2016/01/03(日) 11:10:52.50

自然言語処理シリーズの対話システム
ぜんぜん理解できないんですけど
先に読んどいたほうがいい本とかあります？

**デフォルトの名無しさん** · 2016/01/07(木) 16:42:12.63

日本語認識するwatson作りたい
てっとり早く1ヶ月ぐらいで作れそうな方法教えて？

**デフォルトの名無しさん** · 2016/02/17(水) 13:53:23.35

http://www.kdnuggets.com/2013/10/free-book-theory-applications-for-advanced-text-mining.html

**デフォルトの名無しさん** · 2016/03/12(土) 06:26:09.19

質問。

? 大量のテキストから自動獲得する
ポイント：同じような意味の単語は同じような環境に現れる
朝見たらぽげらが真っ赤に熟していた。
おいしそうだったので、またぽげらを食べてしまった。
塩をちょっとかけたぽげらは激ウマだね。
https://www.nii.ac.jp/userdata/shimin/documents/H23/120118_7thlec.pdf

和田秀樹の黒塗り教科書、二冊用意して一冊を塗り潰す、
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q12115115392
難解な語句の意味を文脈から推測する問題
http://www.ravco.jp/cat/view.php?cat_id=6445
オントロジー強化型シソーラス
https://www.jstage.jst.go.jp/article/johokanri/58/5/58_361/_pdf

ＡＩが新聞や著書などの大量のテキストから自己学習するために、ランダムに単語一つを黒塗りにして、
そこに当てはまる単語を推論させることはできますか。文中には同じ単語が何度も現れるので、
ある単語をランダムに黒塗りにして、文中に何度も出ている単語のいずれかを当てはめて類推する。

**デフォルトの名無しさん** · 2016/03/13(日) 16:23:48.95

60±40%位の精度でできそう

**デフォルトの名無しさん** · 2016/05/01(日) 15:33:35.03

匿名通信（Tor、i2p等）ができるファイル共有ソフトBitComet（ビットコメット）みたいな、
BitTorrentがオープンソースで開発されています

言語は何でも大丈夫だそうなので、P2P書きたい！って人居ませんか？

Covenantの作者（Lyrise）がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al

ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーｗ

The Covenant Project
概要

Covenantは、純粋P2Pのファイル共有ソフトです

目的

インターネットにおける権力による抑圧を排除することが最終的な目標です。そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します

特徴

Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)

接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
ｃ

**デフォルトの名無しさん** · 2016/08/20(土) 11:23:57.46

見返りとしての歴史認識
　強化されつつある露中のパートナーシップの枠内で、中国は、事実上、欧州における「結果の見直し」の阻止をめぐる
呼応的連帯と引き換えに、ロシアでお馴染みの解釈とは異なるアジアにおける戦争の中国流の解釈を受け入れるよう提案している。
　提案は、非対称のものである。西側の軍事的歴史的行動の領域において、中国の支持は、ロシアに多くのものを与えない。
この問題に関する中国の立場は、欧州にとってどうでもよいのだから。一方、アジアの「戦線」においては、歴史的なルーツ
をもつ紛争へロシアを引き入れることは、具体的困難を孕んでいる。というのも、ロシアは、今後、世界のその部分においてはるか
により活発に行動し、そこでさまざまなプレーヤーとの均衡のとれた関係を構築するつもりであるから。
http://jp.rbth.com/opinion/2015/09/02/394013

訳出がわかりにくい。

＞西側の軍事的歴史的行動の領域において、中国の支持は、ロシアに多くのものを与えない。

→欧米西側諸国の軍事行動とその歴史認識といった分野において、中国のロシア支持がロシアに及ぼす影響は少ない。

＞そこでさまざまなプレーヤーとの均衡のとれた関係を構築するつもりであるから

→そこ（歴史的ルーツをもつ紛争、例えば尖閣や竹島や靖国や慰安婦）で、（ロシアは）様々な関係国との偏りのない関係を構築するつもりであるから。

ロシア語のできる日本人・日本語のできるロシア人が少ないためだろうか。機械翻訳でもパラフレーズは困難というが、
日露双方でもっと大勢の訳出者が様々な方法で翻訳して、パラフレーズ辞典でも作れないだろうか。
日露翻訳を通じて、どんな訳出方法が考えられるか、なぜそういう訳出が適切なのかを徹底的に議論し、
その膨大な記録をサーバーに保管しておいて、後で人手と機械の両方でコーパスにしておきたい。
長文はなるべく句読点で句切って短い文章にすれば、機械翻訳も簡単になるだろう。
中間言語方式が廃れているというが、長文を短く区切って短文にするくらいの中間処理はしておきたいところ。
句読点で句切るのは簡単だが、句読点が無い場合でも自動で補うアルゴリズムも考えておきたい。

**デフォルトの名無しさん** · 2016/11/22(火) 11:46:30.39

国立情報学研究所(NII)、富士通研究所、サイバネットシステムの3者は11月14日、名古屋大学および東京大学と共同で、
NIIの人工知能(AI)プロジェクトである「ロボットは東大に入れるか」(東ロボ)において東大第2次学力試験に向けた論述式模試
とマークシート式の大学入試センター試験模試に挑戦し、論述式模試の数学(理系)で偏差値76.2、センター試験模試の
物理では偏差値59.0と、2015年度を大きく上回る成績を挙げたと発表した。
NII、富士通研究所、名古屋大学を中心に構成する「東ロボ」数学チームは、代々木ゼミナールの論述式模試である
「東大入試プレ」に挑戦した。
数学(理系)では、問題文を入力後、問題文の解釈から自動求解、解答の作成までをAIにより完全に自動で行ない
6問中4問を完答した結果、偏差値76.2(120点満点中80点)を獲得したという。2015年度は駿台予備学校の論述式模試を受験し、
数学(理系)は偏差値44.3(20点)だった。
http://news.mynavi.jp/news/2016/11/15/200/

東京医科歯科大 2010 年度 [数学] 　（２００９年までの問題分析）
合格可能な点数は、２００９年は６割、２００８年は７割、２００７年は６割、２００６年は６割、位でしょう。
毎年問題の傾向が変わるのは、出題者が毎年交代するせいであると思われます。２００７年はやや得点しやすい
ですが、大問２，３で小問の間の関係を読み取る読解力がないと、高得点には結びつきません。ただ東大や東工
大に似たような問題があるので、それらを充分演習・理解していれば、８割以上得点することも可能です。しか
し高校数学からやや離れたところで問題が作られていますので、たとえ問題が解けたとしても、問題の意味が理
解出来ないこともあるでしょう。（東大も同じ）
２００９年から?し気になった問題を見ていきましょう。
２００９年大問１は、平面･空間の格子点の問題ですが、よく出題される数列の和に還元する格子点の個数の問
題ではありません。初等整数論でミンコフスキーが創始した「格子の幾何学」と呼ばれる分野の雰囲気です。
この分野では次のミンコフスキーの定理が有名です。（高木貞治「初等整数論講義」より）
http://www.waseda-eg.com/wp-content/uploads/2010/04/igakubu-ikashika2010.pdf

＃入試数学というのは問題の意味を考えながら解くものではないらしいが・・・

**デフォルトの名無しさん** · 2016/11/22(火) 11:50:24.64

現実世界をすべてシミュレーションすることはできないが、入試で問われる数学や物理はやることが大体決まっており、
こういうものに対処するシミュレーションを作成することはさほど困難とは思えない。

(1) 正八面体のひとつの面を下にして水平な台の上に置く。この八面体を真上から見た図(平面図)を描け。
(2) 正八面体の互いに平行な2つの面をとり、それぞれの面の重心を，とする。，を通る直線を軸としてこの八面体を1回転させてできる立体の体積を求めよ。ただし、八面体は内部を含むものとし、各辺の長さは1とする。
http://www.riruraru.com/cfv21/math/tum08f3.htm

自然言語の正確な読解はまだ困難（統計的機械翻訳ではムリ）だけど、入試数学で正四面体やら正八面体やらの
「ある辺」「ある頂点」「ある面」（いずれも「対称」）を、「回転」させるとか「接地」
させるとか「光を当ててその影が」とか「ある方向から眺めると」とか、やることは大体決まっているはず。
「台の上に置く」＝「接地」と解釈できるようにする。

**デフォルトの名無しさん** · 2016/11/22(火) 16:16:28.76

>>396
> 「台の上に置く」＝「接地」と解釈できるようにする
そういうAd hocな知識はもちろん東ロボで使われていて、パレートの法則に従って、2～3割の作り込みで7～8割の問題は解けるんだけど、そのまま作り込みを増やしても効率は悪くなる一方だし意味があるとは思えない。というのが先日の報告会の話だったと思う。

**デフォルトの名無しさん** · 2016/11/22(火) 17:39:54.66

＞「台の上に置く」＝「接地」と解釈

それひとつだけなら当たり前に思えるけど
実際にはそういう類似表現は無数にあるから
いつまで経っても知識獲得が終わらない

**デフォルトの名無しさん** · 2016/11/23(水) 23:25:59.87

シンギュラリティが近づけば近づくほど、技術的失業で雇用が喪失される。
従来型のエリートは職を失うか年収の大幅減は避けられない。

医者も弁護士も例外ではない。

AIは画像診断の“第4の技術革新”
慈恵医大放射線医学講座の中田典生氏が語る
http://techon.nikkeibp.co.jp/atcl/feature/15/327442/092600087/?ST=health

画像認識分野では、2012年に開催された物体認識技術を競う国際コンテストでディープラーニングが驚異的な結果を出し、1位と2位を独占。
人工知能におけるブレークスルーとして注目を集めた。
ディープラーニングの登場により、人工知能の画像認識精度は急速に高まり、2015年には人間を超えたとされる。
控えめに言っても「人間と同程度になった」（中田氏）。

AI外科医ロボット、世界初の完全自動での患部縫合実験に成功
http://business.newsln.jp/news/201605052146350000.html

内科も外科もＡＩやロボットに代替されて、
遠くない未来に医者は機械の監視役や補助員になる。

**デフォルトの名無しさん** · 2016/11/23(水) 23:30:24.41

>>397
＞そのまま作り込みを増やしても効率は悪くなる一方だし意味があるとは思えない。

一般的な自然言語処理に関してはそうかもしれないけど、入試での数学物理はパターンが限られる。
だから今年の東ロボでは「作り込みを増やした」だけで、物理と数学は大きく伸びた。

**デフォルトの名無しさん** · 2016/11/23(水) 23:34:41.73

＞センター試験模試の物理では偏差値59.0と、2015年度を大きく上回る成績を挙げたと発表した。

＞数学(理系)では、問題文を入力後、問題文の解釈から自動求解、解答の作成までをAIにより完全に自動で行ない
＞6問中4問を完答した結果、偏差値76.2(120点満点中80点)を獲得したという。

国語や英語などの一般的な自然言語処理が問われる科目では、従来通りの「統計的機械翻訳」では限界。
けれども数学や物理においては、これまでの技術の延長でまだまだ伸びる可能性が考えられる。

**デフォルトの名無しさん** · 2016/11/23(水) 23:43:41.18

>>397
＞そのまま作り込みを増やしても効率は悪くなる一方だし意味があるとは思えない。

数学と物理に関しては、高校入試や公務員試験の過去問も利用して、人海戦術で伸ばせると思う。
報告会でも、物理や数学はまだ実装していないシミュレータもあると聞いた。

**デフォルトの名無しさん** · 2016/11/24(木) 01:05:49.48

>>402
わかってて書いてるんだと思いたいけど、東ロボはテストの点数を上げることそのものが目的のプロジェクトじゃないから。

**デフォルトの名無しさん** · 2016/11/26(土) 07:08:03.31

日本発、新方式の量子コンピュータ、来年にクラウドサービスを提供
http://itpro.nikkeibp.co.jp/atcl/column/14/346926/112200709/?ST=spleaf

グーグルDeepMind、AIの学習を高速化させる新手法を発表--動物の見る夢から着想
http://japan.zdnet.com/article/35092476/

この知見を取り入れたエージェントを、Atariのゲームと、「Labyrinth」という3D迷路ゲームを使ってテストしたところ、
以前のアルゴリズムに比べて学習速度が10倍に高速化されたという。
またLabyrinthのテストでは、人間のエキスパートとの比較で平均87％という成績を収めた。
従来型のスパコンの性能向上に加え、
非ノイマン型コンピュータも実用化されつつある。
と同時に、ＡＩ開発も加速している。
この状況を考えれば、否定厨のダメ出しなど言い掛かりの域を出ないと言えよう。

**デフォルトの名無しさん** · 2016/11/26(土) 09:36:03.92

http://digital.asahi.com/articles/DA3S12674633.html

　「あなたは２０２１年に人工知能は東大に入れるようになると思いますか？」
　どの会場でも８割以上が「入れるようになる」と答える。みんな笑顔だ。ＡＩがもたらす明るい未来を信じているのだろう。
「囲碁の世界チャンピオンも破ったのだから、東大に入ってもおかしくない」と言う生徒もいる。
　「では」と私は続ける。
　「ＡＩが社会で働くようになったとき、あなたは何をして働きますか？　どうやってお金を手に入れますか？」
　一転して、動揺が走る。マイクを向けると「……ゴミ拾い、とか？」と絞り出すような声。ＡＩが東大に入るような日が来たら、
ＡＩがゴミ拾いもしてくれるに違いない。その時、人間は労働から解放されて幸せになるだろうか。
　ＡＩから得られる富が、地球上のすべての人に平等に分け与えられればそうかもしれない。しかし、そのような仕組みは、
今までかつてこの地球上に築き上げられたことはない。むしろ、ＩＴが社会に導入されて以降、経済格差は広がり続けている。
　２０１０年、アメリカでのＡＩの隆盛を眺めながら、私はそのことを考えていた。ＡＩはどこまで行き、どこで止まるのか。
ＡＩはどのように仕事を奪い、仕事を生み出し、社会を変えるのか。私がはじき出したのが、３０年に現在のホワイトカラー
の仕事の半分がＡＩに置き換えられるという予想だった（後に、それはオックスフォード大の研究グループが行った
予測とぴたりと合うことになる）。
　私は数学者だから、こういうときには原理から考える。コンピューターは徹頭徹尾、数学でできている。ＡＩに使えるのは論理と
確率と統計だけだ。論理と確率はわかる。だが、いくら考えても、統計にどれだけの威力があるのか、はっきりしなかった。
　そこで考えた。ＡＩに大学受験をさせてみたら、と。大学受験に挑ませたら、近未来のＡＩの可能性と限界がクリアになるのではないか。
　１１年にプロジェクトが始まり、私は目標を立てた。３年でどこかの大学に合格させる。４年目には箱根駅伝に出るような名のある大学に、
５年目は国公立大学に。そして６年目に、ＭＡＲＣＨ・関関同立に合格させたいと思った。可能性は五分五分だろう。

**デフォルトの名無しさん** · 2016/11/26(土) 09:37:16.37

　その目標を口にした時、私は恐怖に似た緊張感を覚えた。研究者としては誰も見たこともないＡＩを開発したい。一方で、
ＡＩが難関大に合格する能力を備えた場合、ホワイトカラーの仕事の半分は確実にＡＩに奪われるだろう。ＡＩを大胆に導入し、
コスト削減に成功した企業の利益率が上がる一方、雇用を守ろうとした企業は市場から退場を迫られるだろう。
　こう話すと生徒から責められた。「なぜ、私たちの仕事を奪うかもしれないＡＩの研究をするのですか」
　私がやめても世界の企業や研究者はＡＩの研究をやめはしない。ならば、ＡＩの可能性と限界をきちんと見極め、
対策を取ろうではないか。ＡＩには弱点がある。それは彼らが「まるで意味がわかっていない」ということだ。
　数学の問題を解いても、雑談につきあってくれても、珍しい白血病を言い当てても、意味はわかっていない。逆に言えば、
意味を理解しなくてもできる仕事は遠からずＡＩに奪われる。私は次のように講演を締めくくる。
　「みなさんは、どうか『意味』を理解する人になってください。それが『ロボットは東大に入れるか』を通じてわかった、
ＡＩによって不幸にならない唯一の道だから」

**デフォルトの名無しさん** · 2016/11/26(土) 10:56:50.53

グーグルの人工知能ニューラルネットワーク「ディープ・ドリーム」は、心の内側で起きている事象を
人工知能が視覚化するシステム。でもそこから生み出されたものは、6つの目を持つ犬とか、
ナメクジのような人間の足とか、もはやお薬でイッちゃった系アートで、人工知能が生み出す新しいアート
ってすごいね…ということで昨年夏、インターネットを衝撃に陥れたのは記憶に新しいところ。
http://www.gizmodo.jp/2016/02/googledeepdream.html

もっと現実性のあるアートを描けないのだろうか。題材を単語入力すると、ランダムでそれらしいアートが出てくるとか。

まんがの背景画の書き方
http://shincomi.webshogakukan.com/school/cat4/

「学校」「運動場」「野球」と入力すると、ランダムにそれらしい背景画が自動で出てくるみたいな。

**デフォルトの名無しさん** · 2016/11/28(月) 07:52:12.25

しっぽの生えた人間とか、人間の言葉を話す犬とか、便器に生えるキノコとか、凍り付く太陽とか、三本足の人間とか、
水道の蛇口から火が出るとか、爆発するメガネとか、回転するシャクトリムシとか、「ありえない」ものはアートにしない。
そういう機能のついた人工知能アートは作成できないのだろうか。

**デフォルトの名無しさん** · 2016/11/28(月) 13:38:25.99

私は元創価の会員でした。
すぐ隣に防衛省の背広組みの官舎があるのですが、
自分の家の窓にUSB接続のwebカメラを貼り付けて、そこの動画を撮影し続け、
学会本部に送っていました。

別に大したものは写っていません。ゴミだしとか奥さんが子供を遊ばせている所とか。
官舎が老朽化して使われなくなってから、
今まで法人税(うちは自営業です)をほぼ払わなくても済んでいたのが、
もう守ってやれないのでこれからは満額申告するように言われました。
納得がいかないと言うと、君は自業自得で餓鬼地獄へ落ちる、
朝夕南無妙法蓮華経と三千回ずつ唱えて心をきれいにしなさいと言われ
馬鹿らしくなって脱会しました。

それ以来、どこへ行くにもぞろ目ナンバーの車につけまわされたり大変な日々です。
全部自分の出来心から起きた事で、どこに訴えるわけにもいかないのですが、
なんとかあの人たちと縁を切って新しい始まりを迎える方法はないんだろうか。

**デフォルトの名無しさん** · 2016/11/30(水) 12:21:41.26

五文型
S+V
(x,y,z)＝(S,V,0)
S+V+C (Cは正)
(x,y,z)＝(S,V,C)
S+V+O (Oは負)
(x,y,z)＝(S,V,O)
S+V+O+O (Z1は負 Z2は負)
(x,y,z)＝(S,V,α) α＝Z1 α＝Z2
S+V+O+C (Z3は負 Z4は正)
(x,y,z)＝(S,V,β) β＝Z3 β＝Z4
http://www.eibunpou.net/01/chapter3/3_1.html

五文型を (x,y,z)空間上で表現できないだろうか？

**デフォルトの名無しさん** · 2016/11/30(水) 14:52:47.31

ベイジアンネットワークとナイーブベイズは別物？

**デフォルトの名無しさん** · 2016/12/03(土) 18:45:19.62

>>409

人工知能の開発はインプットできるデータを多く持っているところが圧倒的に強い。
創価もこれまでに盗みとってきたデータやら、ファミリー企業(楽天やツタヤ、セコムなど)
から吸い上げたデータを駆使して自動運転自動車の開発くらい自前でやればいいのに。

でもそうなったら原因不明の交通事故とかがちょろちょろ出てくるようになるんだろうなあ。

**デフォルトの名無しさん** · 2016/12/03(土) 18:53:29.04

コピペにレスすんなよ……

**デフォルトの名無しさん** · 2016/12/03(土) 18:54:35.85

>>411
ベイジアンネットワークの方が広い区分で
ナイーブベイズはその単純な形

**デフォルトの名無しさん** · 2016/12/08(木) 18:29:53.36

これからはシミュレーションシステムの構築が簡略化されるので、来年のセンター物理は大きく得点が伸びるに違いない。

　理化学研究所（理研）計算科学研究機構コデザイン推進チームの村主崇行特別研究員らと、千葉大学の堀田英之特任助教、
神戸大学の牧野淳一郎教授、京都大学の細野七月特任助教、富士通株式会社の井上晃マネージャーらの共同研究グループ※は、
スーパーコンピュータ「京（けい）」（注1）を用いて、数式のような簡潔な指示を書くだけでスーパーコンピュータでの計算に必要
となる高度なプログラムを自動生成できるプログラミング言語「Formura」を開発しました。
　スーパーコンピュータでの計算に必要となるプログラムはときに数十万行にも及び、作成やチューニングは大変困難です。
一方で、原理的にはシミュレーションしたい自然現象とその離散化法（注2）を指定すれば、プログラムは機械的に生成できます。
しかし、プログラミングはシミュレーションとコンピュータ双方に深い知識が必要となる非常に高度な作業であり、多数の計算機を
協調して動作させるスーパーコンピュータの性能を引き出す高度なプログラムを、自動かつ汎用的に生成することは不可能でした。
　そこで共同研究グループは、方程式がプログラムに変換されるまでの一連の段階に対応する数学的定義を作りました。
スーパーコンピュータが持つ階層のすべての段階において、自然が元来備えている「並列性」と「局所性」（注3）を保持する変換
を厳密に定めることで、新たなプログラミング言語「Formura」を開発しました。これによって、これまで不可能だったプログラミング
の機械化に成功しました。さらにFormuraは、同じアプリケーションに対して何万通りものプログラムを試し、最も速かったものを自動的に選択します。
　Formuraを開発したことで、規則格子シミュレーション（注4）分野においては、自然科学者が慣れ親しんだ方程式の記法を使ってシミュレーション
したい対象を記述することで、スーパーコンピュータの性能を引き出すための高度なプログラムが自動的に作成できるようになりました。
気象、地震、宇宙、生態ネットワークの研究など、規則格子シミュレーションを用いる分野の研究の加速が期待できます。
http://pr.fujitsu.com/jp/news/2016/12/2.html

**デフォルトの名無しさん** · 2016/12/10(土) 14:57:04.83

>>407
＞もっと現実性のあるアートを描けないのだろうか。

人間が見て「珍風景」であっても、人工知能からすればどうでもよいのか？

【訂正】思わず二度見してしまう世界の珍風景18選
http://kangaerarehenzo.blog.fc2.com/blog-entry-719.html

**デフォルトの名無しさん** · 2016/12/18(日) 16:44:54.83

統計翻訳ってなんだったんだよ。。。

**デフォルトの名無しさん** · 2016/12/21(水) 14:50:23.02

自然言語処理研の学生が意味理解の問題に対してニューラルネットや機械学習での解決に腐心している。
分類器以上の枠組みを作ろうという動きってあるの？

**デフォルトの名無しさん** · 2016/12/22(木) 14:30:51.26

どういう意味？

**デフォルトの名無しさん** · 2016/12/22(木) 16:20:57.49

自然言語系の人達の発表ってパターン認識ばっかでつまらないんだ。
要所々々にはそれが求められるだろうし、実際人間もそうした判別を行っていると思う。
しかし、文章の整合性の把握だとか論理的矛盾の回避みたいな話はとんと出てこない。
NNや機械学習といった今の流行りは「考える」ことを考える事に尻込みしているように見える。

**デフォルトの名無しさん** · 2016/12/23(金) 14:19:36.91

同じようなことは思うけど
機械学習が流行したからしゃーない
みんな割に合わないことはやりたくないし

**デフォルトの名無しさん** · 2016/12/26(月) 10:46:43.39

NNが流行りだけど
SVMも続けてほしいね

**デフォルトの名無しさん** · 2016/12/27(火) 19:55:40.96

なぜ？

**デフォルトの名無しさん** · 2016/12/27(火) 21:00:23.68

いえ、別に

**デフォルトの名無しさん** · 2017/01/20(金) 13:11:27.56

全くの門外漢なのですが、
機械翻訳で、日本語の主語や目的語の同定をしている
技術（研究テーマ）の名前を知りたいのですが、教えていただけませんでしょうか。
述語項構造解析というやつですか？

**デフォルトの名無しさん** · 2017/01/20(金) 19:24:41.35

固有表現抽出

**デフォルトの名無しさん** · 2017/01/20(金) 22:42:50.37

>>426
全然ちげーよ

**デフォルトの名無しさん** · 2017/01/21(土) 12:56:08.90

ニューラル機械翻訳と記号幻想の死
http://rekken.g.hatena.ne.jp/murawaki/20161017/p1
DeepLearning研究 2016年のまとめ
http://qiita.com/eve_yk/items/f4b274da7042cba1ba76

昨年11月にRNN(LSTM)の機構をCNNで再現するQRNNが提案され、
時系列データをGPUで高速学習できるようになった。
今年の自然言語系は昨年以上に機械学習ばかりになるのだろう。

**デフォルトの名無しさん** · 2017/01/31(火) 17:46:47.47

http://www.afpbb.com/articles/-/3116032

【1月31日 AFP】ドナルド・トランプ（Donald Trump）米大統領がツイッター（Twitter）で繰り出す個別企業への攻撃。
それを投資に生かそうと、テキサス（Texas）州の企業が人工知能（AI）を使ったプログラムを開発した。
トランプ氏のツイートを分析して株価の変動を予想、瞬時に取引をこなすもので、すでにトヨタ自動車（Toyota Motor）
のメキシコ工場建設への批判などから大きな利益を上げたという。
　プログラムはその名も「トランプ・アンド・ダンプ（Trump & Dump）」。株価の変動につながるトランプ氏の投稿を特定し、
株価にプラス材料になるかマイナス材料になるかを即座に判断、素早く取引を行う。
　開発したテキサス州オースティン（Austin）のマーケティング・テクノロジー企業、T3のベン・ガディス（Ben Gaddis）社長は
AFPの取材に、政権移行期間にトランプ氏からツイッターで攻撃された米ボーイング（Boeing）やロッキード・マーチン（Lockheed Martin）
の株価が急落したことに目を付けたと説明した。
「トランプ氏の予測不能なツイートにどのように対処すればよいか、誰もが自問自答している」（ガディス氏）。
そこでT3が取り組むことにしたのが、トランプ氏のツイートを基にして自動取引するプログラム（ボット）の開発だった。
　同社はこれまでの運用成績に満足しているといい、2回の取引で「大きな利益」が上がり、3回目は「若干」の損失だったと明かしている。
　T3のウェブサイトに掲載された動画によると、
1月上旬にトランプ氏がトヨタ自動車（Toyota Motor）のメキシコ工場建設を批判したことを受けた際には、
同社の株価が下落すると見込み「非常に大きな」利益を得たという。
　同社は取引で得た利益を米国動物虐待防止協会（ASPCA）に寄付していると明らかにした上で
「トランプ大統領がツイートすれば子犬が救える」と述べている。(c)AFP

**デフォルトの名無しさん** · 2017/02/12(日) 03:24:59.33

http://www.sankei.com/wired/news/170210/wir1702100001-n2.html

次に「PixelCNN」（CNN：畳み込みニューラルネットワーク）を使用するprior networkが、8×8画像にピクセルを追加する。
『Are Technica』UK版の記事によると、PixelCNNは既知の画像を利用して細部を追加するという。
たとえば、唇はピンクであることが多いので、唇だと判断された領域にはピンクのピクセルを追加するという具合だ。

それぞれのニューラルネットワークの処理が終わると、グーグルの研究者たちがその結果を組み合わせて最終画像を生成する。
「顔の典型的なヴァリエーションを前もって学習することで、AIは細部をリアルに描画することができる」と研究者たちは書いている。

今後さらに研究が進めば、低解像度の写真や動画に映っているものを再現できるようなシステムが開発されるだろう。
防犯カメラの不鮮明な映像に映っているものを特定するために、こうした技術が役立つかもしれない。

**デフォルトの名無しさん** · 2017/02/25(土) 02:16:54.69

数式処理ソフトMathematicaで数学の問題を解く
https://www.slideshare.net/yoshihiromizoguchi/mathematica-62981039

**デフォルトの名無しさん** · 2017/03/12(日) 05:00:43.07

Deep Learningでmecabとcabocha作るとか奈良先端でやってたらしいけど、もう出来たのかな
ソース公開まだかな

**デフォルトの名無しさん** · 2017/03/12(日) 18:30:38.63

JUMAN++自体は公開されてるだろ
そのソースコードそのものは公開されてないけど

**デフォルトの名無しさん** · 2017/03/12(日) 18:59:00.84

いやそんなわけないか。gccで自分でコンパイルするんだからソース公開してる

**デフォルトの名無しさん** · 2017/03/12(日) 19:43:55.84

今さらずまんなんてw

**デフォルトの名無しさん** · 2017/03/13(月) 14:03:57.38

JUMANは精度がどうのこうのという以前に遅すぎて実用サービスに組み込めない。
研究に使うにはバッチ処理的にしか使わないからいいんだろうけど

**デフォルトの名無しさん** · 2017/03/13(月) 19:47:42.32

サーバーモードあったよね

**デフォルトの名無しさん** · 2017/03/15(水) 11:44:48.74

サーバーモードだと処理速度も速くなるの？

**デフォルトの名無しさん** · 2017/03/21(火) 13:44:21.14

「ロボットは東大に入れるか」成果報告会 in 2016（11/14）レポート
http://blog.livedoor.jp/dg_law/archives/52354118.html

**デフォルトの名無しさん** · 2017/04/29(土) 18:15:17.74

盛り上がってないね

**デフォルトの名無しさん** · 2017/05/08(月) 12:37:00.42

>>391
＞和田秀樹の黒塗り教科書、二冊用意して一冊を塗り潰す、

　先行研究として、Kanayamaら [1]およびKobayashi
ら [2] によるセンター試験「世界史」の自動解答シス
テムがある。これらの研究では、選択肢中のキーワー
ドを一つずつ隠し、隠した語を問う factoid 問題に対
するシステムの解答を隠した語と比較することで誤り
を検出する手法を用いている。
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/C7-3.pdf

**デフォルトの名無しさん** · 2017/05/08(月) 16:29:03.69

深層学習を駆使し辞書無しで日本語分かち書きできるライブラリはやく作ってください
人間に出来るのだから余裕だろ？

**デフォルトの名無しさん** · 2017/05/08(月) 17:54:54.52

>>442
子育てしたことあるかい?

**デフォルトの名無しさん** · 2017/05/08(月) 20:27:47.17

>>442
つsentencepiece

**デフォルトの名無しさん** · 2017/05/09(火) 08:28:02.29

深層学習でも何でもないし
くぃいたのバカが早速分かち書きに使ってたし

**デフォルトの名無しさん** · 2017/05/09(火) 14:03:42.42

>>445
だから分かち書きのライブラリが欲しいんだろ？いいじゃん

**デフォルトの名無しさん** · 2017/05/10(水) 14:36:25.96

回転放物面の方程式と東大の問題
http://mathtrain.jp/kaitenhobutsu

「放物線 y = 3/4 - ｘ^2」
を
「y軸の回りに回転させる」

・・・例えば、こういう操作ができる３次元ＣＡＤって開発されてないんですか？

統計的機械翻訳では自然言語処理は無理という話も聞いているけれど、高校数学でやることは内容が限られており、
一般的な機械翻訳よりは難易度は低いと思われます。

**デフォルトの名無しさん** · 2017/05/10(水) 15:22:11.14

「こういう操作」って、自然言語で方程式や回転操作を入力するってこと？

**デフォルトの名無しさん** · 2017/05/20(土) 10:09:44.32

>>143
＞線分ＱＴと線分ＱＲの関係を求めるのに、どの線が必要で、どの線が不要なのか。
＞また必要な線が無い場合は、点と点同士を結んだり線分を延長させたりして、補助線を引く。
＞計算力にモノを言わせて、しらみつぶしに全ての場合を調べつくすというやり方もある。

音楽より画像処理の方が凄いな。ディープラーニングで画像補完。
フォトショでＣＧ加工や写真補正をチマチマやる必要のないレベルに来てる。
そのうちディープラーニングで自動作曲とか出てきそう。

画像を塗りつぶした部分に一瞬で自然な画像を補完する技術を早稲田大学の研究者が開発
http://gigazine.net/news/20170501-globally-locally-consistent-image-completion/

**デフォルトの名無しさん** · 2017/05/20(土) 21:53:06.95

ちなみにこれが機械学習で機械が作った寝室の画像

もちろん現実のどこにも存在しない、機械が学習した「寝室」の概念画像

遠くから見ると普通に寝室の写真に見えるが、よーく見るとちょっとおかしいことに気づくと思う

http://blog.aylien.com/wp-content/uploads/2016/08/gan-samples-1.png

ってか、既存のGANでも機械にエロ画像の概念を学習させることはできるんだよな
やってみようかな

匿名でやらないと頭硬い奴らに訴えられて面倒なことになりそうだが

**デフォルトの名無しさん** · 2017/05/20(土) 22:47:21.48

面白い話題だけどスレ間違ってません？

**デフォルトの名無しさん** · 2017/05/21(日) 00:11:37.70

>>451
自然言語処理にも画像理解やシミュレーションが必要なのでは？

自然言語処理スレッド その４

自然言語処理スレッド　その４