自然言語処理スレッド その4

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2014/06/03(火) 05:40:00.54ID:yefNLumx
前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
2014/10/29(水) 19:15:45.42ID:N8JvcROE
読み・書き・聞き取りの最強の日本語コーパス「三位一体」
プロジェクトを開始しました。
ご期待下さい。
2014/10/29(水) 23:38:27.55ID:zlK0g2wj
raw画像に戻すってのは、
中間言語式の翻訳のこと?
131デフォルトの名無しさん
垢版 |
2014/10/30(木) 00:55:36.93ID:iSxCzdRK
1pixごとの完全に元のデータ

自然言語の場合で言うなら、必ずしも言語である必要もないと思う
132デフォルトの名無しさん
垢版 |
2014/10/30(木) 01:56:04.20ID:jdjv0M6/
鏡に映るものを計る、それがMZの目標である。
133 【東電 74.8 %】
垢版 |
2014/10/30(木) 12:36:21.88ID:VubmAqci
>>125
また、そんなことばっか言うて!キミはいい加減にしたまえ。ボクはキミをあまり知らない。もう面倒くさいったらありゃしゃんせ


神戸市の東、芦屋西宮の知的障害者施設で未成年利用者に性的な行為をして淫行条例で逮捕された三田谷学園元職員の堂垣直人(西宮市老松町)は、結局どういう罪になったの?
被害者家族のケアを芦屋市役所と兵庫県警はちゃんとやったのか?
差別や虐待は環境を選べない子供には関係ない。

http://www.youtube.com/watch?v=JxMzW3ZlV4g&;sns=em


執行猶予終了までまだあるよ。
134デフォルトの名無しさん
垢版 |
2014/10/31(金) 16:05:31.03ID:0ns/rhdq
【科学】人工知能「東ロボくん」、センター模試英語で平均点超え 全体成績は私大8割と国公立4校でA判定 21年度までの東大合格目標??2ch.net
http://daily.2ch.net/test/read.cgi/newsplus/1414724624/
2014/11/01(土) 11:21:29.62ID:m4AuzDYU
えつ!
136デフォルトの名無しさん
垢版 |
2014/11/03(月) 08:11:18.01ID:tokfpTJi
代ゼミ物理問題のイラスト。

http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/a/8/a8fbf865.jpg
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/3/b/3b63acc4.jpg
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/3/b/3b65850a.jpg
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/2/8/28b52d74.jpg

@やAは無理でも、Cの図なら「四角い箱」「四角い物体」くらいの大雑把な認識をする。
それは「弁当箱」かもそれないし、「本」かもしれないし、「小包」かもしれない。
次にBの図ろ考えると、点線が途中までになっていて、「何かが入っている箱」と考えられる。
文章では、「板」と「水」を入れて「板は沈める」ということになっている。
けれども「板」といってもそれは物理的に何の役割を果たすのかも考えなければならない。
137デフォルトの名無しさん
垢版 |
2014/11/03(月) 08:35:06.90ID:gGej6kOp
(1)今年は3パーセント物価が上昇し、来年は5パーセント物価が上昇するという。平均の予想物価上昇率はいくつか。
(2)今年は3パーセント物価が上昇するという人と、5パーセント上昇するという人がいる。平均の予想物価上昇率はいくつか。
<ロボットは東大に入れるか 新井紀子>

「今年は〜」
@ 西暦○年度(現在)2)
A 去年は、来年は、○年前は、○年後は〜(1)
B うるう年だ

「物価が上昇」
@ どの月間に、どの年間に(1)、何%の割合か(1)(2)
A 品目別には〜、○円上昇、○円下落

「〜という人」
@ 〜という名前の人間が居る(人間A、人間B)
A 人間Aは○○と述べた、人間Bは△△と述べた(2)

機械には連想思考は期待できない以上、徹頭徹尾人力でインプットあるのみ。
138デフォルトの名無しさん
垢版 |
2014/11/03(月) 09:22:18.89ID:tokfpTJi
>公式に当てはめる単純なタイプの問題には対応できますが、図形の性質に着目するような応用タイプの問題にはまだ対応できないようです。

「方べきの定理」という公式にあてはめるだけの問題も、図形がらみだと機械には理解できないらしい。
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/f/d/fd1497d7.jpg

余計な部分を消せば、「円に交わる(または接する)、平行ではない2本の直線」と、数式化できる。
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/0/c/0cdeedcc.jpg

図形の性質に着目するような応用タイプの問題は、余計な部分を消して、公式に当てはめる単純なタイプの問題に帰着させること。
設定が複雑になったら、「○本の直線と、○個の円と、○個の三角形と、○箇所の接点と、○箇所の交点」をバラバラに抽出し、しかる後に全ての組み合わせを提示する。
139デフォルトの名無しさん
垢版 |
2014/11/03(月) 11:07:24.52ID:gGej6kOp
今回も出来の悪かった数列について。

b1 = 1 , bn+1 = bn + 3 → 階差数列 Cn = bn+1 - bn を考える

東ロボは、こんな程度の初歩的な連想ゲームも出来なかった。式の同値変形は東ロボの得意技であり、
bn+1 - bn = 3  と変形できれば簡単ではなかろうか。同様に 3bn+1 = 3bn + 4 → bn+1 = bn + 4/3 
→ bn+1 - bn = 4/3 も可能なはずだ。それから式の同値変形の手順も教え込んでおきたい。
140デフォルトの名無しさん
垢版 |
2014/11/03(月) 11:29:13.15ID:gGej6kOp
物理の第三問は、「段差を作った容器に浅く水をはる」「斜め方向に一定周期の平面羽を入射させる」の文から、以下のような類題を検索できないだろうか。

図1のような深さが変化する水槽に水を入れ図2のように深さが変わる境界面に対して、45°の方向から斜めに平面波を進行させたところ、
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q12119401572
141デフォルトの名無しさん
垢版 |
2014/11/03(月) 18:22:59.01ID:tokfpTJi
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/f/1/f1f74737.jpg

 ブルーベリーがのったデコレーションケーキ(のイラスト)なんて、おそらく多くの
人が生まれて初めて見るものでしょうね。なのに、われわれはそれがそうだと、正し
くわかる。どうしてなのでしょうか。これは認知科学という分野の難問のひとつです。
 だいたい、このイラスト、変なんです。ブルーベリーの直径って1センチ未満ですよ。
だとすると、このケーキ、直径が12センチくらいしかないことになる。そんなの、
おかしいでしょう?(笑)にもかかわらず、その年のセンター入試を受けた受験生たち
は誰一人としてそれを変だと思わず、粛々と問題を解いたんですね。
 ちなみに私の職場で、ケーキにプチトマトがのってるね、と言ったひとがいますね(笑)。
<ロボットは東大に入れるか 新井紀子>

>ケーキにプチトマトがのってるね、

楕円形の周上に、白っぽい不定形の何かと、黒っぽい円形の何かが、交互に並んでいる。
但しこの図を立体として観察すると、楕円形は円形を現しており、また黒っぽい円形の何かの中心部が白くなっているのは球形と推測される。
142デフォルトの名無しさん
垢版 |
2014/11/03(月) 19:01:37.56ID:ieVOoQg9
東ロボくんって画像処理系の人ほとんどいないでしょ
143デフォルトの名無しさん
垢版 |
2014/11/03(月) 23:09:51.81ID:tokfpTJi
初頭幾何は、不要な線を消して、必要な線だけにしないと、定理が使えない。

元の図形
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/3/a/3aaa1e5f.jpg
単純化して、2QT=QR
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/0/1/01eaff32.jpg

線分QTと線分QRの関係を求めるのに、どの線が必要で、どの線が不要なのか。
また必要な線が無い場合は、点と点同士を結んだり線分を延長させたりして、補助線を引く。
計算力にモノを言わせて、しらみつぶしに全ての場合を調べつくすというやり方もある。

正九角形があり辺を共有しない三角形はいくつあるか。という問題があり、答えは30らしいです。なぜこうなるのでしょうか?
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10114300645

全ての場合をしらみつぶしに数え上げるアルゴリズムは可能ですか?
144デフォルトの名無しさん
垢版 |
2014/11/04(火) 00:06:26.26ID:LJyHsHlb
組み合わせ最適化だろ
オーダーくらい自分で考えろよ
145デフォルトの名無しさん
垢版 |
2014/11/04(火) 02:08:02.45ID:Td6UKxL3
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/5/8/589fbe91.jpg

全滅だった表問題だが、このくらいならエクセル処理できるのではないか。
146デフォルトの名無しさん
垢版 |
2014/11/04(火) 10:46:33.52ID:Td6UKxL3
イラスト理解は、とりあえず形状と色彩だけを、「遠近法」で大雑把に捉えて推定するくらいの機能を。

>ケーキにプチトマトがのってるね、

ケーキだのクリームだのブルーベリーだのは特定できなくてもいい。まず「形状」は、手書きの文字認識機能
は向上しているのだから、その技術を応用すればいい。また「色彩」は白黒でも遠近法が把握できるように工夫する。
楕円形の周上に、白っぽい不定形の何かと、黒っぽい円形の何かが、交互に並んでいる。但しこの図を立体
として観察すると、まず何かの土台があって、上部の楕円形は円形を現しており、また黒っぽい円形の何かの
中心部が白くなっているのは球形と推測される。
147デフォルトの名無しさん
垢版 |
2014/11/04(火) 11:14:12.09ID:Td6UKxL3
>>116
>朝三暮四になっていないか、一つの問題を様々な角度から理解させたり、表現や設定を変えて類題を作ってみる。

私の講座のテキストで恐縮ですが、コチラの2問をご覧ください。
一見すると、「お菓子を配る問題」「直方体を積み上げる問題」と別の問題に見えます。
しかし、解いてもらえるとわかりますが、この2問は素因数分解を使って解く、
同じパターンの問題です。つまり類題ってことになりますね。
さらに、(細かい説明は解説に任せますが)2つの問題とも「2以上」という語句が共通しており、
この「2以上」が解法の方針を示してくれる重要な語句だということがわかります。
これより類題とは、問題文の重要語句が共通している問題を指すことがわかります。
したがって、皆さんが類題を認識するためには、問題文の重要ポイントを意識しない
といけないんだっていうことがわかりますね?
http://shibasaki873.blog.fc2.com/blog-entry-74.html
148デフォルトの名無しさん
垢版 |
2014/11/04(火) 11:49:28.30ID:Td6UKxL3
>日本語の形式表現変換については,物理科目では極めて困難で,

>余計な部分を消せば、「円に交わる(または接する)、平行ではない2本の直線」と、数式化できる。

そもそも自然言語というのは、単語ひとつとっても『不要な情報』で溢れ返っている。例えば『板』という単語の用途は様々で、
物理学的にみれば「剛体」にもなりうるし「物体」にもなりえるし「障害物」にもなりえる。東大の二次試験などは分野が複数
にまたがっていて一層わかりにくい。自然言語文を題意に合わせた形式表現変換するには、膨大な連想シソーラス網から、
必要な部分だけを切り出すこと。
他の煩雑かつ不要な情報を完全に除外し「重要ポイント」のみを抽出する。入試問題の多くは過去問の焼き直しだが、
表面上の言い回しを変えていたり、別の図柄を用いていたりして、改題して出題される場合が多い。似た問題は出るが
同じ問題は出ない。単純な問題に不要な情報を追加してわざとわかりにくくしているのだ。こういう場合は「類型問題」
の候補をいくつか挙げて、共通事項を抽出するというアルゴリズムが不可欠になってくる。
149デフォルトの名無しさん
垢版 |
2014/11/05(水) 13:11:11.01ID:TFchYdUt
ていうかどうしたいのかね。
画像処理では物体認識と、座標位置は取得できけど。
150デフォルトの名無しさん
垢版 |
2014/11/06(木) 07:15:21.52ID:1dD9kBwW
http://blog.livedoor.jp/dg_law/archives/52234923.html

>日本語の形式表現変換については,物理科目では極めて困難で,数学のような半自動化さえ難しい。
>日本語が曖昧すぎるため。たとえば「金属を折り曲げる」や「滑らかな坂」を東ロボくんが自力で理解して,
>シミュレーターに取り込むのは,少なくとも現状では絶対に無理。

こういうのは、物理用の形式表現変換コーパスを用意しておきたい。

>金属を折り曲げる

長方形のABCDがある。金属板は一様で、質量はM。金属板をEFとGHでそれぞれ直角に折り曲げて、
水平な床に置きCDの中点Iから軽い糸でおもりをつるす。おもりの質量がある値より大きいと金属板は倒れてしまう
mはどのような値になるか?
http://okwave.jp/qa/q7197628.html

この類題に、「金属板」=「金属でできた板」とアノテーションをつけておけば、「金属を折り曲げる」にも応用できる。
また金属を折り曲げると、支点とモーメントはどうなるかという連想思考も可能になる。

>滑らかな坂

したがって滑らかな坂を転がる質点は運動の方向が斜面の形状によって変わろうとも力学的エネルギーの保存は成り立っている。
http://www.ep.sci.hokudai.ac.jp/~heki/pdf/mechanics5.pdf

全ての文章を完璧に形式表現変換できなくても、過去問の解法パターンからある程度の推論はできる。
入力予測機能を備えた文字変換システムのように、解法予測機能をつける。
151デフォルトの名無しさん
垢版 |
2014/11/06(木) 13:15:54.06ID:1dD9kBwW
http://www.ep.sci.hokudai.ac.jp/~heki/pdf/mechanics5.pdf

>なめらかな面に束縛された質点の運動。

これをどうやってコンピューターに理解させるか、どう形式変換するか。

mv2/2(運動エネルギー) + mgh(位置エネルギー) = 一定、となる物理現象とでも定義しようか。
滑らかな面は不定曲線でもいいということで。これなら風が吹いたり電磁気が出たりで別のエネルギー加減
が生じない限り、公式当てはめで楽に解答できる。
同じ内容の物理現象を、別の言葉で言い換えたり、別のイラスト図で書き換えたりして、形式変換コーパスを増やす。
2014/11/06(木) 14:50:01.57ID:1dD9kBwW
数学TAの第5問「104を素因数分解すると〜」ができなかったのは何故かを数学担当者に聞いてみた。
いくら東ロボが語学オンチでも、これはないだろう、と。

http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/3/0/301029f2.jpg

前文の「104以下の自然数で,104と互いに素である自然数の個数を求めよう。」に目がくらんで解答できなかったらしい。
余計なノイズ(最初の問いでは)が判断を狂わせたのだ。何がノイズかは、文章の一部を何百回もランダムに抜き出して吟味するしかない。
長文は一文一文を分解して(省略語を補い、かつ「それ」「これ」などの代名詞の内容は明確にした上で)、
例えば一つの大問に10の文章があったら、その中からランダムに一つ(10通り)、ランダムに2つ(10×9÷2=45通り)、
ランダムに3つ(10・9・8÷3・2)・・・というふうに挙げてみる。また一つの文を文節に区切ったり、短い文に書き換えたり、
省略語を補ったり、ランダムにいくつかの文節を切り取ってみたりして、小問ごとに必要な要素だけを抽出する。

http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/8/f/8f23e42b.jpg

数列もからっきしだった。これの最初の問いは、ある条件での等比数列の一般項を求めるというごく初歩的な問い。

いったんノイズを消去して、a2 = 24 , a5 = 192 から r^3 = 8
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/5/6/56b247f8.jpg
あとから復活させて、公比は実数だから r = 2 よって
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/2/8/28b927d8.jpg
公比=2、かつ a2 = 24 より 初項a1 = 12 、よって数列{an}の一般項は an = 12(2)^(n-1)
http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/c/3/c3506aa2.jpg

あとは東ロボくんお得意の「同値変形」で楽勝のはず。
153デフォルトの名無しさん
垢版 |
2014/11/06(木) 16:11:34.55ID:1dD9kBwW
>ブルーベリーがのったデコレーションケーキ(のイラスト)なんて、おそらく多くの人が生まれて初めて見るものでしょうね。
>なのに、われわれはそれがそうだと、正しくわかる。どうしてなのでしょうか。

http://livedoor.blogimg.jp/mikamikanmikamikan/imgs/0/9/090ff180.jpg

こうして「ある部分」を削除してしまえば、「何かと何かが交互に楕円形に並んでいる」くらいの認識はできるはずだ。

どのように削除するかは、「境界線」のみに着目して切り分けで、あとはランダムに何万通りも抽出する。
2014/11/06(木) 18:54:37.32ID:yUh2UtPW
ここを頻繁に更新している人って同一人物なの?
155デフォルトの名無しさん
垢版 |
2014/11/06(木) 20:49:20.00ID:Z+6n6avI
>>153
画像処理を最低限知ってから言えよ
ちんぷんかんぷんだわ
156デフォルトの名無しさん
垢版 |
2014/11/07(金) 02:56:19.25ID:zRPOEUiC
>>155
そういう君は、画像処理のプロなの?
157デフォルトの名無しさん
垢版 |
2014/11/07(金) 20:12:31.00ID:LCGb7X+6
囲碁の碁石は、将棋の駒とは違い、一つ一つに能力の差は無い。状況によって要石になったり廃石になったりする。
これは企業が社員ひとりひとりの評価をどうするかという問題と似ている。どの社員が必要で、どの社員がお荷物なのか。
ある時には存分の活躍をしていた社員も、時代が変わればお荷物になったり、逆に新人のときにお荷物だった社員が、
3年目で頭角を現してくる場合もありうる。碁石の評価は社員の社内評価と同じと考えられないだろうか。

●●●
●●●
●●●

だが少なくとも上の図の真ん中の黒石は、役に立たないどころか完全な害悪であろう。会社で言えば「懲戒免職」に値する。
こんな社員ばかりを抱えている企業に、未来があるようには思えない。囲碁における「評価関数」も、
○手目現在における人事評価ということにしてはどうか。
158デフォルトの名無しさん
垢版 |
2014/11/08(土) 04:53:29.67ID:WHpgboF2
>>156
プロだけど?
でも書き込みの内容から最低限度の知識も無いことは誰でもわかるね
159片山博文MZ次期CEO ◆T6xkBnTXz7B0
垢版 |
2014/11/08(土) 05:41:32.70ID:ebCh2W7f
【確率問題の考え方】
1.試行や事象を表す文章から、すべての未知数の範囲を決定し、
それぞれの未知数の範囲を区間の集合として表す(Boost.Icl参照)。
2.特定の試行や事象の未知数の組合せを計算し、全試行・全事象の組合せに対する割合を求めたものが確率である。
2014/11/08(土) 06:33:51.13ID:ebCh2W7f
※「コインには裏と表がある」「袋にお金を入れると袋の中のお金が増える」
といった常識を理解しておく必要がある。
※試行には順序がある。
161デフォルトの名無しさん
垢版 |
2014/11/08(土) 09:53:46.74ID:DB2yxOk0
>>158
>プロだけど?
>でも書き込みの内容から最低限度の知識も無いことは誰でもわかるね

では先生が>言う「最低限度の知識」とは何?
162デフォルトの名無しさん
垢版 |
2014/11/08(土) 09:56:43.31ID:6X6f98tO
>>158は素人なのは、書き込みからして明らか。プロなら間違いの理由を理路整然と述べる。
163デフォルトの名無しさん
垢版 |
2014/11/08(土) 09:58:47.70ID:6X6f98tO
>>161
「プロのあなたに教わりたい」なんて言ったら逆切れするだろうねw
2014/11/08(土) 10:04:27.32ID:DB2yxOk0
更に言えば、その道で高給稼いでる画像処理のプロが、こんな2ちゃんねるの名無しの
ゴミカキコにいちいち反応する理由があるのか。

踊るアホウに見るアホウwwww
165デフォルトの名無しさん
垢版 |
2014/11/08(土) 10:10:13.37ID:6X6f98tO
優秀なプロの画像処理エンジニアの君のレスを、早く読みたいなぁw
2014/11/08(土) 11:13:11.28ID:V4kxl14a
公務員試験の先生がなにをほざいているの?
167デフォルトの名無しさん
垢版 |
2014/11/09(日) 00:34:13.35ID:iKOy/805
>>162
しょうがないなぁ
マッチング性能トップはずっとconvolution newralnetだよ
画像処理の機械学習について調べたらすぐ出てくることだぜ
168デフォルトの名無しさん
垢版 |
2014/11/09(日) 00:36:05.09ID:iKOy/805
東ロボくんの講演で参加者がアホなことほざいてるのは画像処理の人間がほぼいないからってだけだ
お互いにできるこできないことだけでも相談してみたらいいのにね
だから情報工学は程度が低いって言われるんだよ
2014/11/09(日) 09:28:59.82ID:GJ+B7IxW
せめて画像認識とかコンピュータビジョンとか言ってくれ
170デフォルトの名無しさん
垢版 |
2014/11/09(日) 12:07:09.66ID:iKOy/805
アハハハw
171デフォルトの名無しさん
垢版 |
2014/11/09(日) 18:10:14.84ID:uoUT28t9
>>168
>東ロボくんの講演で参加者がアホなことほざいてるのは

だから優秀なエンジニアの君にこそ、技術立国日本の未来がかかっているってことさ!!

優秀なエンジニアの君の話を、もっと聞きたいなぁ。
2014/11/09(日) 19:16:53.62ID:wHnpXD4s
>>168
お前が無知だということはよくわかった。もう来ないで欲しい。
173デフォルトの名無しさん
垢版 |
2014/11/11(火) 07:12:12.70ID:0bxYCDe4
「各○個ずつあり」「左から1列に並べる」「〜の順に並んでいる」「繰り返し行う」「次の操作を繰り返し行う」「無作為に〜を選び」
「場所を入れ替える」、そのままを当てはめればいいだけではないのか。

<2014年代ゼミ東大プレ文系数学第二問>
 白球,黒球,赤球,青球が各1個ずつあり,これらを左から1列に並べる。最初,4個の球は左から「白球,黒球,赤球,青球」
の順に並んでいる。これらの球に,次の操作(※)を繰り返し行う。
(※)4個の球のうちから無作為に2個の球を選び,これらの並んでいる場所を入れ替える
<以下略>

【問】A,B,Cの3つの箱と,赤,白,青,黄の玉が各3個ずつある。
http://www.nipec.nein.ed.jp/kk/b14/h22/pdf/16nagai.pdf

(1)順序をつけて,左から 1 列に並べる場合をすべてあげよ.
http://157.7.137.167/text/mat_a_s2/mat_a_s2_05.pdf

http://pws.prserv.net/math/mathpuz.html
3人は、前からA、B、Cの順に並んでいます。

いま、初めに頂点Aに白玉を1個、頂点Cに赤玉を1個置き次の操作を繰り返し行う。
http://www.riruraru.com/cfv21/math/kom11sA4.htm

例題 13 右の表は,206 個の卵のうちから無作為に35個を選び,その重さを調べたものである。
http://www.insatell.co.jp/CN/ikou/chugaku/pdf/chumath_3.pdf

池の左側にアマガエルが、右側にヒキガエルが3匹ずつ並んでいる。このカエルのいる場所をそっくり入れ替えてほしい。
http://r27.jp/quiz/toads-and-frogs/
174デフォルトの名無しさん
垢版 |
2014/11/12(水) 11:50:37.55ID:LPSYNXn+
中間言語方式はなぜ失敗したのか
2014/11/12(水) 14:03:23.82ID:dsokmnVj
機械翻訳における枢軸(pivot)の話か?
そのような中間言語を作ることが事実上不可能だから。以上。
176デフォルトの名無しさん
垢版 |
2014/11/12(水) 15:33:24.76ID:LPSYNXn+
なぜ不可能だったのか
177デフォルトの名無しさん
垢版 |
2014/11/12(水) 22:23:18.43ID:yWDn898h
 検索キーワードを選んだら「実数」「満たす」「範囲」とか「a」「x」とか、ほとんど変わらないです。
でも、解き方も答えも全然違う。数学の問題は、統計的手法ではどうにもならなさそうです。
1)xを実数とする。つねにx^2 + ax + 4 ≧ 0 であるとき、aの範囲を求めよ。
2)x,y を実数とする、a = x + y とする。つねにx^2 + y^2 = 1 であるとき、aの範囲を求めよ。
<ロボットは東大に入れるか 新井紀子>

>つねにx^2 + ax + 4 ≧ 0 であるとき、
>つねにx^2 + y^2 = 1 であるとき、

前者は「2次不等式」、後者は「円の方程式」。それくらいの違いは区別してもらいたい。
2014/11/12(水) 22:50:00.93ID:dsokmnVj
>>176
日本語の「首」が、ネックの意味だったりヘッドの意味だったりするとか
そういった翻訳上の困難を全部、しかもあらゆる言語間におけるそういった
差異を全部中間言語が吸収しなければならない。あるいは、そうでなければ
各言語間のそういった問題を、中間言語(への・からの)変換部分が抱え込む
必要があって、結局、n 個の言語に対して n × n 個の翻訳エンジンを作るのと
変わらない難しさということになってしまう。
179デフォルトの名無しさん
垢版 |
2014/11/13(木) 00:33:08.26ID:EzUPhDs/
中間言語の候補としては、数学とか物理とかが良いと思う。「東ロボ」プロジェクトに期待したい。

>つねにx^2 + y^2 = 1 であるとき、

x^2が1/x(x≠0)だったら話は違ってくるだろう。また高校数学で二次方程式は解けるが三次方程式は解けない。
180デフォルトの名無しさん
垢版 |
2014/11/13(木) 02:08:12.41ID:EzUPhDs/
類似性に基づく推論は,人間の強力な問題解決方略の 1つである.我々は
新奇な問題に遭遇した時,自分自身が過去に経験した問題や既存の例と
いった「事例」から似たものを参照し,それを問題解決に利用することが
多い.そのため,様々な課題を用いて,人間の類似性判断や問題解決にお
ける思考メカニズムを理解する認知心理学的研究や,類似性に基づく推論
を要素技術として問題解決や問題解決支援を行う計算機システムを構築す
る知識工学的研究が展開されてきた.
類似性に基づく推論においては,現在直面している問題と類似する過去
の事例を利用することから,類似性の判断が問題解決における重要なキー
となる.類似性は,問題と事例との間の同一の要素(共通点),および,
異なる要素(差異)に基づいて評価される.一般に,現在の問題と完全に
一致する過去の事例が利用できることは稀であるため,通常は問題と事例
との差異に基づき,事例を修正する必要がある.
しかし,差異は単に埋められなければならないだけのものではなく,差
異に積極的な意味が生じる場合も存在する.その一例が,数学学習におけ
る問題解決である.数学学習には,教示された問題(例題)に基づいて別
の問題(類題)を解く類題解決や,学習者自身が新しい問題を作り出す作
問といった問題解決がある.数学における作問については,問題を作るこ
とは問題を解くことと同様に重要な活動であることが,数学者や数学教育
者によって指摘されている.

類似性に基づく推論を用いた知的問題解決支援の検討と実現
http://ir.nul.nagoya-u.ac.jp/jspui/bitstream/2237/8249/1/kojima_thesis.pdf
2014/11/13(木) 03:28:10.49ID:mINVD8Cg
中間言語やインターフェースは、卸しと同じ

メーカーが10社、小売店が20社あるとき、
卸しが無いと、10*20=200 通りのコネクションが必要だが、

卸しを中間に介すると、メーカー・卸し間が10通り、
小売店・卸し間が20通りの合計、10+20=30 通り

つまり、掛け算を足し算にすることで、
組み合わせ爆発を防いで、コネクションの手間をへらす
2014/11/13(木) 07:54:59.39ID:EnlSRtmw
>>179
一般的解法は教えられないが数学Uで因数定理を使った解き方は教えられる
2014/11/13(木) 10:17:56.29ID:7ZjHj42h
>>179
単に言語が表現できる世界を極端に制限するだけじゃないか。
そんなことを許せばいくらでも簡単になることは当然わかっている。

そのかわりどんな短篇小説の一本も訳せないような使えないゴミができるだけだ。
184デフォルトの名無しさん
垢版 |
2014/11/13(木) 14:34:17.79ID:ydn9QRw8
>>183
東ロボは国語もやってるが?
2014/11/13(木) 15:00:26.25ID:7ZjHj42h
機械翻訳における枢軸(pivot)の話とは違う「中間言語」のことを言いたいのか?
だったら知らんわ。
186デフォルトの名無しさん
垢版 |
2014/11/13(木) 23:46:06.97ID:G+XRMicG
東ロボの話してるやつは体系的に勉強して出直してこい
2014/11/14(金) 02:28:48.58ID:cE0anVKk
>>186
そういう君は、自然言語処理学のプロなの?
2014/11/14(金) 10:28:40.79ID:0NdzO4Gj
プロの定義による、と一蹴されて終わりということがわかっている質問をなぜするのか?
人工知能云々以前に、バカだから、か。
2014/11/14(金) 10:55:08.96ID:NoejJarl
プロといいたいアマチュアな方が
2014/11/14(金) 10:59:07.21ID:0NdzO4Gj
東ロボの話してるやつはどう見てもアマチュア以前だがな
2014/11/14(金) 10:59:35.20ID:NoejJarl
アマチュア以前ってありですか?
2014/11/14(金) 11:05:09.41ID:/Gbyfjip
ここにプロ以降()が居るとは思えん。
2014/11/14(金) 11:11:46.80ID:NoejJarl
それっぽい方がたまに降臨されることが
194デフォルトの名無しさん
垢版 |
2014/11/14(金) 16:47:02.37ID:cE0anVKk
>>188
>プロの定義による、と一蹴されて終わりということがわかっている質問をなぜするのか?

レスありがとう。それが自然言語処理学のプロたる君の意見なんだね。

だから優秀なエンジニアの君にこそ、技術立国日本の未来がかかってるってことさ!
2014/11/14(金) 17:15:16.64ID:127iWseV
東ロボはマーケティング・話題作りのセンスがズバ抜けている
エスキモーに氷を売れるレベル
196デフォルトの名無しさん
垢版 |
2014/11/14(金) 20:26:15.60ID:E47YIEif
人工知能学会の親戚でしょ
無人気すぎて細々とやってたとこで昔からアマチュアの参加を奨励してたよね
197デフォルトの名無しさん
垢版 |
2014/11/16(日) 15:42:31.45ID:jrq2Dts2
( 1) オブジェクト指向的アプローチによる係り受け/語義曖昧性解決/照応解析/
述語項解析システム
伊藤 英紀 ((株)富士通研究所)
係り受け解析、語義曖昧性解決、照応解析、および述語項解析の4つのタスクに
対する新たなアプローチを提案する。第一に、これら4つの処理を、逐次的(パイ
プライン的)にでなく同時に行う。これにより、逐次的に行うよりも解析精度が
向上することが期待される。第二に、文中の名詞をオブジェクトに対応させ、
それらオブジェクトの属性とその変化をトラッキングする。形容詞は一般にオブ
ジェクトの属性を、動詞はそれらオブジェクト属性の変化を表す、と考える。
これにより、文脈の情報を解析結果に反映させることが可能となる。このような
意味理解のモデルは、人間が脳で行っているであろう理解プロセスに近く、自然
言語理解には有望なアプローチである。このアイデアに基づいたシステムを実装
し、例文に対して動作を確認した。
( 2) uLSIF を用いた事例への重み付けによる語彙曖昧性解消の領域適応
新納 浩幸, 菊池 裕紀, 佐々木 稔, 古宮 嘉那子 (茨城大学工学部情報工学科)
語彙曖昧性解消の領域適応に対して共変量シフト下の学習を試みる。確率密度比
の算出に uLSIF を用いる。このとき通常のガウスカーネルではなく線形カーネ
ルを利用する、また重み付き学習には、通常、最大エントロピー法を用いるが、
ここでは SVM を利用する。また確率密度比が極端に小さい、あるいは大きい事
例のみに重みを与える方法も試す。
http://www.ipsj.or.jp/kenkyukai/event/nl218.html
2014/11/18(火) 04:28:56.07ID:3dChaymz
長文コピペする奴がいるせいで糞スレに
199デフォルトの名無しさん
垢版 |
2014/11/18(火) 14:10:53.64ID:7YVftxrd
人工無脳学会はないの?
200sage
垢版 |
2014/11/18(火) 20:56:42.46ID:jieDrr0b
>>198
本当だよね。このスレは本来需要が高いはずなんだけど、スパム投稿で荒らされてる気がする。
201デフォルトの名無しさん
垢版 |
2014/11/18(火) 21:19:15.86ID:f2DqKBZs
自然言語処理の需要ってあんの?
2014/11/18(火) 21:44:26.22ID:EImKA09P
>>200
削除願い出したら?
203sage
垢版 |
2014/11/19(水) 01:09:50.33ID:hLraT9DN
削除して再出発しても、自分の意見のない荒らし君が来るとまた同じだからなぁ。
204デフォルトの名無しさん
垢版 |
2014/11/19(水) 05:37:54.13ID:SWof/ihh
じゃあ聞くけど東大ロボットて問題どう読み込んでるの
世界史なんか図をを認識する必要があるのに
まさか手作業で、コンピュータに理解できるように
入力してるじゃあないだろうなw
2014/11/19(水) 06:50:11.76ID:CbmB6PIS
長文禁止とかいうルール無いからなぁ…荒らしとは判断し辛い。
長文投げる人がコテつけてくれたらいいんじゃないかな?読みたい人は読めて長文嫌いな人は黙ってNGできるように。
206デフォルトの名無しさん
垢版 |
2014/11/20(木) 08:59:42.01ID:AVgM9bDZ
でも画像処理スレが他にあるのにここで変な話されてもね
2014/11/21(金) 19:28:46.00ID:u/qmfXxQ
>>206
画像が東ロボの本質というわけではないよね。
208デフォルトの名無しさん
垢版 |
2014/11/21(金) 21:08:35.82ID:u7zfQT1D
>>207
>>153
209デフォルトの名無しさん
垢版 |
2014/11/21(金) 22:00:40.78ID:o0Qb8YAB
>>208
もしかして>>153を投稿された方でしょうか。でしたら質問があります。

現在の画像処理技術で、「不要な部分を消して、必要な部分だけ取り出して認識」は可能ですか?
また>>153の画像から、「何かと何かが交互に楕円形に並んでいる」と認識させることは可能ですか?
それから>>136>>143のように、「認識に必要な輪郭だけを取り出す」ことは可能ですか?
210デフォルトの名無しさん
垢版 |
2014/11/21(金) 22:33:18.98ID:u7zfQT1D
画像処理 その14
http://peace.2ch.net/test/read.cgi/tech/1370170263/
2014/11/22(土) 01:13:12.25ID:AHB+ph+z
亀レス。

>>137
文章題は、「風が吹けば桶屋が儲かる」方式の連想モードで何とかなるかも。機械には
「なぜそうなるか」の論理思考は無理だが、試験問題の多くはそういう能力を要求していない。
212デフォルトの名無しさん
垢版 |
2014/11/22(土) 01:16:42.03ID:g4vKpQIM
何言ってんだ?
213デフォルトの名無しさん
垢版 |
2014/11/22(土) 14:09:13.78ID:6/H2UDnl
エラー分析まとめ
<誤り 200事例 分析結果>
@正解を支持する推論事例が得られていても誤った
? 従来の知識表現で?適切でない推論事例が適用されてしまうのではないか?
→ 大部分を占めている.@事象間関係知識?文脈化
A正解を支持する推論事例が得られなかった
? 2億もの推論事例をもってしても得られない → 類似した事例が在るが適用できない
? より大規模にすれ?解決する問題なのか? → そういった問題?少ない
http://www.cl.ecei.tohoku.ac.jp/~jun-s/publications/nlp2014_slides.pdf
2014/11/22(土) 16:10:30.29ID:6qlI/h48
人口知能
詐欺集団の合言葉
役人の受けがいい、人口知能関連で科研費が出やすい
何時までも詐欺行為がとまらない
2014/11/22(土) 19:26:32.72ID:ueFBqDyb
「人口知能」じゃ予算は出ないと思うけど
2014/11/22(土) 22:49:14.76ID:o5aDMJLX
いかにも僻み根性だけで生きている無能らしい誤字だな
2014/11/23(日) 02:01:52.03ID:PwhPUgLb
>>124
>作業者の多くは人文系の日雇いもしくは時間単価で働くパート労働者であり,

「 2チャンネラー百万人 」ってのも、当たらずしも遠からずだな。
2014/11/23(日) 02:42:03.48ID:PwhPUgLb
新井紀子氏「これは面白い結果。"含意関係認識は人間には易しく機械には難しい"と我々人工
知能/自然言語処理の学者は考えているが、本当にすべての人間は含意関係認識を行えるのだろうか」
219デフォルトの名無しさん
垢版 |
2014/11/23(日) 03:50:57.22ID:EIkF2ojA
情報工学の連中はなぜ自分らのやってることをサイエンスだと思ってるんだ?
2014/11/23(日) 03:57:22.23ID:K4bM7kRY
確かにどっちかというと数学に近い
221デフォルトの名無しさん
垢版 |
2014/11/23(日) 04:24:52.15ID:EIkF2ojA
数学ならサイエンスだろ
アホか
2014/11/23(日) 10:31:00.56ID:K4bM7kRY
もうしわけないが数学はサイエンス=自然科学ではないね
2014/11/23(日) 10:43:58.95ID:heOpQ8vp
お前の中ではな。
2014/11/23(日) 10:52:01.52ID:U8weQpWK
工学はエンジニアリングだしな。
こういったごく基本的な語の解釈すら怪しい奴が何を批判しようとしても自爆するのは当然w
2014/11/23(日) 10:56:15.70ID:K4bM7kRY
え?数学が自然科学ではない、というのは当たり前の話じゃなかったの?
2014/11/23(日) 15:07:14.96ID:z0t1kbZ2
数学が自然科学じゃなきゃ何に分類されるって言うんだそもそもスレチだが
2014/11/23(日) 15:13:23.98ID:K4bM7kRY
>>226
形式科学 http://ja.wikipedia.org/wiki/%E5%BD%A2%E5%BC%8F%E7%A7%91%E5%AD%A6 だね
228デフォルトの名無しさん
垢版 |
2014/11/23(日) 18:57:03.46ID:PERA2nvu
51. 意味素性 つづき ?出来事および動作、作用の領域:PRC ?ACT(動作、行為) ?EVE(イベント、出来事)
?APO(予定に従った行動: ex 銀行が9時から始まる) ?RES(結果 ex 災害) ?PRO(結果、制作物 ex パンを焼く)
?PHE(自然現象の結果できるもの ex 氷が張る) ?NAT(自然物、現象 ex 台風、太陽) ?PLA(植物) ?GAS(気体 ex 霧、息)
?ELM(五感では捉えられない性質 ex たんぱく質、神 経) ?POT(身体部位 potency ex 足、肩、肺、胃腸)
52. 意味素性 つづき ?抽象性の領域:ABS ?Price(収入、価格) ?Measure(身長、体重) ?Information(情報、身長、小説、音楽、批評、住所)
?Quantity(重量、面積) ?Social bonds(格差、関係) ?Grade(身分、評価、規模) ?Form (評価される属性 ex 味、形)
?Attribute(程度で計るもの ex 非常識、進歩、塩) ?Reciprocity(相性) ?Personality(意地、性格) ?Mind (勘、神経)
?Manner(能力、性向など ex 料理、詰め、発表、運転、色 使い、人使い)
53. 意味素性 つづき ?抽象性の領域:ABS ?Method(方法、やり方) ?Objective-value(値 ex 赤、四角) ?Sensational-value(甘い、辛い)
?Evaluation(評価 ex 台所が苦しい、財政、舌) ?Currency(価格 ex 100ドル、1000円) ?Duration(期間 ex 3年) ?Distance (距離 ex 3km)
?Item(数を表す、ex 3人、1個) ?Ratio(割合, ex 30%) ?Quantity(量 ex 30kg) ?State(状態 ex安定、幸福、不幸、静か、可能、頑固)
54. 意味素性 つづき ?抽象性の領域:ABS ?Role(役職名) ?Relational-term(親族、交友関係) ?Direction(東西南北左右上下前後)
?Phase(時間的、位置的順序) ?Reference-point(基準点からの相対 ex 逆、以上) ?Norm(規則、法則、法律、公式)
?Subfield(学問、芸術、スポーツなどの分野) ?Inclination(心理的傾向 ex 興味、馴染み) ?Appearance(外見 ex印象、態度、形跡)
?Unit(単位) ?Time-point(時点) ?Time(出来事の順序関係、抽象的時間 ex 将来)
http://www.slideshare.net/hirsoshnakagawa3/grammar-39910952
■ このスレッドは過去ログ倉庫に格納されています