自然言語処理スレッド　その４

**デフォルトの名無しさん** · 2014/06/03(火) 05:40:00.54

前前スレ　自然言語処理スレッド　その２
http://mimizun.com/log/2ch/tech/1173105287/
前スレ　自然言語処理スレッド　その３
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。

**片山博文MZ次期CEO** ◆T6xkBnTXz7B0 · 2014/11/08(土) 05:41:32.70

【確率問題の考え方】
１．試行や事象を表す文章から、すべての未知数の範囲を決定し、
それぞれの未知数の範囲を区間の集合として表す(Boost.Icl参照)。
２．特定の試行や事象の未知数の組合せを計算し、全試行・全事象の組合せに対する割合を求めたものが確率である。

**片山博文MZ次期CEO** ◆T6xkBnTXz7B0 · 2014/11/08(土) 06:33:51.13

※「コインには裏と表がある」「袋にお金を入れると袋の中のお金が増える」
といった常識を理解しておく必要がある。
※試行には順序がある。

**デフォルトの名無しさん** · 2014/11/08(土) 09:53:46.74

>>158
＞プロだけど？
＞でも書き込みの内容から最低限度の知識も無いことは誰でもわかるね

では先生が>言う「最低限度の知識」とは何？

**デフォルトの名無しさん** · 2014/11/08(土) 09:56:43.31

>>158は素人なのは、書き込みからして明らか。プロなら間違いの理由を理路整然と述べる。

**デフォルトの名無しさん** · 2014/11/08(土) 09:58:47.70

>>161
「プロのあなたに教わりたい」なんて言ったら逆切れするだろうねw

**デフォルトの名無しさん** · 2014/11/08(土) 10:04:27.32

更に言えば、その道で高給稼いでる画像処理のプロが、こんな２ちゃんねるの名無しの
ゴミカキコにいちいち反応する理由があるのか。

踊るアホウに見るアホウｗｗｗｗ

**デフォルトの名無しさん** · 2014/11/08(土) 10:10:13.37

優秀なプロの画像処理エンジニアの君のレスを、早く読みたいなぁw

**デフォルトの名無しさん** · 2014/11/08(土) 11:13:11.28

公務員試験の先生がなにをほざいているの？

**デフォルトの名無しさん** · 2014/11/09(日) 00:34:13.35

>>162
しょうがないなぁ
マッチング性能トップはずっとconvolution newralnetだよ
画像処理の機械学習について調べたらすぐ出てくることだぜ

**デフォルトの名無しさん** · 2014/11/09(日) 00:36:05.09

東ロボくんの講演で参加者がアホなことほざいてるのは画像処理の人間がほぼいないからってだけだ
お互いにできるこできないことだけでも相談してみたらいいのにね
だから情報工学は程度が低いって言われるんだよ

**デフォルトの名無しさん** · 2014/11/09(日) 09:28:59.82

せめて画像認識とかコンピュータビジョンとか言ってくれ

**デフォルトの名無しさん** · 2014/11/09(日) 12:07:09.66

アハハハｗ

**デフォルトの名無しさん** · 2014/11/09(日) 18:10:14.84

>>168
＞東ロボくんの講演で参加者がアホなことほざいてるのは

だから優秀なエンジニアの君にこそ、技術立国日本の未来がかかっているってことさ！！

優秀なエンジニアの君の話を、もっと聞きたいなぁ。

**デフォルトの名無しさん** · 2014/11/09(日) 19:16:53.62

>>168
お前が無知だということはよくわかった。もう来ないで欲しい。

**デフォルトの名無しさん** · 2014/11/11(火) 07:12:12.70

「各○個ずつあり」「左から1列に並べる」「～の順に並んでいる」「繰り返し行う」「次の操作を繰り返し行う」「無作為に～を選び」
「場所を入れ替える」、そのままを当てはめればいいだけではないのか。

＜2014年代ゼミ東大プレ文系数学第二問＞
　白球，黒球，赤球，青球が各１個ずつあり，これらを左から１列に並べる。最初，４個の球は左から「白球，黒球，赤球，青球」
の順に並んでいる。これらの球に，次の操作（※）を繰り返し行う。
（※）４個の球のうちから無作為に２個の球を選び，これらの並んでいる場所を入れ替える
＜以下略＞

【問】Ａ，Ｂ，Ｃの３つの箱と，赤，白，青，黄の玉が各３個ずつある。
http://www.nipec.nein.ed.jp/kk/b14/h22/pdf/16nagai.pdf

（１）順序をつけて，左から 1 列に並べる場合をすべてあげよ．
http://157.7.137.167/text/mat_a_s2/mat_a_s2_05.pdf

http://pws.prserv.net/math/mathpuz.html
３人は、前からＡ、Ｂ、Ｃの順に並んでいます。

いま、初めに頂点Aに白玉を1個、頂点Cに赤玉を1個置き次の操作を繰り返し行う。
http://www.riruraru.com/cfv21/math/kom11sA4.htm

例題 13 右の表は，206 個の卵のうちから無作為に35個を選び，その重さを調べたものである。
http://www.insatell.co.jp/CN/ikou/chugaku/pdf/chumath_3.pdf

池の左側にアマガエルが、右側にヒキガエルが3匹ずつ並んでいる。このカエルのいる場所をそっくり入れ替えてほしい。
http://r27.jp/quiz/toads-and-frogs/

**デフォルトの名無しさん** · 2014/11/12(水) 11:50:37.55

中間言語方式はなぜ失敗したのか

**デフォルトの名無しさん** · 2014/11/12(水) 14:03:23.82

機械翻訳における枢軸（pivot）の話か？
そのような中間言語を作ることが事実上不可能だから。以上。

**デフォルトの名無しさん** · 2014/11/12(水) 15:33:24.76

なぜ不可能だったのか

**デフォルトの名無しさん** · 2014/11/12(水) 22:23:18.43

　検索キーワードを選んだら「実数」「満たす」「範囲」とか「a」「x」とか、ほとんど変わらないです。
でも、解き方も答えも全然違う。数学の問題は、統計的手法ではどうにもならなさそうです。
１）xを実数とする。つねにx^2 + ax + 4 ≧ 0 であるとき、aの範囲を求めよ。
２）x,y を実数とする、a = x + y とする。つねにx^2 + y^2 = 1 であるとき、aの範囲を求めよ。
＜ロボットは東大に入れるか　新井紀子＞

＞つねにx^2 + ax + 4 ≧ 0 であるとき、
＞つねにx^2 + y^2 = 1 であるとき、

前者は「2次不等式」、後者は「円の方程式」。それくらいの違いは区別してもらいたい。

**デフォルトの名無しさん** · 2014/11/12(水) 22:50:00.93

>>176
日本語の「首」が、ネックの意味だったりヘッドの意味だったりするとか
そういった翻訳上の困難を全部、しかもあらゆる言語間におけるそういった
差異を全部中間言語が吸収しなければならない。あるいは、そうでなければ
各言語間のそういった問題を、中間言語（への・からの）変換部分が抱え込む
必要があって、結局、n 個の言語に対して n × n 個の翻訳エンジンを作るのと
変わらない難しさということになってしまう。

**デフォルトの名無しさん** · 2014/11/13(木) 00:33:08.26

中間言語の候補としては、数学とか物理とかが良いと思う。「東ロボ」プロジェクトに期待したい。

＞つねにx^2 + y^2 = 1 であるとき、

x^2が１/x（x≠0）だったら話は違ってくるだろう。また高校数学で二次方程式は解けるが三次方程式は解けない。

**デフォルトの名無しさん** · 2014/11/13(木) 02:08:12.41

類似性に基づく推論は，人間の強力な問題解決方略の 1つである．我々は
新奇な問題に遭遇した時，自分自身が過去に経験した問題や既存の例と
いった「事例」から似たものを参照し，それを問題解決に利用することが
多い．そのため，様々な課題を用いて，人間の類似性判断や問題解決にお
ける思考メカニズムを理解する認知心理学的研究や，類似性に基づく推論
を要素技術として問題解決や問題解決支援を行う計算機システムを構築す
る知識工学的研究が展開されてきた．
類似性に基づく推論においては，現在直面している問題と類似する過去
の事例を利用することから，類似性の判断が問題解決における重要なキー
となる．類似性は，問題と事例との間の同一の要素（共通点），および，
異なる要素（差異）に基づいて評価される．一般に，現在の問題と完全に
一致する過去の事例が利用できることは稀であるため，通常は問題と事例
との差異に基づき，事例を修正する必要がある．
しかし，差異は単に埋められなければならないだけのものではなく，差
異に積極的な意味が生じる場合も存在する．その一例が，数学学習におけ
る問題解決である．数学学習には，教示された問題（例題）に基づいて別
の問題（類題）を解く類題解決や，学習者自身が新しい問題を作り出す作
問といった問題解決がある．数学における作問については，問題を作るこ
とは問題を解くことと同様に重要な活動であることが，数学者や数学教育
者によって指摘されている．

類似性に基づく推論を用いた知的問題解決支援の検討と実現
http://ir.nul.nagoya-u.ac.jp/jspui/bitstream/2237/8249/1/kojima_thesis.pdf

**デフォルトの名無しさん** · 2014/11/13(木) 03:28:10.49

中間言語やインターフェースは、卸しと同じ

メーカーが10社、小売店が20社あるとき、
卸しが無いと、10*20=200 通りのコネクションが必要だが、

卸しを中間に介すると、メーカー・卸し間が10通り、
小売店・卸し間が20通りの合計、10+20=30 通り

つまり、掛け算を足し算にすることで、
組み合わせ爆発を防いで、コネクションの手間をへらす

**デフォルトの名無しさん** · 2014/11/13(木) 07:54:59.39

>>179
一般的解法は教えられないが数学Ⅱで因数定理を使った解き方は教えられる

**デフォルトの名無しさん** · 2014/11/13(木) 10:17:56.29

>>179
単に言語が表現できる世界を極端に制限するだけじゃないか。
そんなことを許せばいくらでも簡単になることは当然わかっている。

そのかわりどんな短篇小説の一本も訳せないような使えないゴミができるだけだ。

**デフォルトの名無しさん** · 2014/11/13(木) 14:34:17.79

>>183
東ロボは国語もやってるが？

**デフォルトの名無しさん** · 2014/11/13(木) 15:00:26.25

機械翻訳における枢軸（pivot）の話とは違う「中間言語」のことを言いたいのか？
だったら知らんわ。

**デフォルトの名無しさん** · 2014/11/13(木) 23:46:06.97

東ロボの話してるやつは体系的に勉強して出直してこい

**デフォルトの名無しさん** · 2014/11/14(金) 02:28:48.58

>>186
そういう君は、自然言語処理学のプロなの？

**デフォルトの名無しさん** · 2014/11/14(金) 10:28:40.79

プロの定義による、と一蹴されて終わりということがわかっている質問をなぜするのか？
人工知能云々以前に、バカだから、か。

**デフォルトの名無しさん** · 2014/11/14(金) 10:55:08.96

プロといいたいアマチュアな方が

**デフォルトの名無しさん** · 2014/11/14(金) 10:59:07.21

東ロボの話してるやつはどう見てもアマチュア以前だがな

**デフォルトの名無しさん** · 2014/11/14(金) 10:59:35.20

アマチュア以前ってありですか？

**デフォルトの名無しさん** · 2014/11/14(金) 11:05:09.41

ここにプロ以降()が居るとは思えん。

**デフォルトの名無しさん** · 2014/11/14(金) 11:11:46.80

それっぽい方がたまに降臨されることが

**デフォルトの名無しさん** · 2014/11/14(金) 16:47:02.37

>>188
＞プロの定義による、と一蹴されて終わりということがわかっている質問をなぜするのか？

レスありがとう。それが自然言語処理学のプロたる君の意見なんだね。

だから優秀なエンジニアの君にこそ、技術立国日本の未来がかかってるってことさ！

**デフォルトの名無しさん** · 2014/11/14(金) 17:15:16.64

東ロボはマーケティング・話題作りのセンスがズバ抜けている
エスキモーに氷を売れるレベル

**デフォルトの名無しさん** · 2014/11/14(金) 20:26:15.60

人工知能学会の親戚でしょ
無人気すぎて細々とやってたとこで昔からアマチュアの参加を奨励してたよね

**デフォルトの名無しさん** · 2014/11/16(日) 15:42:31.45

( 1) オブジェクト指向的アプローチによる係り受け/語義曖昧性解決/照応解析/
述語項解析システム
伊藤英紀 (（株）富士通研究所)
係り受け解析、語義曖昧性解決、照応解析、および述語項解析の4つのタスクに
対する新たなアプローチを提案する。第一に、これら4つの処理を、逐次的(パイ
プライン的)にでなく同時に行う。これにより、逐次的に行うよりも解析精度が
向上することが期待される。第二に、文中の名詞をオブジェクトに対応させ、
それらオブジェクトの属性とその変化をトラッキングする。形容詞は一般にオブ
ジェクトの属性を、動詞はそれらオブジェクト属性の変化を表す、と考える。
これにより、文脈の情報を解析結果に反映させることが可能となる。このような
意味理解のモデルは、人間が脳で行っているであろう理解プロセスに近く、自然
言語理解には有望なアプローチである。このアイデアに基づいたシステムを実装
し、例文に対して動作を確認した。
( 2) uLSIF を用いた事例への重み付けによる語彙曖昧性解消の領域適応
新納浩幸, 菊池裕紀, 佐々木稔, 古宮嘉那子 (茨城大学工学部情報工学科)
語彙曖昧性解消の領域適応に対して共変量シフト下の学習を試みる。確率密度比
の算出に uLSIF を用いる。このとき通常のガウスカーネルではなく線形カーネ
ルを利用する、また重み付き学習には、通常、最大エントロピー法を用いるが、
ここでは SVM を利用する。また確率密度比が極端に小さい、あるいは大きい事
例のみに重みを与える方法も試す。
http://www.ipsj.or.jp/kenkyukai/event/nl218.html

**デフォルトの名無しさん** · 2014/11/18(火) 04:28:56.07

長文コピペする奴がいるせいで糞ｽﾚに

**デフォルトの名無しさん** · 2014/11/18(火) 14:10:53.64

人工無脳学会はないの？

**sage** · 2014/11/18(火) 20:56:42.46

>>198
本当だよね。このスレは本来需要が高いはずなんだけど、スパム投稿で荒らされてる気がする。

**デフォルトの名無しさん** · 2014/11/18(火) 21:19:15.86

自然言語処理の需要ってあんの？

**デフォルトの名無しさん** · 2014/11/18(火) 21:44:26.22

>>200
削除願い出したら？

**sage** · 2014/11/19(水) 01:09:50.33

削除して再出発しても、自分の意見のない荒らし君が来るとまた同じだからなぁ。

**デフォルトの名無しさん** · 2014/11/19(水) 05:37:54.13

じゃあ聞くけど東大ロボットて問題どう読み込んでるの
世界史なんか図をを認識する必要があるのに
まさか手作業で、コンピュータに理解できるように
入力してるじゃあないだろうなw

**デフォルトの名無しさん** · 2014/11/19(水) 06:50:11.76

長文禁止とかいうルール無いからなぁ…荒らしとは判断し辛い。
長文投げる人がコテつけてくれたらいいんじゃないかな？読みたい人は読めて長文嫌いな人は黙ってNGできるように。

**デフォルトの名無しさん** · 2014/11/20(木) 08:59:42.01

でも画像処理スレが他にあるのにここで変な話されてもね

**デフォルトの名無しさん** · 2014/11/21(金) 19:28:46.00

>>206
画像が東ロボの本質というわけではないよね。

**デフォルトの名無しさん** · 2014/11/21(金) 21:08:35.82

>>207
>>153

**デフォルトの名無しさん** · 2014/11/21(金) 22:00:40.78

>>208
もしかして>>153を投稿された方でしょうか。でしたら質問があります。

現在の画像処理技術で、「不要な部分を消して、必要な部分だけ取り出して認識」は可能ですか？
また>>153の画像から、「何かと何かが交互に楕円形に並んでいる」と認識させることは可能ですか？
それから>>136や>>143のように、「認識に必要な輪郭だけを取り出す」ことは可能ですか？

**デフォルトの名無しさん** · 2014/11/21(金) 22:33:18.98

画像処理その14
http://peace.2ch.net/test/read.cgi/tech/1370170263/

**デフォルトの名無しさん** · 2014/11/22(土) 01:13:12.25

亀レス。

>>137
文章題は、「風が吹けば桶屋が儲かる」方式の連想モードで何とかなるかも。機械には
「なぜそうなるか」の論理思考は無理だが、試験問題の多くはそういう能力を要求していない。

**デフォルトの名無しさん** · 2014/11/22(土) 01:16:42.03

何言ってんだ？

**デフォルトの名無しさん** · 2014/11/22(土) 14:09:13.78

エラー分析まとめ
<誤り 200事例分析結果>
①正解を支持する推論事例が得られていても誤った
? 従来の知識表現で?適切でない推論事例が適用されてしまうのではないか？
→ 大部分を占めている．①事象間関係知識?文脈化
②正解を支持する推論事例が得られなかった
? 2億もの推論事例をもってしても得られない → 類似した事例が在るが適用できない
? より大規模にすれ?解決する問題なのか？ → そういった問題?少ない
http://www.cl.ecei.tohoku.ac.jp/~jun-s/publications/nlp2014_slides.pdf

**デフォルトの名無しさん** · 2014/11/22(土) 16:10:30.29

人口知能
詐欺集団の合言葉
役人の受けがいい､人口知能関連で科研費が出やすい
何時までも詐欺行為がとまらない

**デフォルトの名無しさん** · 2014/11/22(土) 19:26:32.72

「人口知能」じゃ予算は出ないと思うけど

**デフォルトの名無しさん** · 2014/11/22(土) 22:49:14.76

いかにも僻み根性だけで生きている無能らしい誤字だな

**デフォルトの名無しさん** · 2014/11/23(日) 02:01:52.03

>>124
＞作業者の多くは人文系の日雇いもしくは時間単価で働くパート労働者であり，

「２チャンネラー百万人」ってのも、当たらずしも遠からずだな。

**デフォルトの名無しさん** · 2014/11/23(日) 02:42:03.48

新井紀子氏「これは面白い結果。"含意関係認識は人間には易しく機械には難しい"と我々人工
知能/自然言語処理の学者は考えているが、本当にすべての人間は含意関係認識を行えるのだろうか」

**デフォルトの名無しさん** · 2014/11/23(日) 03:50:57.22

情報工学の連中はなぜ自分らのやってることをサイエンスだと思ってるんだ？

**デフォルトの名無しさん** · 2014/11/23(日) 03:57:22.23

確かにどっちかというと数学に近い

**デフォルトの名無しさん** · 2014/11/23(日) 04:24:52.15

数学ならサイエンスだろ
アホか

**デフォルトの名無しさん** · 2014/11/23(日) 10:31:00.56

もうしわけないが数学はサイエンス=自然科学ではないね

**デフォルトの名無しさん** · 2014/11/23(日) 10:43:58.95

お前の中ではな。

**デフォルトの名無しさん** · 2014/11/23(日) 10:52:01.52

工学はエンジニアリングだしな。
こういったごく基本的な語の解釈すら怪しい奴が何を批判しようとしても自爆するのは当然w

◆QZaw55cn4c · 2014/11/23(日) 10:56:15.70

え？数学が自然科学ではない、というのは当たり前の話じゃなかったの？

**デフォルトの名無しさん** · 2014/11/23(日) 15:07:14.96

数学が自然科学じゃなきゃ何に分類されるって言うんだそもそもスレチだが

**デフォルトの名無しさん** · 2014/11/23(日) 15:13:23.98

>>226
形式科学 http://ja.wikipedia.org/wiki/%E5%BD%A2%E5%BC%8F%E7%A7%91%E5%AD%A6 だね

**デフォルトの名無しさん** · 2014/11/23(日) 18:57:03.46

51. 意味素性つづき ?出来事および動作、作用の領域：PRC ?ACT（動作、行為） ?EVE（イベント、出来事）
?APO（予定に従った行動： ex 銀行が9時から始まる） ?RES（結果 ex 災害） ?PRO(結果、制作物 ex パンを焼く）
?PHE（自然現象の結果できるもの ex 氷が張る） ?NAT（自然物、現象 ex 台風、太陽） ?PLA(植物） ?GAS（気体 ex 霧、息)
?ELM(五感では捉えられない性質 ex たんぱく質、神経） ?POT（身体部位 potency ex 足、肩、肺、胃腸)
52. 意味素性つづき ?抽象性の領域：ABS ?Price（収入、価格） ?Measure（身長、体重） ?Information（情報、身長、小説、音楽、批評、住所）
?Quantity（重量、面積） ?Social bonds（格差、関係） ?Grade(身分、評価、規模） ?Form （評価される属性 ex 味、形）
?Attribute（程度で計るもの ex 非常識、進歩、塩） ?Reciprocity（相性） ?Personality（意地、性格） ?Mind （勘、神経）
?Manner（能力、性向など ex 料理、詰め、発表、運転、色使い、人使い）
53. 意味素性つづき ?抽象性の領域：ABS ?Method（方法、やり方） ?Objective-value(値 ex 赤、四角） ?Sensational-value（甘い、辛い）
?Evaluation(評価 ex 台所が苦しい、財政、舌） ?Currency(価格 ex １００ドル、１０００円） ?Duration（期間 ex ３年） ?Distance （距離 ex ３ｋｍ）
?Item（数を表す、ex ３人、１個） ?Ratio（割合, ex 30%) ?Quantity(量 ex 30kg) ?State(状態 ex安定、幸福、不幸、静か、可能、頑固）
54. 意味素性つづき ?抽象性の領域：ABS ?Role(役職名） ?Relational-term（親族、交友関係） ?Direction(東西南北左右上下前後）
?Phase(時間的、位置的順序） ?Reference-point(基準点からの相対 ex 逆、以上） ?Norm(規則、法則、法律、公式）
?Subfield(学問、芸術、スポーツなどの分野） ?Inclination(心理的傾向 ex 興味、馴染み） ?Appearance（外見 ex印象、態度、形跡）
?Unit（単位） ?Time-point（時点） ?Time(出来事の順序関係、抽象的時間 ex 将来）
http://www.slideshare.net/hirsoshnakagawa3/grammar-39910952

**デフォルトの名無しさん** · 2014/11/23(日) 18:57:20.44

役に立てばどっちでもいいよ

**デフォルトの名無しさん** · 2014/11/23(日) 19:14:32.75

整数は神が作ったから整数論は自然科学
それ以外は人間がつくったｋら形式科学

**デフォルトの名無しさん** · 2014/11/23(日) 19:22:23.28

グーグルが開発を進めている、写真を「自動的に説明する」技術
http://wired.jp/2014/11/20/google-image-recognition/
自然言語処理に新風を巻き起こしたWord2Vecとは何か
http://business.nikkeibp.co.jp/article/bigdata/20141110/273649/
述語項構造を意識した名詞の意味構造アノテーションのための名詞意味構造の検討
http://www.ninjal.ac.jp/event/specialists/project-meeting/files/JCLWorkshop_no6_papers/JCLWorkshop_No6_06.pdf

意味役割の種類
現段階での意味役割の種類を記述する．大きく 4 つの類にわけて，中分類で 29 種類を定義した．
さらにこれらに対して属性タイプが付与される形である．まず 29 種類を以下に示す．
構文類 ? 　　　　　連語，外の関係，補語相当
対象類 ? 　　　　　経験者，被使役者，対象，基準, 相互, 起点，着点，起点・着点，通過点，経路，方向
動作主類 ? 　　　使役，原因，動作主，使役者，手段
条件周辺類 ? 　　限界，領域，場所，時間，条件，様態，程度，目的，順接，逆接

**デフォルトの名無しさん** · 2014/11/23(日) 19:26:53.14

>>228
>>231
ならば今こそ、そうした「意味役割」を付与したアノテーションコーパスを作成すべきだ。
それこそ「２チャンネラー百万人」を動員すれば何とかなるはずた。

**デフォルトの名無しさん** · 2014/11/23(日) 19:34:46.40

2ちゃんねらーなんか動員したら、ゴミの山が出来上がるだけ。
徴兵とか徴農とかがたいしてうまくいくシステムじゃないのと同じ。

**デフォルトの名無しさん** · 2014/11/23(日) 21:41:51.89

でも、アノテーションコーパスは、人手でやるしかないんでしょ。

**デフォルトの名無しさん** · 2014/11/24(月) 03:15:43.74

無意味なコピペするやつやめてくんない？

**デフォルトの名無しさん** · 2014/11/24(月) 11:35:30.53

>>228とかホント迷惑だよね。お前の意見はないの?という。

**デフォルトの名無しさん** · 2014/11/24(月) 23:07:25.90

>>124
＞作業者の多くは人文系の日雇いもしくは時間単価で働くパート労働者であり，

４３歳ニートの俺でも雇ってくれるかな・・・

**デフォルトの名無しさん** · 2014/11/25(火) 09:26:09.87

数学では，ある問題を解くために，その問題を別の問題に翻訳して，もとの問題ではなく
て翻訳された問題の方を解く，という方法がとられることがよくあります．A という問
題を解くために，B という問題が解ければ，その解から A の解も得られることが判って
いるような問題 B をうまく設定して，A を解くかわりに B を解くのです．このような
問題 B を見つけることを，「問題 A を問題 B に帰着させる」と表現します．B は以下の
例でのように単に A の言い替えにすぎない場合もありますが，面白いことには，B は A
よりむしろ難しい問題になっていることも多いのです．これは，問題がやさしいか難しい
かは必ずしも問題が解きやすいかどうかということと一致しない，ということでしょう．
多くの場合，解きたい本来の問題 A を帰着させる先の問題 B は A よりずっと抽象的
な問題になっています．これは，前の節でも述べた，抽象的な設定の方が数学的には扱い
やすい，という現象の現われと言えるでしょう．
もとの問題 A が一般的な（必ずしも数学で扱えそうには見えないような）問題で，そ
れを数学的な問題 B に帰着させているときには，A の数学化(mathem atization)が B で
ある，というような言い方をすることもあります．
一般的な問題を数学的な問題に帰着させる，つまりこの一般的な問題の数学化を行う
例として「ケーニヒスベルクの橋の問題」という名前で知られている問題について考察し
てみることにしましょう．
http://kurt.scitec.kobe-u.ac.jp/~fuchino/chubu/method-math-WS06.pdf

**デフォルトの名無しさん** · 2014/11/25(火) 12:38:38.21

無意味なコピペ迷惑だからやめてくんない？

**デフォルトの名無しさん** · 2014/11/25(火) 12:48:45.94

反応する馬鹿も消えろよｗｗ

**デフォルトの名無しさん** · 2014/11/25(火) 12:50:18.42

叩かないと消えないでしょ

**デフォルトの名無しさん** · 2014/11/25(火) 13:21:08.54

tech：プログラム技術［重要削除］
http://qb5.2ch.net/test/read.cgi/saku2ch/1273146924/

**デフォルトの名無しさん** · 2014/11/25(火) 14:01:43.88

コーパス開発はオープンにした方がよい、という提言で、全てのやり取りを公開しましょう、
という話なのだが、オープンソースソフトウェア開発のようにソースコードから開発のやり取り
まで全てをオープンにできる場合もあるが、コーパス作成は元のテキストを書いた人がいるわけで、
全てをオープンにできないという性格がどうしてもつきまとう。もちろん再利用可能なテキスト
にアノテーションをすればいいし、テキストを作るところからオープンにもできるわけだが、
それで見えなくなってしまう言語現象も少なくないと思われるし（実際講演の中でも「少数の
事例をどうするか」という問題提起があった）、個人的にはセミクローズド（特定のグループ内で共有）
程度が現実的なところではないかと思う。
それより大事だと思われるのは、そういったコーパス開発に参加する、あるいは門前の小僧状態で聞
くだけでも人が育つことであって、結局ここがボトルネックになり、特定の研究室の出身者しかノウハウがない、
という状況になっているのだと思う。特に個人的にポイントだと思っているのは、先日も書いたような新人
に対して優しいコミュニティになっているかどうかで、自然言語処理自体はかなり新人が入りやすい
コミュニティだと思うのだが、ことコーパスや辞書のようなリソース作成系はかなりハードルが高いと感じる。
コーパス分析やそれを用いた自動解析に関しても、簡単にできるところはすでにやり尽くされていて、
残っているのは難しいところばかりで、簡単なところから練習してウォーミングアップし、
助走期間を設けて本丸に突撃する、というようになっていないのである。もちろん最先端を走る研究者
たちで議論するのはもっとも難しい事例でよいし、むしろそうでないと意味がないのだが、簡単な事例
から始める（あるいは既存のものの分析からではなく、新しいタグ付与にメンターつきで最初から関わる）、
というトレーニングもあってよいと思う。
http://d.hatena.ne.jp/mamoruk/20140902/p1

**デフォルトの名無しさん** · 2014/11/25(火) 14:04:53.12

コピペうぜぇ。

誰か削除願い出せや。

**デフォルトの名無しさん** · 2014/11/25(火) 14:29:27.54

コーパス作成について一からやり直したほうがいいかどうかは、悩ましい問題なので一概にどうだ
ということは言いにくいのですが、アノテーション・コーパス作成自体が大きな研究テーマであり、
ベストプラクティス的なものもなければ、少しだけ蓄積されているノウハウ的なものすらチーム
レベルでしか共有できていない（共有するのが難しい）、という状況です。また、やり直したら
すぐコーパスができるかというと、質の高いコーパスを作るには時間が何年もかかるものなので
（自分の携わった NAIST テキストコーパスは5年以上かかっています）、すぐ利用可能にはならないでしょう。
http://d.hatena.ne.jp/mamoruk/20140902/p1

**デフォルトの名無しさん** · 2014/11/26(水) 10:03:34.88

国や自治体は、地球儀で表現できる。物体・流体とその運動は、シミュレーターで表現できる。
人物とその行動はオブジェクトで表現できる。けれども「民主主義」とかの抽象概念は表現できず、
せいぜい共起関係を調べるのみ。例えば朝鮮民主主義人民共和国だって「民主主義」ということで、
北朝鮮＝民主主義国家なんて理屈も成り立つ。しかしこれは一般的なイメージとはかけ離れている。
従って抽象概念を一般的なイメージに帰着させるためには、いくつかの具体物を結びつけるしかない。

「世間」とは何か
http://www.pat.hi-ho.ne.jp/nobu-nisi/kokugo/seken.htm

「世間」とは・・・近所のおばさん、警察、新聞、学校、勤め先の会社、知り合い・・・・

**デフォルトの名無しさん** · 2014/11/27(木) 17:46:09.92

英語の論文読むのが苦痛でたまらない
はやく翻訳装置つくってくれ

**デフォルトの名無しさん** · 2014/11/28(金) 17:31:36.07

対話の学習ってどうやるの？

**デフォルトの名無しさん** · 2014/11/28(金) 21:08:06.67

第二に，3 次元オブジェクトの中には複数の物体から構成されるオブジェクトがある（たとえば，図 6 は「花」と「鉢」
から成る一つのオブジェクトである）．今後，画像解析技術が進み，機械が複数の物体から構成されるオブジェクト
を一つ一つの物体に分解できたとしても，機械にとって，それが常識に基づいた構成であるか，常識から外れた
構成であるかを区別することは困難であると推測される．
http://minamigaki.cs.inf.shizuoka.ac.jp/work/2014/SCIS2014fujita.pdf

**デフォルトの名無しさん** · 2014/12/01(月) 17:26:06.50

目障りなコピペ野郎が

**デフォルトの名無しさん** · 2014/12/02(火) 19:50:43.04

東ロボくん　センター模試2014

英語………95
国語………69
世界史Ｂ… 52
日本史Ｂ… 44
数学ⅠＡ… 40
数学ⅡＢ… 55
物理………31

７科目合計…386/900

漢文は全問ノーマーク
世界史Ｂは２問ノーマーク
日本史Ｂは４問ノーマーク

数学じゃないんだから
分からない問題はランダムにマークしろよ…

**デフォルトの名無しさん** · 2014/12/02(火) 19:51:56.20

漢文・世界史Ｂ・日本史Ｂ
ノーマークの問題をすべてランダムにマークしてたら
49.6％の確率で14点以上アップ

つまり49.6％の確率で７科目合計が400点に届いたことになる

**デフォルトの名無しさん** · 2014/12/02(火) 19:53:47.76

東ロボくん　英語　センター模試2014

発音・アクセント問題…パーフェクト（配点14）

未知語-語意推測問題…パーフェクト（配点8）

グラフ・図表問題…得点率75％（配点20）

語句整序完成問題…得点率67％（配点12）

意見要旨把握問題…得点率67％（配点18）

文法・語法・語彙問題…得点率60％（配点20）

会話文完成問題…得点率33％（配点12）

文脈に合わない文-指摘問題…得点率33％（配点15）

実用文書読解問題…得点率33％（配点15）

読解問題（論説文）…得点率33％（配点36）

読解問題（情報理解）…全滅（配点30）

**デフォルトの名無しさん** · 2014/12/02(火) 19:54:56.87

東ロボくん　国語（現代文）　センター模試2014

漢字…パーフェクト（配点10）

語句の意味…得点率67％（配点9）

評論読解…得点率50％（配点40）

小説読解…得点率32％（配点41）

**デフォルトの名無しさん** · 2014/12/02(火) 19:55:07.53

東ロボくんの話しないでくれない？

**デフォルトの名無しさん** · 2014/12/02(火) 21:51:00.22

>>255
お前実は、自分で長文コピペ貼っておいて、自作自演してる張本人だろ？

**デフォルトの名無しさん** · 2014/12/03(水) 20:07:38.80

>>253
未知語の推測問題、推測するまでもなく意味を知ってたんじゃないのこれ

**デフォルトの名無しさん** · 2014/12/03(水) 21:02:56.05

文章が入力されたら、隠れマルコフモデルがたくさん存在する集合に射影するようなことできないかなぁ

自然言語処理スレッド その４

自然言語処理スレッド　その４