自然言語処理スレッド その4

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2014/06/03(火) 05:40:00.54ID:yefNLumx
前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
159片山博文MZ次期CEO ◆T6xkBnTXz7B0
垢版 |
2014/11/08(土) 05:41:32.70ID:ebCh2W7f
【確率問題の考え方】
1.試行や事象を表す文章から、すべての未知数の範囲を決定し、
それぞれの未知数の範囲を区間の集合として表す(Boost.Icl参照)。
2.特定の試行や事象の未知数の組合せを計算し、全試行・全事象の組合せに対する割合を求めたものが確率である。
2014/11/08(土) 06:33:51.13ID:ebCh2W7f
※「コインには裏と表がある」「袋にお金を入れると袋の中のお金が増える」
といった常識を理解しておく必要がある。
※試行には順序がある。
161デフォルトの名無しさん
垢版 |
2014/11/08(土) 09:53:46.74ID:DB2yxOk0
>>158
>プロだけど?
>でも書き込みの内容から最低限度の知識も無いことは誰でもわかるね

では先生が>言う「最低限度の知識」とは何?
162デフォルトの名無しさん
垢版 |
2014/11/08(土) 09:56:43.31ID:6X6f98tO
>>158は素人なのは、書き込みからして明らか。プロなら間違いの理由を理路整然と述べる。
163デフォルトの名無しさん
垢版 |
2014/11/08(土) 09:58:47.70ID:6X6f98tO
>>161
「プロのあなたに教わりたい」なんて言ったら逆切れするだろうねw
2014/11/08(土) 10:04:27.32ID:DB2yxOk0
更に言えば、その道で高給稼いでる画像処理のプロが、こんな2ちゃんねるの名無しの
ゴミカキコにいちいち反応する理由があるのか。

踊るアホウに見るアホウwwww
165デフォルトの名無しさん
垢版 |
2014/11/08(土) 10:10:13.37ID:6X6f98tO
優秀なプロの画像処理エンジニアの君のレスを、早く読みたいなぁw
2014/11/08(土) 11:13:11.28ID:V4kxl14a
公務員試験の先生がなにをほざいているの?
167デフォルトの名無しさん
垢版 |
2014/11/09(日) 00:34:13.35ID:iKOy/805
>>162
しょうがないなぁ
マッチング性能トップはずっとconvolution newralnetだよ
画像処理の機械学習について調べたらすぐ出てくることだぜ
168デフォルトの名無しさん
垢版 |
2014/11/09(日) 00:36:05.09ID:iKOy/805
東ロボくんの講演で参加者がアホなことほざいてるのは画像処理の人間がほぼいないからってだけだ
お互いにできるこできないことだけでも相談してみたらいいのにね
だから情報工学は程度が低いって言われるんだよ
2014/11/09(日) 09:28:59.82ID:GJ+B7IxW
せめて画像認識とかコンピュータビジョンとか言ってくれ
170デフォルトの名無しさん
垢版 |
2014/11/09(日) 12:07:09.66ID:iKOy/805
アハハハw
171デフォルトの名無しさん
垢版 |
2014/11/09(日) 18:10:14.84ID:uoUT28t9
>>168
>東ロボくんの講演で参加者がアホなことほざいてるのは

だから優秀なエンジニアの君にこそ、技術立国日本の未来がかかっているってことさ!!

優秀なエンジニアの君の話を、もっと聞きたいなぁ。
2014/11/09(日) 19:16:53.62ID:wHnpXD4s
>>168
お前が無知だということはよくわかった。もう来ないで欲しい。
173デフォルトの名無しさん
垢版 |
2014/11/11(火) 07:12:12.70ID:0bxYCDe4
「各○個ずつあり」「左から1列に並べる」「〜の順に並んでいる」「繰り返し行う」「次の操作を繰り返し行う」「無作為に〜を選び」
「場所を入れ替える」、そのままを当てはめればいいだけではないのか。

<2014年代ゼミ東大プレ文系数学第二問>
 白球,黒球,赤球,青球が各1個ずつあり,これらを左から1列に並べる。最初,4個の球は左から「白球,黒球,赤球,青球」
の順に並んでいる。これらの球に,次の操作(※)を繰り返し行う。
(※)4個の球のうちから無作為に2個の球を選び,これらの並んでいる場所を入れ替える
<以下略>

【問】A,B,Cの3つの箱と,赤,白,青,黄の玉が各3個ずつある。
http://www.nipec.nein.ed.jp/kk/b14/h22/pdf/16nagai.pdf

(1)順序をつけて,左から 1 列に並べる場合をすべてあげよ.
http://157.7.137.167/text/mat_a_s2/mat_a_s2_05.pdf

http://pws.prserv.net/math/mathpuz.html
3人は、前からA、B、Cの順に並んでいます。

いま、初めに頂点Aに白玉を1個、頂点Cに赤玉を1個置き次の操作を繰り返し行う。
http://www.riruraru.com/cfv21/math/kom11sA4.htm

例題 13 右の表は,206 個の卵のうちから無作為に35個を選び,その重さを調べたものである。
http://www.insatell.co.jp/CN/ikou/chugaku/pdf/chumath_3.pdf

池の左側にアマガエルが、右側にヒキガエルが3匹ずつ並んでいる。このカエルのいる場所をそっくり入れ替えてほしい。
http://r27.jp/quiz/toads-and-frogs/
174デフォルトの名無しさん
垢版 |
2014/11/12(水) 11:50:37.55ID:LPSYNXn+
中間言語方式はなぜ失敗したのか
2014/11/12(水) 14:03:23.82ID:dsokmnVj
機械翻訳における枢軸(pivot)の話か?
そのような中間言語を作ることが事実上不可能だから。以上。
176デフォルトの名無しさん
垢版 |
2014/11/12(水) 15:33:24.76ID:LPSYNXn+
なぜ不可能だったのか
177デフォルトの名無しさん
垢版 |
2014/11/12(水) 22:23:18.43ID:yWDn898h
 検索キーワードを選んだら「実数」「満たす」「範囲」とか「a」「x」とか、ほとんど変わらないです。
でも、解き方も答えも全然違う。数学の問題は、統計的手法ではどうにもならなさそうです。
1)xを実数とする。つねにx^2 + ax + 4 ≧ 0 であるとき、aの範囲を求めよ。
2)x,y を実数とする、a = x + y とする。つねにx^2 + y^2 = 1 であるとき、aの範囲を求めよ。
<ロボットは東大に入れるか 新井紀子>

>つねにx^2 + ax + 4 ≧ 0 であるとき、
>つねにx^2 + y^2 = 1 であるとき、

前者は「2次不等式」、後者は「円の方程式」。それくらいの違いは区別してもらいたい。
2014/11/12(水) 22:50:00.93ID:dsokmnVj
>>176
日本語の「首」が、ネックの意味だったりヘッドの意味だったりするとか
そういった翻訳上の困難を全部、しかもあらゆる言語間におけるそういった
差異を全部中間言語が吸収しなければならない。あるいは、そうでなければ
各言語間のそういった問題を、中間言語(への・からの)変換部分が抱え込む
必要があって、結局、n 個の言語に対して n × n 個の翻訳エンジンを作るのと
変わらない難しさということになってしまう。
179デフォルトの名無しさん
垢版 |
2014/11/13(木) 00:33:08.26ID:EzUPhDs/
中間言語の候補としては、数学とか物理とかが良いと思う。「東ロボ」プロジェクトに期待したい。

>つねにx^2 + y^2 = 1 であるとき、

x^2が1/x(x≠0)だったら話は違ってくるだろう。また高校数学で二次方程式は解けるが三次方程式は解けない。
180デフォルトの名無しさん
垢版 |
2014/11/13(木) 02:08:12.41ID:EzUPhDs/
類似性に基づく推論は,人間の強力な問題解決方略の 1つである.我々は
新奇な問題に遭遇した時,自分自身が過去に経験した問題や既存の例と
いった「事例」から似たものを参照し,それを問題解決に利用することが
多い.そのため,様々な課題を用いて,人間の類似性判断や問題解決にお
ける思考メカニズムを理解する認知心理学的研究や,類似性に基づく推論
を要素技術として問題解決や問題解決支援を行う計算機システムを構築す
る知識工学的研究が展開されてきた.
類似性に基づく推論においては,現在直面している問題と類似する過去
の事例を利用することから,類似性の判断が問題解決における重要なキー
となる.類似性は,問題と事例との間の同一の要素(共通点),および,
異なる要素(差異)に基づいて評価される.一般に,現在の問題と完全に
一致する過去の事例が利用できることは稀であるため,通常は問題と事例
との差異に基づき,事例を修正する必要がある.
しかし,差異は単に埋められなければならないだけのものではなく,差
異に積極的な意味が生じる場合も存在する.その一例が,数学学習におけ
る問題解決である.数学学習には,教示された問題(例題)に基づいて別
の問題(類題)を解く類題解決や,学習者自身が新しい問題を作り出す作
問といった問題解決がある.数学における作問については,問題を作るこ
とは問題を解くことと同様に重要な活動であることが,数学者や数学教育
者によって指摘されている.

類似性に基づく推論を用いた知的問題解決支援の検討と実現
http://ir.nul.nagoya-u.ac.jp/jspui/bitstream/2237/8249/1/kojima_thesis.pdf
2014/11/13(木) 03:28:10.49ID:mINVD8Cg
中間言語やインターフェースは、卸しと同じ

メーカーが10社、小売店が20社あるとき、
卸しが無いと、10*20=200 通りのコネクションが必要だが、

卸しを中間に介すると、メーカー・卸し間が10通り、
小売店・卸し間が20通りの合計、10+20=30 通り

つまり、掛け算を足し算にすることで、
組み合わせ爆発を防いで、コネクションの手間をへらす
2014/11/13(木) 07:54:59.39ID:EnlSRtmw
>>179
一般的解法は教えられないが数学Uで因数定理を使った解き方は教えられる
2014/11/13(木) 10:17:56.29ID:7ZjHj42h
>>179
単に言語が表現できる世界を極端に制限するだけじゃないか。
そんなことを許せばいくらでも簡単になることは当然わかっている。

そのかわりどんな短篇小説の一本も訳せないような使えないゴミができるだけだ。
184デフォルトの名無しさん
垢版 |
2014/11/13(木) 14:34:17.79ID:ydn9QRw8
>>183
東ロボは国語もやってるが?
2014/11/13(木) 15:00:26.25ID:7ZjHj42h
機械翻訳における枢軸(pivot)の話とは違う「中間言語」のことを言いたいのか?
だったら知らんわ。
186デフォルトの名無しさん
垢版 |
2014/11/13(木) 23:46:06.97ID:G+XRMicG
東ロボの話してるやつは体系的に勉強して出直してこい
2014/11/14(金) 02:28:48.58ID:cE0anVKk
>>186
そういう君は、自然言語処理学のプロなの?
2014/11/14(金) 10:28:40.79ID:0NdzO4Gj
プロの定義による、と一蹴されて終わりということがわかっている質問をなぜするのか?
人工知能云々以前に、バカだから、か。
2014/11/14(金) 10:55:08.96ID:NoejJarl
プロといいたいアマチュアな方が
2014/11/14(金) 10:59:07.21ID:0NdzO4Gj
東ロボの話してるやつはどう見てもアマチュア以前だがな
2014/11/14(金) 10:59:35.20ID:NoejJarl
アマチュア以前ってありですか?
2014/11/14(金) 11:05:09.41ID:/Gbyfjip
ここにプロ以降()が居るとは思えん。
2014/11/14(金) 11:11:46.80ID:NoejJarl
それっぽい方がたまに降臨されることが
194デフォルトの名無しさん
垢版 |
2014/11/14(金) 16:47:02.37ID:cE0anVKk
>>188
>プロの定義による、と一蹴されて終わりということがわかっている質問をなぜするのか?

レスありがとう。それが自然言語処理学のプロたる君の意見なんだね。

だから優秀なエンジニアの君にこそ、技術立国日本の未来がかかってるってことさ!
2014/11/14(金) 17:15:16.64ID:127iWseV
東ロボはマーケティング・話題作りのセンスがズバ抜けている
エスキモーに氷を売れるレベル
196デフォルトの名無しさん
垢版 |
2014/11/14(金) 20:26:15.60ID:E47YIEif
人工知能学会の親戚でしょ
無人気すぎて細々とやってたとこで昔からアマチュアの参加を奨励してたよね
197デフォルトの名無しさん
垢版 |
2014/11/16(日) 15:42:31.45ID:jrq2Dts2
( 1) オブジェクト指向的アプローチによる係り受け/語義曖昧性解決/照応解析/
述語項解析システム
伊藤 英紀 ((株)富士通研究所)
係り受け解析、語義曖昧性解決、照応解析、および述語項解析の4つのタスクに
対する新たなアプローチを提案する。第一に、これら4つの処理を、逐次的(パイ
プライン的)にでなく同時に行う。これにより、逐次的に行うよりも解析精度が
向上することが期待される。第二に、文中の名詞をオブジェクトに対応させ、
それらオブジェクトの属性とその変化をトラッキングする。形容詞は一般にオブ
ジェクトの属性を、動詞はそれらオブジェクト属性の変化を表す、と考える。
これにより、文脈の情報を解析結果に反映させることが可能となる。このような
意味理解のモデルは、人間が脳で行っているであろう理解プロセスに近く、自然
言語理解には有望なアプローチである。このアイデアに基づいたシステムを実装
し、例文に対して動作を確認した。
( 2) uLSIF を用いた事例への重み付けによる語彙曖昧性解消の領域適応
新納 浩幸, 菊池 裕紀, 佐々木 稔, 古宮 嘉那子 (茨城大学工学部情報工学科)
語彙曖昧性解消の領域適応に対して共変量シフト下の学習を試みる。確率密度比
の算出に uLSIF を用いる。このとき通常のガウスカーネルではなく線形カーネ
ルを利用する、また重み付き学習には、通常、最大エントロピー法を用いるが、
ここでは SVM を利用する。また確率密度比が極端に小さい、あるいは大きい事
例のみに重みを与える方法も試す。
http://www.ipsj.or.jp/kenkyukai/event/nl218.html
2014/11/18(火) 04:28:56.07ID:3dChaymz
長文コピペする奴がいるせいで糞スレに
199デフォルトの名無しさん
垢版 |
2014/11/18(火) 14:10:53.64ID:7YVftxrd
人工無脳学会はないの?
200sage
垢版 |
2014/11/18(火) 20:56:42.46ID:jieDrr0b
>>198
本当だよね。このスレは本来需要が高いはずなんだけど、スパム投稿で荒らされてる気がする。
201デフォルトの名無しさん
垢版 |
2014/11/18(火) 21:19:15.86ID:f2DqKBZs
自然言語処理の需要ってあんの?
2014/11/18(火) 21:44:26.22ID:EImKA09P
>>200
削除願い出したら?
203sage
垢版 |
2014/11/19(水) 01:09:50.33ID:hLraT9DN
削除して再出発しても、自分の意見のない荒らし君が来るとまた同じだからなぁ。
204デフォルトの名無しさん
垢版 |
2014/11/19(水) 05:37:54.13ID:SWof/ihh
じゃあ聞くけど東大ロボットて問題どう読み込んでるの
世界史なんか図をを認識する必要があるのに
まさか手作業で、コンピュータに理解できるように
入力してるじゃあないだろうなw
2014/11/19(水) 06:50:11.76ID:CbmB6PIS
長文禁止とかいうルール無いからなぁ…荒らしとは判断し辛い。
長文投げる人がコテつけてくれたらいいんじゃないかな?読みたい人は読めて長文嫌いな人は黙ってNGできるように。
206デフォルトの名無しさん
垢版 |
2014/11/20(木) 08:59:42.01ID:AVgM9bDZ
でも画像処理スレが他にあるのにここで変な話されてもね
2014/11/21(金) 19:28:46.00ID:u/qmfXxQ
>>206
画像が東ロボの本質というわけではないよね。
208デフォルトの名無しさん
垢版 |
2014/11/21(金) 21:08:35.82ID:u7zfQT1D
>>207
>>153
209デフォルトの名無しさん
垢版 |
2014/11/21(金) 22:00:40.78ID:o0Qb8YAB
>>208
もしかして>>153を投稿された方でしょうか。でしたら質問があります。

現在の画像処理技術で、「不要な部分を消して、必要な部分だけ取り出して認識」は可能ですか?
また>>153の画像から、「何かと何かが交互に楕円形に並んでいる」と認識させることは可能ですか?
それから>>136>>143のように、「認識に必要な輪郭だけを取り出す」ことは可能ですか?
210デフォルトの名無しさん
垢版 |
2014/11/21(金) 22:33:18.98ID:u7zfQT1D
画像処理 その14
http://peace.2ch.net/test/read.cgi/tech/1370170263/
2014/11/22(土) 01:13:12.25ID:AHB+ph+z
亀レス。

>>137
文章題は、「風が吹けば桶屋が儲かる」方式の連想モードで何とかなるかも。機械には
「なぜそうなるか」の論理思考は無理だが、試験問題の多くはそういう能力を要求していない。
212デフォルトの名無しさん
垢版 |
2014/11/22(土) 01:16:42.03ID:g4vKpQIM
何言ってんだ?
213デフォルトの名無しさん
垢版 |
2014/11/22(土) 14:09:13.78ID:6/H2UDnl
エラー分析まとめ
<誤り 200事例 分析結果>
@正解を支持する推論事例が得られていても誤った
? 従来の知識表現で?適切でない推論事例が適用されてしまうのではないか?
→ 大部分を占めている.@事象間関係知識?文脈化
A正解を支持する推論事例が得られなかった
? 2億もの推論事例をもってしても得られない → 類似した事例が在るが適用できない
? より大規模にすれ?解決する問題なのか? → そういった問題?少ない
http://www.cl.ecei.tohoku.ac.jp/~jun-s/publications/nlp2014_slides.pdf
2014/11/22(土) 16:10:30.29ID:6qlI/h48
人口知能
詐欺集団の合言葉
役人の受けがいい、人口知能関連で科研費が出やすい
何時までも詐欺行為がとまらない
2014/11/22(土) 19:26:32.72ID:ueFBqDyb
「人口知能」じゃ予算は出ないと思うけど
2014/11/22(土) 22:49:14.76ID:o5aDMJLX
いかにも僻み根性だけで生きている無能らしい誤字だな
2014/11/23(日) 02:01:52.03ID:PwhPUgLb
>>124
>作業者の多くは人文系の日雇いもしくは時間単価で働くパート労働者であり,

「 2チャンネラー百万人 」ってのも、当たらずしも遠からずだな。
2014/11/23(日) 02:42:03.48ID:PwhPUgLb
新井紀子氏「これは面白い結果。"含意関係認識は人間には易しく機械には難しい"と我々人工
知能/自然言語処理の学者は考えているが、本当にすべての人間は含意関係認識を行えるのだろうか」
219デフォルトの名無しさん
垢版 |
2014/11/23(日) 03:50:57.22ID:EIkF2ojA
情報工学の連中はなぜ自分らのやってることをサイエンスだと思ってるんだ?
2014/11/23(日) 03:57:22.23ID:K4bM7kRY
確かにどっちかというと数学に近い
221デフォルトの名無しさん
垢版 |
2014/11/23(日) 04:24:52.15ID:EIkF2ojA
数学ならサイエンスだろ
アホか
2014/11/23(日) 10:31:00.56ID:K4bM7kRY
もうしわけないが数学はサイエンス=自然科学ではないね
2014/11/23(日) 10:43:58.95ID:heOpQ8vp
お前の中ではな。
2014/11/23(日) 10:52:01.52ID:U8weQpWK
工学はエンジニアリングだしな。
こういったごく基本的な語の解釈すら怪しい奴が何を批判しようとしても自爆するのは当然w
2014/11/23(日) 10:56:15.70ID:K4bM7kRY
え?数学が自然科学ではない、というのは当たり前の話じゃなかったの?
2014/11/23(日) 15:07:14.96ID:z0t1kbZ2
数学が自然科学じゃなきゃ何に分類されるって言うんだそもそもスレチだが
2014/11/23(日) 15:13:23.98ID:K4bM7kRY
>>226
形式科学 http://ja.wikipedia.org/wiki/%E5%BD%A2%E5%BC%8F%E7%A7%91%E5%AD%A6 だね
228デフォルトの名無しさん
垢版 |
2014/11/23(日) 18:57:03.46ID:PERA2nvu
51. 意味素性 つづき ?出来事および動作、作用の領域:PRC ?ACT(動作、行為) ?EVE(イベント、出来事)
?APO(予定に従った行動: ex 銀行が9時から始まる) ?RES(結果 ex 災害) ?PRO(結果、制作物 ex パンを焼く)
?PHE(自然現象の結果できるもの ex 氷が張る) ?NAT(自然物、現象 ex 台風、太陽) ?PLA(植物) ?GAS(気体 ex 霧、息)
?ELM(五感では捉えられない性質 ex たんぱく質、神 経) ?POT(身体部位 potency ex 足、肩、肺、胃腸)
52. 意味素性 つづき ?抽象性の領域:ABS ?Price(収入、価格) ?Measure(身長、体重) ?Information(情報、身長、小説、音楽、批評、住所)
?Quantity(重量、面積) ?Social bonds(格差、関係) ?Grade(身分、評価、規模) ?Form (評価される属性 ex 味、形)
?Attribute(程度で計るもの ex 非常識、進歩、塩) ?Reciprocity(相性) ?Personality(意地、性格) ?Mind (勘、神経)
?Manner(能力、性向など ex 料理、詰め、発表、運転、色 使い、人使い)
53. 意味素性 つづき ?抽象性の領域:ABS ?Method(方法、やり方) ?Objective-value(値 ex 赤、四角) ?Sensational-value(甘い、辛い)
?Evaluation(評価 ex 台所が苦しい、財政、舌) ?Currency(価格 ex 100ドル、1000円) ?Duration(期間 ex 3年) ?Distance (距離 ex 3km)
?Item(数を表す、ex 3人、1個) ?Ratio(割合, ex 30%) ?Quantity(量 ex 30kg) ?State(状態 ex安定、幸福、不幸、静か、可能、頑固)
54. 意味素性 つづき ?抽象性の領域:ABS ?Role(役職名) ?Relational-term(親族、交友関係) ?Direction(東西南北左右上下前後)
?Phase(時間的、位置的順序) ?Reference-point(基準点からの相対 ex 逆、以上) ?Norm(規則、法則、法律、公式)
?Subfield(学問、芸術、スポーツなどの分野) ?Inclination(心理的傾向 ex 興味、馴染み) ?Appearance(外見 ex印象、態度、形跡)
?Unit(単位) ?Time-point(時点) ?Time(出来事の順序関係、抽象的時間 ex 将来)
http://www.slideshare.net/hirsoshnakagawa3/grammar-39910952
2014/11/23(日) 18:57:20.44ID:yTKWpXRp
役に立てばどっちでもいいよ
230デフォルトの名無しさん
垢版 |
2014/11/23(日) 19:14:32.75ID:uAltGaNh
整数は神が作ったから整数論は自然科学
それ以外は人間がつくったkら形式科学
2014/11/23(日) 19:22:23.28ID:PERA2nvu
グーグルが開発を進めている、写真を「自動的に説明する」技術
http://wired.jp/2014/11/20/google-image-recognition/
自然言語処理に新風を巻き起こしたWord2Vecとは何か
http://business.nikkeibp.co.jp/article/bigdata/20141110/273649/
述語項構造を意識した名詞の意味構造アノテーションのための名詞意味構造の検討
http://www.ninjal.ac.jp/event/specialists/project-meeting/files/JCLWorkshop_no6_papers/JCLWorkshop_No6_06.pdf

意味役割の種類
現段階での意味役割の種類を記述する.大きく 4 つの類にわけて,中分類で 29 種類を定義した.
さらにこれらに対して属性タイプが付与される形である.まず 29 種類を以下に示す.
構文類 ?      連語,外の関係,補語相当
対象類 ?      経験者,被使役者,対象,基準, 相互, 起点,着点,起点・着点,通過点,経路,方向
動作主類 ?    使役,原因,動作主,使役者,手段
条件周辺類 ?   限界,領域,場所,時間,条件,様態,程度,目的,順接,逆接
2014/11/23(日) 19:26:53.14ID:PmCQRqdR
>>228
>>231
ならば今こそ、そうした「意味役割」を付与したアノテーションコーパスを作成すべきだ。
それこそ 「 2チャンネラー百万人 」を動員すれば何とかなるはずた。
2014/11/23(日) 19:34:46.40ID:U8weQpWK
2ちゃんねらーなんか動員したら、ゴミの山が出来上がるだけ。
徴兵とか徴農とかがたいしてうまくいくシステムじゃないのと同じ。
234デフォルトの名無しさん
垢版 |
2014/11/23(日) 21:41:51.89ID:PmCQRqdR
でも、アノテーションコーパスは、人手でやるしかないんでしょ。
235デフォルトの名無しさん
垢版 |
2014/11/24(月) 03:15:43.74ID:wqHflsYn
無意味なコピペするやつやめてくんない?
2014/11/24(月) 11:35:30.53ID:rXGvP499
>>228とかホント迷惑だよね。お前の意見はないの?という。
237デフォルトの名無しさん
垢版 |
2014/11/24(月) 23:07:25.90ID:PS8Utgm4
>>124
>作業者の多くは人文系の日雇いもしくは時間単価で働くパート労働者であり,

43歳ニートの俺でも雇ってくれるかな・・・
238デフォルトの名無しさん
垢版 |
2014/11/25(火) 09:26:09.87ID:aL15dD2y
数学では,ある問題を解くために,その問題を別の問題に翻訳して,もとの問題ではなく
て翻訳された問題の方を解く,という方法がとられることがよくあります.A という問
題を解くために,B という問題が解ければ,その解から A の解も得られることが判って
いるような問題 B をうまく設定して,A を解くかわりに B を解くのです.このような
問題 B を見つけることを,「問題 A を問題 B に帰着させる」と表現します.B は以下の
例でのように単に A の言い替えにすぎない場合もありますが,面白いことには,B は A
よりむしろ難しい問題になっていることも多いのです.これは,問題がやさしいか難しい
かは必ずしも問題が解きやすいかどうかということと一致しない,ということでしょう.
多くの場合,解きたい本来の問題 A を帰着させる先の問題 B は A よりずっと抽象的
な問題になっています.これは,前の節でも述べた,抽象的な設定の方が数学的には扱い
やすい,という現象の現われと言えるでしょう.
もとの問題 A が一般的な(必ずしも数学で扱えそうには見えないような)問題で,そ
れを数学的な問題 B に帰着させているときには,A の数学化(mathem atization)が B で
ある,というような言い方をすることもあります.
一般的な問題を数学的な問題に帰着させる,つまりこの一般的な問題の数学化を行う
例として「ケーニヒスベルクの橋の問題」という名前で知られている問題について考察し
てみることにしましょう.
http://kurt.scitec.kobe-u.ac.jp/~fuchino/chubu/method-math-WS06.pdf
239デフォルトの名無しさん
垢版 |
2014/11/25(火) 12:38:38.21ID:7PX75+Zb
無意味なコピペ迷惑だからやめてくんない?
2014/11/25(火) 12:48:45.94ID:jd8KQlKm
反応する馬鹿も消えろよww
241デフォルトの名無しさん
垢版 |
2014/11/25(火) 12:50:18.42ID:7PX75+Zb
叩かないと消えないでしょ
2014/11/25(火) 13:21:08.54ID:jd8KQlKm
tech:プログラム技術[重要削除]
http://qb5.2ch.net/test/read.cgi/saku2ch/1273146924/
243デフォルトの名無しさん
垢版 |
2014/11/25(火) 14:01:43.88ID:aL15dD2y
コーパス開発はオープンにした方がよい、という提言で、全てのやり取りを公開しましょう、
という話なのだが、オープンソースソフトウェア開発のようにソースコードから開発のやり取り
まで全てをオープンにできる場合もあるが、コーパス作成は元のテキストを書いた人がいるわけで、
全てをオープンにできないという性格がどうしてもつきまとう。もちろん再利用可能なテキスト
にアノテーションをすればいいし、テキストを作るところからオープンにもできるわけだが、
それで見えなくなってしまう言語現象も少なくないと思われるし(実際講演の中でも「少数の
事例をどうするか」という問題提起があった)、個人的にはセミクローズド(特定のグループ内で共有)
程度が現実的なところではないかと思う。
それより大事だと思われるのは、そういったコーパス開発に参加する、あるいは門前の小僧状態で聞
くだけでも人が育つことであって、結局ここがボトルネックになり、特定の研究室の出身者しかノウハウがない、
という状況になっているのだと思う。特に個人的にポイントだと思っているのは、先日も書いたような新人
に対して優しいコミュニティになっているかどうかで、自然言語処理自体はかなり新人が入りやすい
コミュニティだと思うのだが、ことコーパスや辞書のようなリソース作成系はかなりハードルが高いと感じる。
コーパス分析やそれを用いた自動解析に関しても、簡単にできるところはすでにやり尽くされていて、
残っているのは難しいところばかりで、簡単なところから練習してウォーミングアップし、
助走期間を設けて本丸に突撃する、というようになっていないのである。もちろん最先端を走る研究者
たちで議論するのはもっとも難しい事例でよいし、むしろそうでないと意味がないのだが、簡単な事例
から始める(あるいは既存のものの分析からではなく、新しいタグ付与にメンターつきで最初から関わる)、
というトレーニングもあってよいと思う。
http://d.hatena.ne.jp/mamoruk/20140902/p1
2014/11/25(火) 14:04:53.12ID:jd8KQlKm
コピペうぜぇ。

誰か削除願い出せや。
245デフォルトの名無しさん
垢版 |
2014/11/25(火) 14:29:27.54ID:aL15dD2y
コーパス作成について一からやり直したほうがいいかどうかは、悩ましい問題なので一概にどうだ
ということは言いにくいのですが、アノテーション・コーパス作成自体が大きな研究テーマであり、
ベストプラクティス的なものもなければ、少しだけ蓄積されているノウハウ的なものすらチーム
レベルでしか共有できていない(共有するのが難しい)、という状況です。また、やり直したら
すぐコーパスができるかというと、質の高いコーパスを作るには時間が何年もかかるものなので
(自分の携わった NAIST テキストコーパスは5年以上かかっています)、すぐ利用可能にはならないでしょう。
http://d.hatena.ne.jp/mamoruk/20140902/p1
2014/11/26(水) 10:03:34.88ID:NpjnEUfO
国や自治体は、地球儀で表現できる。物体・流体とその運動は、シミュレーターで表現できる。
人物とその行動はオブジェクトで表現できる。けれども「民主主義」とかの抽象概念は表現できず、
せいぜい共起関係を調べるのみ。例えば朝鮮民主主義人民共和国だって「民主主義」ということで、
北朝鮮=民主主義国家なんて理屈も成り立つ。しかしこれは一般的なイメージとはかけ離れている。
従って抽象概念を一般的なイメージに帰着させるためには、いくつかの具体物を結びつけるしかない。

「世間」とは何か
http://www.pat.hi-ho.ne.jp/nobu-nisi/kokugo/seken.htm

「世間」とは・・・近所のおばさん、警察、新聞、学校、勤め先の会社、知り合い・・・・
247デフォルトの名無しさん
垢版 |
2014/11/27(木) 17:46:09.92ID:+o9Dshrb
英語の論文読むのが苦痛でたまらない
はやく翻訳装置つくってくれ
248デフォルトの名無しさん
垢版 |
2014/11/28(金) 17:31:36.07ID:7V+kfZOs
対話の学習ってどうやるの?
2014/11/28(金) 21:08:06.67ID:utFPiG0+
第二に,3 次元オブジェクトの中には複数の物体から構成されるオブジェクトがある(たとえば,図 6 は「花」と「鉢」
から成る一つのオブジェクトである).今後,画像解析技術が進み,機械が複数の物体から構成されるオブジェクト
を一つ一つの物体に分解できたとしても,機械にとって,それが常識に基づいた構成であるか,常識から外れた
構成であるかを区別することは困難であると推測される.
http://minamigaki.cs.inf.shizuoka.ac.jp/work/2014/SCIS2014fujita.pdf
250デフォルトの名無しさん
垢版 |
2014/12/01(月) 17:26:06.50ID:7r1s3h7c
目障りなコピペ野郎が
251デフォルトの名無しさん
垢版 |
2014/12/02(火) 19:50:43.04ID:OPiibqqe
東ロボくん センター模試2014

英語………95
国語………69
世界史B… 52
日本史B… 44
数学TA… 40
数学UB… 55
物理………31

7科目合計…386/900

漢文は全問ノーマーク
世界史Bは2問ノーマーク
日本史Bは4問ノーマーク

数学じゃないんだから
分からない問題はランダムにマークしろよ…
252デフォルトの名無しさん
垢版 |
2014/12/02(火) 19:51:56.20ID:OPiibqqe
漢文・世界史B・日本史B
ノーマークの問題をすべてランダムにマークしてたら
49.6%の確率で14点以上アップ

つまり49.6%の確率で7科目合計が400点に届いたことになる
253デフォルトの名無しさん
垢版 |
2014/12/02(火) 19:53:47.76ID:OPiibqqe
東ロボくん 英語 センター模試2014

発音・アクセント問題…パーフェクト(配点14)

未知語-語意推測問題…パーフェクト(配点8)

グラフ・図表問題…得点率75%(配点20)

語句整序完成問題…得点率67%(配点12)

意見要旨把握問題…得点率67%(配点18)

文法・語法・語彙問題…得点率60%(配点20)

会話文完成問題…得点率33%(配点12)

文脈に合わない文-指摘問題…得点率33%(配点15)

実用文書読解問題…得点率33%(配点15)

読解問題(論説文)…得点率33%(配点36)

読解問題(情報理解)…全滅(配点30)
254デフォルトの名無しさん
垢版 |
2014/12/02(火) 19:54:56.87ID:OPiibqqe
東ロボくん 国語(現代文) センター模試2014

漢字…パーフェクト(配点10)

語句の意味…得点率67%(配点9)

評論読解…得点率50%(配点40)

小説読解…得点率32%(配点41)
255デフォルトの名無しさん
垢版 |
2014/12/02(火) 19:55:07.53ID:iCHrVmBA
東ロボくんの話しないでくれない?
2014/12/02(火) 21:51:00.22ID:E8W1d5Nr
>>255
お前実は、自分で長文コピペ貼っておいて、自作自演してる張本人だろ?
2014/12/03(水) 20:07:38.80ID:+0WWtRs0
>>253
未知語の推測問題、推測するまでもなく意味を知ってたんじゃないのこれ
258デフォルトの名無しさん
垢版 |
2014/12/03(水) 21:02:56.05ID:14+GtqTY
文章が入力されたら、隠れマルコフモデルがたくさん存在する集合に射影するようなことできないかなぁ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況