X



自然言語処理スレッド その4

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2014/06/03(火) 05:40:00.54ID:yefNLumx
前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
589デフォルトの名無しさん
垢版 |
2018/07/20(金) 17:35:58.98ID:GozXxEHN
>>588
×に帆人
〇日本人
2018/07/20(金) 17:40:15.50ID:GozXxEHN
あと、昔の越後の人は「し」と「す」の区別がつかなくて、
「伸びた“シ”と結んだ“シ”」というんで区別してた。
「お寿司」と「お獅子」とかな。
2018/07/20(金) 18:01:44.97ID:GozXxEHN
日本橋の『たいめいけん』の茂出木 心護さんが、
越後の出身者は「えちご」と「いちご」が発音上
区別できなくて、「ストロベリー」と云われて
馬鹿にされたという話を書いている。
592デフォルトの名無しさん
垢版 |
2018/07/20(金) 18:34:54.69ID:GozXxEHN
正しい日本語処理。

「やってみてくれ」
 ⇒金融機関が借入金を引き上げようとしているので、
なんか儲かりそうな話をでっち上げてくれ。
「やってくれ」
 ⇒「できません」とか言ったらぶっ殺すぞ。とにかく
儲けを出せ。
「上からの GO が出た」
 ⇒逃げ支度が済むまで引っ張れ。
「君には失望させられたよ」
 ⇒ぜんぶお前の責任だ。お前が尻拭いをしろ。おれらは
知らない。

そんなもんですよ。
2018/07/20(金) 18:57:49.52ID:TZxtxi0x
連投してる奴いろいろ書いてるけど
他人に対して何か伝える文章じゃないな
結局何が言いたいのかぼんやりしたまま
2018/07/20(金) 19:55:29.19ID:GozXxEHN
人工無脳が なんか言ってますよ。

ところで、「なさい」「ください」「いらっしゃい」とかは、
文法的にいうと、動詞の活用としては何形になるのかねぇ?
2018/07/20(金) 20:02:56.67ID:GozXxEHN
>>593
> 連投してる奴いろいろ書いてるけど
> 他人に対して何か伝える文章じゃないな
> 結局何が言いたいのかぼんやりしたまま

「 連投して(い)る奴(が)いろいろ(と)書いて(い)る[けど
(=「けれども」)]、他人に対して何か(を)伝え(「ようとしてい」?/
「られ」?)る文章[じゃ(=「では」の口語的に崩れた形)]ないな
結局、何が言いたいのか(が)ぼんやりしたまま(の)(何か)(だ)」 。

こんな屑な人口無脳を作った馬鹿は、どこの大学のどこの研究室の所属だ。
2018/07/20(金) 20:05:19.46ID:GozXxEHN
>>595
×人口無脳
〇人工無脳
こんな屑な IME を作ったのはマイクロソフトだ。
2018/07/20(金) 20:41:02.84ID:TZxtxi0x
>>595
馬鹿はお前だよ
自然な省略だろ

>>594
>かねぇ?
ってのは口語的に崩れた形だろうが
分かったらお前も人工無能な
2018/07/20(金) 20:53:07.41ID:GozXxEHN
>>597
> 自然な省略だろ
自然言語処理をやっているなら、何が自然なのかを説明してくれ。

>>かねぇ?
>ってのは口語的に崩れた形だろうが
そんな甘いツッコミを入れられてもサムいだけだ。
まぁ、ここのところ猛暑が続いているからご愛敬だけどな。
「動詞の活用としては何形になるのかねぇ?」
だったら、
「動詞の活用としては、何形になる(の)(でしょう)かねぇ?」
とツッコんでほしかった。「なる」は連体形だから、その後に何かが
省略していないと文が完結しないので、そのあとに「体言+コピュラ」が
省略されている、と推測するのが正解、くらいのツッコミが入ったら、
おれも素直に頭を下げられるんだが。

ついでながら、「ってのは」は「というのは」の、口語的に崩れた形だ。
2018/07/20(金) 20:58:35.72ID:GozXxEHN
>>597
> お前も人工無能な
文脈としては、
×人工無能
〇人工無脳
だと思うが。“も”っていうことは、お前は無能なんだな?
おれが人工無脳だったら、製作者はとっくにチューリング賞を
獲っとるわ。
600デフォルトの名無しさん
垢版 |
2018/07/20(金) 21:25:48.02ID:GozXxEHN
くそう。叱られちゃったい。
> ないな
「ない(体言:省略)(コピュラ:省略)な」
> ぼんやりした
「ぼんやり(と:省略)した」
が正解。
2018/07/20(金) 22:01:12.70ID:1ksMRsUr
しよはしよじゃないの?
2018/07/21(土) 06:57:48.94ID:HTyh/4m5
>>598
>そんな甘いツッコミ
お前が自分に甘いだけだろ
だから馬鹿なんだよ
2018/07/21(土) 07:37:00.82ID:c9/IgS/z
>>602
事実と意見は区別しないと、論文は通らないぞ?
604デフォルトの名無しさん
垢版 |
2018/07/22(日) 06:53:00.75ID:HlH3bx5P
>>そんな甘いツッコミ
> お前が自分に甘いだけだろ
> だから馬鹿なんだよ
せっかくだから自然言語処理に関係のある話をしておこう。
形容詞は暗黙の主語として話者を要求する。「>>602 は恥ずかしい奴だ」は
>>602 は自分を恥じている」を含意しない。「>>602 は(話者である)私を
して“恥ずかしい”と感じせしめる人物である」という意味を内包している。
また、「とりたて詞『が』は強調転置を起こす」ので、
「お前が自分に甘い」は「自分に甘いお前」を含意するが、たいていの奴は
自分に甘い。
「だから馬鹿なんだよ」は、「だから」と「馬鹿」のどちらに強意があるかが
字面からは読み取れない。前者だとすると、「馬鹿」という概念が
すでに所与のものとしてあり、前提から導出が可能だ、と主張している
ことになるが、後者では、「馬鹿」というのは文中にトピックとして
出てきたことになる。
2018/07/22(日) 07:05:30.26ID:HlH3bx5P
日本人動物学者「こいつは馬鹿だ!」
満州アカシカ「いかにも私は馬鹿です」
606デフォルトの名無しさん
垢版 |
2018/07/22(日) 09:01:24.76ID:HlH3bx5P
日本語には体言の省略が多い(ただし異論はある)。
ただ、「その、省略された対象が何か」を推定するのに、
シソーラスと「その名詞にはどういう性質(内包的な意味)が
付与されているか」というデータが必要になってくる。
仮に百科語を二万語として、それだけのシソーラスを
作るのは並大抵の労力ではない。
そうすると、なにか限定されたジャンル(医学とか、化学とか)を
扱うしかなくなってくるが、それだと一般性が乏しくなる。
中学・高校あたりの理科系分野とかに狙いをつけるのが
いいんだろうか。
素人向けの医学・薬学・栄養学的な知識、というのも
考えたんだけど、厳密な体系にならないんだよね。
2018/07/22(日) 12:40:16.29ID:HlH3bx5P
>>606
もうひとつ、述語の中心である動詞の場合、要求する
「文法的な格」がどのようなものであるか、が明らかであって、
しかも「かかる」相手がどういうカテゴリーにあるか、というのが
分らないと、体言に附属した助詞が省略された場合に、「述語から
要求される文法格」が何であるかを推定できないんですよね。
「彼、スパゲティ、食べた」が、「彼はスパゲティを食べた」なのか
「スパゲティが彼を食べた」なのかは決定不能なのね。
「コタツが葬儀屋を食べた」は無意味文になりそうだけど、
映画『バトルヒーター』(一九八九)という文脈があったら、
「意味がある」と判断されると思うんだけど。
2018/07/23(月) 08:38:44.41ID:8XnpjG9G
一時期「ら抜き」が問題になってたけど、
「可能」と「尊敬」を区別できるという
メリットがあるので、一概に否定はできないと
思っている。だったら「れる」を「ことが可能である」と
入力時に機械的に置き換える(あるいは変換候補として出す)
くらいの芸はできんのか、とは思う。
一行めの「なってた」も「なっていた」が候補に出ていいし、
「あっさりした」も「あっさりとした」が正のはず。
入力時にチェックするのは難しいにしても、
テキストデータをチェックするくらいは簡単なように
思われるんだけどね。
609デフォルトの名無しさん
垢版 |
2018/07/23(月) 12:57:40.81ID:8XnpjG9G
>>601
> しよはしよじゃないの?
そこんとこ kwsk
2018/07/27(金) 14:22:16.44ID:q3ebuKRa
本番過ぎちゃったので時期遅れですが

You might or more heard a two fishes.
611デフォルトの名無しさん
垢版 |
2018/07/27(金) 14:25:38.80ID:q3ebuKRa
>>610
ダメだ。暑気中りが治ってない。

×You might or more heard a two fishes.
〇You might or more heard today's a two fishes.

冬バージョン
You might or more heard today's some fishes.
2018/07/27(金) 20:23:15.22ID:dNDh2QHO
>>611
私は
You might think but today's hot fish
と習いました
2018/07/28(土) 23:43:24.97ID:HVxOC8gw
>>612
粋な先生だな。
じゃあ、「“ghoti”と書いて何と発音するか?」とか
習ったクチだな?
おれはすれっからしの自然言語処理屋なんで、
“Time flies like an arrow.”を
「時蠅は矢を好む。」とか「矢のように時を測れ。」とか
訳してしまうクチだ。
614デフォルトの名無しさん
垢版 |
2018/07/29(日) 00:46:36.29ID:TGkp0btZ
>>613
象は鼻が長い、で二、三時間話ができそうだな。
2018/07/29(日) 11:52:38.73ID:ecsh/nBS
>>614
どっかの国語学者は何十年とかそういう話をやってるので、
二三時間で片がつくならいつでもやるんだが(^_^;)。
ついでながら、>>613
「enough」の "gh"、「women」の "o"、「nation」の "ti" で
「フィッシュ(fish)」だそうだ。

電算業界では「jail(牢獄)」というテクニックがあるのだが、
「本当は『geol』」とか思ってしまうおれはへそまがりだ。
2018/07/29(日) 12:05:56.01ID:ecsh/nBS
「象は鼻が長い」は、「象は鼻が長いのです」を含意し、
準体助詞の「の」の役割を考えると、「象は鼻が長いのです」
は「象は鼻が長い(X)(です)」を含意すると看做せると
解釈可能である。
しかしながら、「長い」は「鼻」を修飾しているので、X は
「哺乳類」「生物」とかいったものであると解釈するのが
妥当であろう。したがって、とりたて詞「が」によって「鼻」が
強調されて転置が怒り、「長い」の連体修飾という役割が、
結果として文構成のなかで引き継がれた、と解釈すると、
構文解析によって自然な解釈であろうと私は主張するのだ。

できればツッコミをよろしく。
617デフォルトの名無しさん
垢版 |
2018/07/29(日) 12:34:29.98ID:2jsBPgao
ここは「は」の機能に焦点をあてて説明した方がいいんじゃないのかな。
2018/07/29(日) 14:10:34.39ID:ecsh/nBS
>>617
「は」「が」は「とりたて詞」であって、「主格の格助詞」では
ない、とかいう主張はなかなか通らないんだよね。
そうすると「主格の格助詞が存在しない」ということに
なってしまうから(個人的には、ないと思っている)。
で、「は」「が」がつくと、格助詞が消えるという現象が
あると思っている。「をは」「をが」「にが」って使わないだろう?
「には」はあるし、「へは」「へが」「からは」「からが」「までは」
「までが」等々はあるわけだから、「『は』『が』はとりたて詞であって、
格助詞ではない」というのは強調しておきたいところだ。
2018/07/29(日) 16:07:45.71ID:86TZxKJ6
言語学者とか要らなくなるね
620デフォルトの名無しさん
垢版 |
2018/07/29(日) 16:35:02.64ID:TGkp0btZ
文法の存在ってのは幻みたいなもんだと思うけど、言語にはよく分からんけど法則があることだけは確かなんだよなあ。
621デフォルトの名無しさん
垢版 |
2018/07/29(日) 16:59:44.89ID:jmfLAdWz
>よく分からんけど法則

結局なんでもそうだし
機械学習やDLに向いてる分野ってことかな

でも法則自体は判らんでも何故かうまくこなすっていうAIっぽいのが生まれるっていう展開
2018/07/29(日) 19:07:58.68ID:XATyMGvf
とりたて詞って副助詞のこと?
2018/07/29(日) 20:06:05.33ID:ecsh/nBS
>>622
おれらは自然言語屋なんで、むしろ「副助詞」の
定義がわからん。「ね」「さ」「よ」「な」「ぞ」
は、「強調助詞」と呼んでいる。「とりたて詞」は、
トピックであることを示すと同時に、語順の
転換が起きる。それを「強調転置」と呼んでいるので、
「用語の統一ができていない!」と叱られそうに思うが。
「だからね、そのあたりはさ、適当によ、塩梅してな、
欲しいぞ?」みたいなのは強調助詞、という話。
2018/07/30(月) 03:32:11.29ID:Rd2xs5Db
よくわからん。
このスレはプログラム板のスレなんだからコンピュータで自然言語処理するのに有用な話をしてほしい
ぶっちゃけ、MeCabにもKNPにも出てこない品詞の話をされても意味がない。
2018/07/30(月) 07:03:35.67ID:9nIH/p+f
end-to-endの時代なのにね

わざわざnmtに構文解析の結果をぶち込んでくるバカがいて
誰がやってんのかなと思ったら東大だった
2018/07/30(月) 08:31:39.90ID:ArBfASRB
>>624
>>560
若いのに痛ましいのう。
2018/07/30(月) 08:45:24.47ID:ArBfASRB
ぶっちゃけ形態素解析システムなんて自前で開発しても
たいした手間じゃないぞ? 方針が分かってりゃ
1人月くらいで書ける。
1)まず、形容詞を活用語尾で引っ掛けるルーチンを書く。
2)それを使って形容詞の辞書を作る。
3)それでコツを掴んだら、動詞で同じことをする。
4)受け身だとか尊敬だとか使役だとかの処理と、
各種の形態素の処理を書く。これは数が少ないので
大した手間じゃない。
5)残った奴は名詞句なので、助詞やらなんやらの処理を
考えつつ名詞の辞書を作る。
ただ、これをやると、「もうちょっと抽象化できんかな?」とか
考えてしまい、全部捨てて新しいシステムを書きたくなる。
ただ、ここまで来ると日本語の文法体系が頭に入っていて
必要な辞書はあらかた揃ってるから、勝負は早い。
2018/07/30(月) 09:02:59.59ID:ArBfASRB
形態素解析システムを自前で開発すると、いくつか副作用があって、
「モーニング娘。」とか「藤岡弘、」とか見ると
反射的にイラッとくるようになる。
2018/07/30(月) 09:05:49.92ID:ArBfASRB
あと、メモが手放せなくなる。
「さっぱりした」の「さっぱり」と、
「さっぱりわからん」の「さっぱり」は、
別の単語として辞書に登録したほうがいい、とか
その場でメモるからだ。
「さっぱりとした」は言うが、
「さっぱりとわからん」は普通言わない
(いう地方もあるかもしれんが)。
2018/07/30(月) 09:10:43.80ID:z4Mxuxkf
作ったことないでしょ
2018/07/30(月) 09:15:05.66ID:ArBfASRB
いい面での副作用としては、
「文語」「(正体の)口語」「俗語的な口語」の
区別に敏感になる。
「むくつけし」「猛(たけ)し」「かそけし」のような
e 音で終わる形容詞は、文語にはあるが現代語にはない
(「むくつけい」「たけい」「かそけい」はない)。
「し」ではなく i 音で終わる形容詞は、俗語では使うが
正体では使わない。「みみっちい」「ばばっちい」などが
あり、「ずるっちい」を使う人はいる。
文語動詞では「子音終わりは四段」「母音終わりは一段」が
基本。ただし、母音は i, e しかない。
ところが、現代語では五段活用ワ行があり、a/o/u という
母音で終わっているのに五段活用、というややこしい話に
なっている。これは動詞末尾の h 音が消失しまったせいだが、
h 音の前が i/e である動詞は行き場がなくなって、けっこうな
騒動になっていることが形態素解析で判る。
2018/07/30(月) 09:22:41.82ID:ArBfASRB
あるよ。新旧とりまぜて三つほどある。
1)C 言語ベタ書きバージョン、
2)C 言語文法分離バージョン、
3)Java で書き直してメモリリークや
ワイルドポインタを防止したバージョン。ただし、
Java の使い方が当時は よくわからなかったので、
多段解析を実装できなかったのが悔やまれる。
(2)のバージョンは、ローマ字英単語交じりの
文字列を漢字かな交じり文に変換する、というのも
可能だった。
あと、(2)と(3)は双方向のシステムで、
漢字かな交じり文の読みびらきと、かな漢字変換の
両方が同じシステムで可能だった。
2018/07/30(月) 09:28:45.10ID:ArBfASRB
あと、全件辞書引きは Google が使ってるダブル配列法じゃなくて、
その原形であるトリプル配列法を使ってる。
マルチバイト文字の場合、「辞書がコンパクトになる」という
ダブル配列法のメリットが生きなくて、トリプル配列のほうが
コンパクトになったりする。
まぁ、昨今のマシンは作業用のメモリがギガバイト単位なんで、
それほど気にする必要はないんだが。
ほかになんか質問ある?
2018/07/30(月) 09:35:40.86ID:ArBfASRB
ところで質問なんだけど、
MeCabとかKNPとかって、文語とか解析できるの?
文法って、どんな形で持ってるの?
品詞分類とか変えられるの?
635デフォルトの名無しさん
垢版 |
2018/07/30(月) 12:28:22.50ID:fs6nfZiK
あ、古い人なんだ
636デフォルトの名無しさん
垢版 |
2018/07/30(月) 12:34:35.75ID:fs6nfZiK
JAI-Parserとかかな
2018/07/30(月) 12:41:04.42ID:ArBfASRB
>>635
つーか、JUMAN と ほぼ同時期に開発したシステムだから、
茶筅とか MeCab とかは、はなから使ったことがないのよ。
unix 環境なんて、手近になかったからね。初代は PC-98 とかで
動かしてたらしい。
当初、辞書をフロッピーディスクに置いといたら、やたら
カッチャンカッチャンとアクセスするので、「ドライブが
壊れるかと思った」てな話を聞いた。で、その後「RAM
ドライブ」っちゅーのが出て、384 Kb くらいの「マシンから
見るとドライブだけど、じつはメモリ空間」っつーのができて、
そのあたりの心配はなくなった。
で、その後 IBM-PC 互換機ができてメモリ空間が広がったんで
普通に実メモリ空間に置いて、アスキーの出版技術部の
TEX のチームの前でデモしたら、「それで?」と言われたそうだ。
あんまり処理が速かったんで、ただファイルを出力してただけだと
思われていた、というオチがついている。
2018/07/30(月) 12:41:58.32ID:ArBfASRB
>>636
なんで知ってんだ?
639デフォルトの名無しさん
垢版 |
2018/07/30(月) 12:42:57.61ID:fs6nfZiK
文体と興味が特徴的すぎる
2018/07/30(月) 12:49:03.23ID:ArBfASRB
>>639
そっちか。rStone とか『bit』とかを知ってる
古い世代かと思った。
641デフォルトの名無しさん
垢版 |
2018/07/30(月) 18:23:05.86ID:fs6nfZiK
たまごとかの世代ですが何か?
642Mr.Moto
垢版 |
2018/07/30(月) 19:38:47.79ID:ArBfASRB
>>641
じゃあ、Wnn(「私の名前は中野です」) あたりは知ってるんだ。
おれらは VJE-Pen(VJE-β)とか「ことえり」とか Wnn とか
よりちょっと遅れた時代だ。rStone-JE は、JAI-Perser の、
>>632 の(1)を実装してる。
(2)は、自動ルビ振り/自動点訳システム「紅玉(Ruby)」に実装
したんだが、まつもとゆきひろさんの「Ruby」が流行っちゃったので
あんまり有名にならなかった。
643Mr.Moto
垢版 |
2018/07/30(月) 21:22:57.38ID:ArBfASRB
たいへん・またせて・ごめんなさい
644Mr.Moto
垢版 |
2018/07/30(月) 21:25:45.64ID:ArBfASRB
「くるまでまつ」
「はくさいやだいこんなどのやさいが」
「やまのうえにはながさきました」

懐かしいのぅ。
645Mr.Moto
垢版 |
2018/07/30(月) 21:29:31.72ID:ArBfASRB
今は、
「長く庄内平野を転々としながらも私は肘折の渓谷に分け入るまで
月山がなぜ月の山と云われるのかを知りませんでした」
を、一発で構文解析できるシステムをインプリメントしようと
思案中。
646Mr.Moto
垢版 |
2018/08/02(木) 17:06:15.29ID:qDXNPl4s
スレが止まってるのが気にくわんなぁ。
せっかくの夏休みなのに、
喧嘩売ってくるとか、
質問してくるとか、
なんかスレを伸ばすような話題はないのか?
自然言語処理をやってる研究室は何をやっとるんだ?
2018/08/03(金) 10:26:42.91ID:G5/K3zuO
昔のソースを発掘したのはいいが、
なにせ量が多すぎて頭を抱えている。
辞書管理とかとツールが多いんだよなぁ ……
やっぱり日本語処理システムの開発は、
ある程度頭数が揃ってないとしんどいわ。
648デフォルトの名無しさん
垢版 |
2018/08/03(金) 12:24:06.18ID:zviFVEVF
githubで公開すれば?
2018/08/03(金) 15:27:48.96ID:G5/K3zuO
>>648
昔のソースなんで、恥ずいからやだ。
だいたい、Tomcat 上で SubVirsion 使ってソースは公開してたのに、
ずっと無視されてたから知ったこっちゃない。
2018/08/03(金) 21:12:14.93ID:7Jwc2PzI
自分から閉ざしちゃいかん
651Mr.Moto
垢版 |
2018/08/04(土) 09:55:56.28ID:Ply8bxep
>>650
わかった。努力する。
652Mr.Moto
垢版 |
2018/08/06(月) 06:44:57.20ID:C/D04uYr
スキーマと辞書の扱いを、どうすりゃいいのかな?
A)田中は台所でカップ焼きそばを作っている。
B)田中は工場でカップ焼きそばを作っている。
があって、
C)田中は栃木でカップ焼きそばを作っている。
は、どう解釈するか、っちゅーのが問題なんだが。
653Mr.Moto
垢版 |
2018/08/06(月) 13:59:40.47ID:C/D04uYr
漢字二字熟語で置きかえるというのはひとつの手段ではあるのだが、
A)田中は台所でカップ焼きそばを作っている。
→田中は台所でカップ焼きそばを調理している。
B)田中は工場でカップ焼きそばを作っている。
→製造している/開発している。
くらいはOKとして、
「子供を作っている」とか「家庭を作っている」とか
いうのは、なかなか説明しづらいものがあるように思う。
2018/08/07(火) 09:52:26.98ID:kx2eUWnl
昔ながらの方法だな
いずれ収拾がつかなくなるだろう
2018/08/07(火) 12:45:26.68ID:DcjP7j/S
>>654
昨今は どんなのが流行りなんだ?
多世界解釈とか言われても困るぞ?
656Mr.Moto
垢版 |
2018/08/07(火) 19:12:08.68ID:DcjP7j/S
かなり昔の話だが、
『ぼんさんがへをこいた』というパソコンの
ソフトがあった。

今日、近所のローソンへ行ったら、なんかしら
レジのところに『おいしいおでんのつくり方』という
のが置いてあって、「これって書籍ですか? それとも
店内のマニュアルですか?」と訊いたら、「あ、これは
店内用のマニュアルです」という返答だった。

「おいしいおでんのつくり方」をコンピュータに説明できるか、
というのは、けっこうテーマになりそうに思う。
2018/08/07(火) 19:49:55.57ID:UzMr++cp
つまなさう
658Mr.Moto
垢版 |
2018/08/07(火) 20:07:35.64ID:DcjP7j/S
>>657
と、いうことは、おまえは「田楽芋」が「おでん」になった経緯を
説明できる自然言語インターフェースを備えた知識ベースシステムを
すでに実装して運用してるということだな?
2018/08/08(水) 08:24:21.25ID:P8peofBj
知識ベースに疑問を持てよ
660Mr.Moto
垢版 |
2018/08/08(水) 13:13:47.75ID:l+OzLrq9
>>659
知識ベース=プロダクション・システムという
昨今の決めつけには疑問を持ってる。
とはいえ、様相論理とかフレーム理論とか、
そのあたりを取り込みゃあうまくいくかというと、
そうでもなさそうな気はする。
なんか、そこいらを統合するコンセプトが
ありそうな気はするんだが、おれには今のところ
思いつかない。
2018/08/08(水) 20:15:37.89ID:DgDhxyY4
正直でよろしい
662Mr.Moto
垢版 |
2018/08/08(水) 21:46:41.52ID:l+OzLrq9
>>661
おまいも上から目線でコメすだけじゃなくて、
なんか具体的な意見出せや
663デフォルトの名無しさん
垢版 |
2018/08/09(木) 12:51:14.04ID:a88nmHyC
このスレさあ、最近俺とお前しか書き込んでないよ
664デフォルトの名無しさん
垢版 |
2018/08/09(木) 12:56:18.84ID:NXkdt6vr
ごみん
665Mr.Moto
垢版 |
2018/08/09(木) 22:08:36.40ID:RMQfHlDH
形態素解析って、流行ってねぇんだなぁ ……
真面目にやると面白いんだけどな。
666Mr.Moto
垢版 |
2018/08/09(木) 22:15:20.21ID:RMQfHlDH
そういやぁ「三階」を「さんがい」って言う奴はいるけど、
「三回」は「さんかい」なんだよな。
そういうのって自然言語処理の世界で真面目に研究してる
奴っておるんかな?
AI も方言でインタフェースが成立すりゃあ可愛げがあるのに。
667デフォルトの名無しさん
垢版 |
2018/08/10(金) 10:58:25.21ID:x87YEa9j
>>666
言語学ではそういう感じの論文はよくあるよね。
668Mr.Moto
垢版 |
2018/08/10(金) 15:24:14.22ID:a1LHeoak
>>667
あるのか!
繰返しになるが、人間って、文法というものを所与のものとして
受入れているので、「形態素解析でイレギュラーなものを拾う」
っていうのは、けっこう困難なんだよ。
だけど、メジャーな形態素解析システムって、そういうのを
スクリーニングするようにできてないので、インターネット
のおかげで言語データが大量にあるのに、そういう例外を
掬うのって、なかなか手段がないんだよ。
昨今のパーソナルコンピュータは、そういうのに使えるだけの
性能を持ってるのに、研究者がそういうツールを使いこなせない、
っていうのは(研究者に対して言ってんじゃなく、サポートする
体制のほうに言ってんだが)イカンと思う。
2018/08/10(金) 15:41:04.46ID:XouIcNJM
最近の研究に触れてないの?
670Maria
垢版 |
2018/08/10(金) 15:54:03.82ID:a1LHeoak
>>669
研究者が、あらかた、意味論とかそっちの方に逃げちゃってるので、
記述文法とかの話になると、誰も相手をしてくれないんだよねー。
昔は大修館の『言語』の『言語空間』で、国広哲弥先生とガチのバトルとか
してたんだけどねー。
「相撲好き」っていうのかなぁ? がっぷり四つに組んで、「おまえの
底力を見せてみろ!」みたいなヒトって、最近は見ないでしょう?
671デフォルトの名無しさん
垢版 |
2018/08/11(土) 20:51:29.75ID:lNetj8kV
ところでだ。「チンボがシコシコする」という日本語表現は、文法的に正しいのか?

チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。

オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。

違うか?

「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!>>98
2018/08/11(土) 21:00:32.98ID:vW2Ha+vq
>>671
チンボがシクシクする

なら、ありだと思います
673Mr.Moto
垢版 |
2018/08/11(土) 21:23:15.94ID:Rp7CVdHg
>>671
それは運用論の話だな。たしか
城生 佰太郎『言語学は科学である ―「象ガ国会デ宿題ヲ忘レル」
不思議への招待』で「なぜ『元祖ゴキブリラーメン』がないのか?」
みたいな話で論考してたと思う。
674Maria
垢版 |
2018/08/11(土) 21:31:55.39ID:Rp7CVdHg
>>671
あんた、どっかの大学の自然言語処理系の研究室から、鉄砲玉として
送り込まれてきたんだろうけどさぁ、命(タマ)ぁ獲れなかったら、
どういう目に遭うか、覚悟はできてるんだよね?
逃げるんじゃないわよぉ? ほら、こっちはいくらでも
相手になろうって言ってるのよ?
2018/08/11(土) 21:38:52.01ID:vW2Ha+vq
>>674
戯言はいいから、はやく!
676Maria
垢版 |
2018/08/11(土) 22:01:16.57ID:Rp7CVdHg
>>675
だから、質問しなさいって言ってるのよ。
仁義切って、啖呵切って、勝負はそれからでしょう?
「お控えなすって」
「早速のお控え、ありがとうござんす。手前、生国は …」
から始めるのが仁義でしょう?
せめて、どんな研究してて、どういう分野に興味があって、
どういう点に疑問やら反論やらがあるのか、
はっきりしなさいよ!
どこの所属とかは訊かないけどさ、
「この分野だったらおれのほうが上だ!
白黒つけてやるから勝負しろ!」くらいの
勢いでかかってきなさいよ。
2018/08/11(土) 22:02:45.90ID:8JECWN+f
「シコシコ」は対象と他の物体の摩擦を表す擬音。
「ズキズキ」は対象が発してる状態の擬音。
よって対象そのものについて述べるのに
外部要因がある「シコシコ」を使うのは適切じゃない。





つまり50文字で纏めると

全く自然言語処理をやってないプログラマですが
いつも楽しく拝見しています
ところでスレチじゃないですかね

となる
678Maria
垢版 |
2018/08/11(土) 22:28:42.02ID:Rp7CVdHg
>>677
あー、こういう方がいらっしゃって下さると、
ありがたいわー。

「背中がヒリヒリする」とか「喉がイガイガする」とかは、
内部なのか外部なのかが判然としないけど、「シコシコ」は
内部化がしにくい、っていうコトですよね?
とはいえ、肩凝りなんかだと、「僧帽筋と菱形筋と最長筋が
“シコシコ”してるんですよ」とかいう表現は、運用上は“あり”だと
思うわけです。

となると、これは自然言語処理というよりも、意味論のほうの
話になると思うんですよ。

「できる」の命令形「できろ」は、文法上は禁止されていませんが、
運用上は「それ、無理でしょ?」っていう話になってしまいます。
それと同じことだと思うんですよ。
679デフォルトの名無しさん
垢版 |
2018/08/12(日) 02:28:21.41ID:/WZyCUyT
>>671
(´・ω・`)頭は自分の意思とは関係なくズキズキするから「が」
(´・ω・`)ちんぽは自分の意思でシコシコするから「を」
自分の意思かどうかで主語が変わる
2018/08/12(日) 02:58:57.41ID:jpwoxOLr
最近気になるのは、DVDが発売する、だな
2018/08/12(日) 09:56:42.76ID:ULAI4zx4
>>680
> 最近気になるのは、DVDが発売する、だな
それは「DVD が発売される」じゃなくってか?
たしかに「DVD が出る」みたいな表現はあるから
なんかしらの説明はあるのかもしれんけど。
強いていえば「DVD を発売する」の「DVD」が
強調されて「DVD “が” 発売する」になった、
あたりかな? そうでなければ「発売する」に
自発の意味がある、という解釈だな。
682Mr.Moto
垢版 |
2018/08/12(日) 10:29:17.36ID:ULAI4zx4
「おいしいおでんの作り方」と
「おでんをおいしく作る方法」は
意味がほぼ同じであるように見えるのに、
文構造がかなり違う (-_-!)
どこかに「食べる」が省略されているとでも
考えないといかんのか? 食べなかったら
「おいしい」というのが判断できないわけだから。
「(食べて)おいしいおでんの作り方」はともかく、
「おでんをおいしく作る方法」は、ちょっと
珍しい形の転置が起きた結果、文の構造が
見えにくくなっている感じがする。
「おいしく食べられるおでんが作れる方法」を
どうひねくったら「おでんをおいしく作る方法」に
なるのかがわからん。
683Mr.Moto
垢版 |
2018/08/12(日) 12:47:07.64ID:ULAI4zx4
>>682
ようやく解ってきた。
述語にかかる句には、
「文法格をもつ句」(主語とか目的語とか)と、
「修飾句」(「さっぱり」「あっさり」「粛々と」)と、
「相」(「夏に」「谷川岳で」)があるという分類が
立っているのだが、いわゆる「具格」は、文法格ではなくて
相であり、体言が述語にかかるときに「で」が附属するので
あって、「で」は「具格を表す格助詞」ではないっちゅー
コトなんだな?
文法格がないんで、述語に対する一意性もないわけで、
「〜で〜で」みたいなのもアリ(なかなか実例が
示せないんだが)なんだと思う。
「鶏は鍋でおろし醤油で食うのが好きだ」の場合、
「鍋」と「おろし醤油」が助詞「で」によって
述語「食う」に係っているわけで、これを
「鶏は鍋と おろし醤油で食うのが好きだ」とすると
語感がおかしくなる。そう考えると、
「方法」というのは、「場所」や「時刻」「季節」と
同じように、「相」であると考えたほうが、
動詞の型分けがすっきりしそうだ。
684デフォルトの名無しさん
垢版 |
2018/08/12(日) 17:57:06.47ID:PIG+WPz5
おいしいおでんの作り方=how to make おいしい おでん
「おいしい」は「おでん」に対する修飾語

おでんをおいしく作る方法=how to make おでん (to be) おいしい
「おいしい」は「おでん」に対する述語

「おいしく作る」は「穴を掘る」と同じように考えればよく
「食べる」が省略されているなどと考える必要はない。
685Mr.Moto
垢版 |
2018/08/12(日) 18:01:52.82ID:ULAI4zx4
>>684
よし、解った。
「鮟鱇は土鍋で出汁で煮る」はオッケーだが、「土鍋と出汁で煮る」は NG。
「鮟鱇は土鍋でかえしと出汁で煮る」もオッケー。
「鮟鱇は土鍋でかえしと出汁で強火で煮る」もオッケー。

つーことは、具格は文法格ではないから、なんかしら別の呼び名を
立てたほうがいい、っちゅーこっちゃね。するってぇと「具相」とかに
なるのかな。
686Mr.Moto
垢版 |
2018/08/12(日) 18:18:00.76ID:ULAI4zx4
>>684
> 「おいしい」は「おでん」に対する述語
なるほど。そこへ来たか。
確かに文語では形容詞は述語になる(終止形もある)
よなぁ。
うん。反論を考えてみる。
687Mr.Moto
垢版 |
2018/08/12(日) 18:35:32.47ID:ULAI4zx4
>>684
> おでんをおいしく作る方法=how to make おでん (to be) おいしい
うん。
ひょっとしたら、The way of make おいしい おでん
みたいな脳内変換が行なわれているかもしれない、という
可能性を考慮する必要はあるだろうな、と思っている。

強調転置は、とりたて詞「は」「が」を “常に” 伴うと、ずっと
思っていたので、「を」がそのまま使われて
強調転置が行なわれる、というケースを考えていなかった。
やっぱり、形態素解析 “だけ” を考えて自然言語処理を
行なおうとすると、どっかしらに無理がくるということか。
688Mr.Moto
垢版 |
2018/08/12(日) 18:41:17.81ID:ULAI4zx4
>>687
「The way of make」とか書いたらダメだな(^_^;)。
俗語・口語に慣れちゃってるんで、気づかなかった。
「The way of to make」とか「The way of how to make」
とか書かないと、英語教師には叱られそうだ。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。