自然言語処理スレッド その5
■ このスレッドは過去ログ倉庫に格納されています
0001Mr.Moto
垢版 |
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
0108所長
垢版 |
2018/09/20(木) 11:49:39.95ID:eE0U1qQD
>>106
担当部署が違うんだよ。
自然言語処理を真面目にやろうと思うと、
アルゴリズム開発(「形態素解析はチャート法でなんとかなるのは
分かったが、探索戦略は どんな感じで組んだらいいのか?」)とか、
実装(可変長文字列を扱うとすれば Java あたりが適当なんだろうけど
云々)とか、辞書管理(これは辞書的に持ったらいいのかアルゴリズム
のほうで持ったほうがいいのか)とか、文法記述担当(出現頻度が高くて
不規則なものと、規則で処理できるから辞書でカバーしてもらうのと、
歴史的な事情があるらしいから別扱いしたほうがいいらしいのとの
切り分けと、みたいな)とか、いろいろ分担があるわけ。
0109所長
垢版 |
2018/09/20(木) 12:06:24.31ID:eE0U1qQD
そういえば、このスレに集ってる真面目なメンバーに訊きたいんだが、
漢語の音便についての、公開されている使用料フリーのデータベースって、
どっかにあるんかいな。
で、あったとするなら、その表現形式って、どんなもの なのか。そのあたりの
情報が知りたいんだが。
たとえば、「説得」だったら「せっとく」なんだが、本来の音としては
「せつ-とく」だろ? それが音便の結果として「せっとく」に
なってるわけじゃないか。
だったら、「{{説|せっ}{得|とく}(せつ-とく)}」みたいなデータとして
表現されててくれないと、自然言語処理を行う上では不自由だろ?
そういうデータは、自由に使えないと困るじゃないか。
「{蒲公英|たんぽぽ}(タンポポ/たんぽぽ/{{蒲/ほ}{公/こう}{英/えい}})」
でもいいと思う。ただし、XML で書かれたりすると、こんどは国語学とかを
やってる人には理解できないし、わかるように表示すると、こんどはデータを
いじるのが面倒臭いんだよな。
だったら、「日本語処理と国語学の橋渡しをするような、共通言語としての
なんかしらの言語(表現形式)」っつーのは、あっていいんじゃねぇの?
0110Mr.Moto
垢版 |
2018/09/20(木) 12:17:35.52ID:eE0U1qQD
たぶん Zipf の法則とかに絡んでくると思うんだが、
言語表現っていうのは「擦り減る」んだ。
つまり、「しょっちゅう使ってると、不規則化する」
んだよ。つーことは、「これ(不規則な表現)は
データで処理して、これ(規則的な表現)はアルゴリズムで
処理する。ただし、歴史的な事情があって、『出現頻度は
低いのに、不規則な形で残っているものがある』」っつー
コトなんだ。
で、そういうことに関するデータは共有しとこうぜ、って話。
0111Maria
垢版 |
2018/09/20(木) 13:27:23.43ID:eE0U1qQD
>>109
> このスレに集ってる
「集ってる」が「あつまってる」なのか「つどってる」なのかが
気になる自分がイヤといえばイヤかも、と思うけど、
そこは適宜「どっちですか?」とシステムが配慮してくれる
(つーか、IME のレベルで情報持ってるんだから
勝手に棄てじゃねーよ、と思うけど)のが
正解っていうモンじゃないの?
0112Mb
垢版 |
2018/09/20(木) 13:39:24.31ID:eE0U1qQD
>>107
「ラッダイト運動」という機械破壊運動がかつて存在し、それは
「産業革命にともなう機械使用の普及により、失業のおそれを
感じた手工業者・労働者が起こした。産業革命に対する反動とも、
後年の労働運動の先駆ともされる。機械所有の資本家には
憎悪の対象であったが、詩人には創作の霊感を与えた。」そうだけど、
「コンピュータ技術の発展にともなうパーソナル・コンピュータの使用と
AI 技術の普及により、失業のおそれを感じた労働者が起こした。
自然言語処理技術に対する反動とも、反コンピュータ運動の一部ともされる。
コンピュータ技術者には憎悪の対象であったが、『プロレタリアートの権利の
庇護者』を自称する左派リベラル運動家には反政府運動としてのテロ行為の
正当化の口実を与えた。」みたいなことになるんかな?
こんなマイナーなスレを荒らしてるヒマがあったら、グーグルに対して
「Google Home の販売をすぐさま中止しろ!」とか言ってくりゃいいのに、
と思う。
0113Mb
垢版 |
2018/09/20(木) 13:50:14.92ID:eE0U1qQD
>>95
> 現在のところ確認されている『素数』はここまで。
より厳密にいうと、「現時点で、実際に記述され、しかも
『素数である』ことが検証されている素数として知られている
ものは、50番めのメルセンヌ素数。」だ。
もっと大きな素数は定義できる(「素数は無限個ある」のが
古代ギリシャの時代に証明されている)が、今のところ、わざわざ
具体的に求めることのメリットが(ほぼ)ないから放ったらかされてる
だけだと思う。
0114デフォルトの名無しさん
垢版 |
2018/09/20(木) 14:04:07.52ID:U5cihaS9
なんという見にくい文章なんだ…
専門板特有のアレな人がここに居着いてしまったか
0115デフォルトの名無しさん
垢版 |
2018/09/20(木) 14:22:48.35ID:eE0U1qQD
>>114
>>57 をよく読め。
つーか、「見にくい」は連体修飾句だから、
主語は きさまだ。
「荒らし」呼ばわりされたくなかったら、
まず読解力を磨いてから出直してこい。
言いたいことがあるなら、せめてアンカーを附けろ。
0116デフォルトの名無しさん
垢版 |
2018/09/20(木) 14:46:12.15ID:U5cihaS9
>>115
ファーwwwwww安価付けてないのに反応してて草草の草ァ!!!
やっぱ自覚あるんすねぇ(笑)
0117デフォルトの名無しさん
垢版 |
2018/09/20(木) 15:34:02.12ID:2HjKrs3D
>>35
>死んだ鳥は飛ばないが、鳥は鳥だ。

小便を出さないチンボは、チンボとしての機能を果たしていないから、それはチンボと呼ぶに値しない!
0118デフォルトの名無しさん
垢版 |
2018/09/20(木) 15:36:37.71ID:wcfmqma2
>>5
>所有者の意思とは無関係に、勃起して「シコシコする」

チンボは必ず勃起する存在で、勃起しないチンボは、チンボと呼ぶに値しない!
0119Mb
垢版 |
2018/09/20(木) 16:15:02.06ID:eE0U1qQD
念のために言っておこう。
このスレは、『自然言語処理スレッド』だ。
日本語の文章は、ほぼ餌だぞ?
どっかの研究機関で、「電子掲示板における
荒らしの自動検出について」みたいな論文に
取りあげられて、自分が書いた文章が晒されても
自業自得なんだぞ?
「自分を大切にしてくれ」と、お願いしておこう。
0120デフォルトの名無しさん
垢版 |
2018/09/20(木) 16:34:15.99ID:eE0U1qQD
>>116
> ファーwwwwww安価付けてないのに反応してて草草の草ァ!!!
> やっぱ自覚あるんすねぇ(笑)
「ファーwwwwww」
→ 自然言語処理というか、精神病理の分野の対象と思われる。
「安価付けてないのに反応してて草草の草ァ!!!」
→ 「安価」は、「アンカー」(「錨(anchor)」の意)
という語を規定している権威に対する異議申し立てと考えうるが、
「なんとなく」感があるので、知性を感じられない。
「草草の草ァ!!!」という、論理的な応答を拒絶した
態度から、やはり自然言語処理よりも、精神病理の分野の
分析対象と思われる。
「やっぱ自覚あるんすねぇ(笑)」
→ 私は社会人であり、都市文化に対して敬意を持っているので、
社会秩序を尊重している。したがって、その意味では「自覚がある」
という認識はあり、その点に関して恥じるところなはいので、
なんら問題はない。私は文脈(その「文脈」という言葉を正確に
定義することができない自分を恥じるところはあるのだが)から
察するに、>>116 は反社会性パーソナリティ障害者であるという
であることを強く疑う。
ただし、それもまた精神病理の分野の対象と思われるが、
「その言説から、精神病理学的な予備診断を行う」という
ことは、自然言語処理の ひとつの応用として、興味深いものが
ある。
0121Mb
垢版 |
2018/09/20(木) 16:38:10.29ID:eE0U1qQD
>>117 >>118
> チンボと呼ぶに値しない!
おまえの価値観なんぞは、
科学技術とはなんの関係もねーんだよヴォケ。
0122デフォルトの名無しさん
垢版 |
2018/09/20(木) 21:26:09.65ID:iJVr7ybn
>>95
50番目のメルセンヌ素数より小さい素数がすべて求められているわけではないので…
というか、素数を小さい順に列挙しているサイトはありませんか?
0123デフォルトの名無しさん
垢版 |
2018/09/20(木) 21:57:04.42ID:PEguqjAD
>>98
>幾何も整数も、中間言語さえ充実させれば、後は『 Mathematica』で楽勝

Mathematica 7では,数列生成,変換,数列認識を含めた新しいレベルの系統だっ
た整数列解析を導入している.Wolfram Researchにおける最近のアルゴリズム的躍進によって,
数列要素のリストを取ってそれらに対して大きなクラスの閉形 Mathematica 式を系統的に求めることが初め
て可能になった.これで強固な整数列の認識が実験数学におけるプログラム的な発見のルーチン部分となった.
https://www.wolfram.com/mathematica/newin7/content/IntegerSequenceAnalysis/index.ja.html?footer=lang
0125デフォルトの名無しさん
垢版 |
2018/09/21(金) 01:30:25.71ID:TFbNiTND
>>124
>素数を小さい順に列挙するプログラム

そのままをインプットすればいいだけでは?
0126デフォルトの名無しさん
垢版 |
2018/09/21(金) 04:44:27.86ID:TFbNiTND
 物理においては、大学では数学の微分積分を駆使して問題を解くのが一般的だが、
高校では微分積分を使った解法は用いない。他の教科においても、大学と高校では教育内容がかけ離れてい
ることが多く、大学教員が無理に高校生に合わせて試験問題を作るためにミスが起きやすいとの指摘もある。
https://s.kyoto-np.jp/politics/article/20180201000207

高校履修範囲に合わせて入試問題を作成するのも苦労するのだと。
0127デフォルトの名無しさん
垢版 |
2018/09/21(金) 04:46:57.18ID:TFbNiTND
>>121
でも飛ばない飛行機は飛行機とは呼べないだろう? 燃えていない炎なんて有り得んだろう?
0128デフォルトの名無しさん
垢版 |
2018/09/21(金) 07:09:25.14ID:TFbNiTND
>>104
>このフロントエンドが英語または日本語の曖昧性を排除するように、

自然言語の解釈は、完璧なものには出来ない。中間言語は必ずしも完璧である必要は無い。

も しも下記の解説を本気で書いたならば「独りよがりな日本語の解釈を押し付ける所は,さすがだ!」
となります。いくらなんでも本気ではないと思いますが,出 題 を正当化するために書いたのならば
「苦しさは分かりますが,こんな論理で納得する訳がない!」が私の考えです。したがって,私の結論は,
この問題は大学の検証結果と異なり,「与えられた選択肢の中に正解がない。」となります。
また,入試問題においては,問題文がすべてであり,作者の意図を忖度することは不要です。
問題文が2通りに解釈できて,解釈により結論が異なれば,出題ミスであるとするのが常識です。
したがって,大阪大学が大学の解説のような意図で出題したとしても,問1は出題ミスであると断言できることになります。
http://www.geocities.jp/midarekazu/oosaka.html

>>13
> y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルづつ速度が上がる』

www
0129デフォルトの名無しさん
垢版 |
2018/09/21(金) 07:19:37.61ID:TFbNiTND
>>123
>強固な整数列の認識

『整数』『素数』『自然数』が問題文に与えられたら、その全てを列挙してしまうくらいでいい。
0130デフォルトの名無しさん
垢版 |
2018/09/21(金) 07:29:53.25ID:TFbNiTND
自然言語処理で今のところ最も困難極まりないのは、『中間言語の生成』であろう。

>「独りよがりな日本語の解釈を押し付ける所は,さすがだ!」

自然言語で書かれている文章をどう解釈するか、人間にだってわからない出題もされているくらいだから。
0131Mb
垢版 |
2018/09/21(金) 07:52:18.54ID:r2s4zPem
スレ違いだが、エラトステネスの篩とか使って
地道に計算するが吉。
0132Mr.Moto
垢版 |
2018/09/21(金) 08:30:50.58ID:r2s4zPem
>>127
> でも飛ばない飛行機は飛行機とは呼べないだろう?
試作機は飛ばしてみないと飛ぶか飛ばないかがわからんけど
いちおう「飛行機」の範疇に入るのが困ったところ。
少なくとも
・今現在飛んでいる
・過去に飛んだことがあり、着陸してここにある
・飛ばそうと思ったら、たぶんまた飛ぶだろう
あたりのものが「飛行機」で、墜落した飛行機の残骸は、
「かつて飛行機であったもの」であって、“飛行機”ではない、
という推論は間違っていないと思う。
> 燃えていない炎なんて有り得んだろう?
太陽のプロミネンスは燃焼してないけど、いちおう「炎」。
「炎のない燃焼」としては白金触媒によるベンジンの燃焼
(ハクキンカイロ)がある。

「物理的現実と言語表現との関係」はひとまず横に置いて、
「人間の内的な概念と言語表現との関係」について考える
のが、効率のよいアプローチだと思っている。
すなわち、「人工のキチガイを作っておいて、それを改造・
教育・治療することで、マトモな人間に近づける」という
アプローチ。
0133Mr.Moto
垢版 |
2018/09/21(金) 09:37:05.84ID:r2s4zPem
>>129
> 『整数』『素数』『自然数』が問題文に与えられたら、
> その全てを列挙してしまうくらいでいい。
現在のコンピュータの性能を考慮すると、それで
あらかたうまくいってボロが出ないだろうとは思うんだが、
筋を通すんだったら、「1は自然数」「自然数+自然数は
自然数」ってところから自然数の諸性質を証明して、
0 とマイナスの自然数から整数を定義して …… みたいな
形で持ってゆきたいな。
「1はなぜ素数ではないのか?」とか「0はなぜ自然数では
ないのか?」とかみたいな質問が出てきたときに、コンピュータが
どれだけ丁寧に答えられるか、というところに興味があるし、
それぞれ別のアプローチで初等整数論を教えたコンピュータを
相互学習(必ずしも自然言語を経由させなくてもいい)させたら
何が起きるか?とかは、かなり興味深い。
0134デフォルトの名無しさん
垢版 |
2018/09/21(金) 10:42:10.68ID:NW3l5rZR
>>132
>太陽のプロミネンスは燃焼してないけど、

太陽は燃えている
Love Me With All Of Your Heart/Engelbert Humperdinck
https://m.youtube.com/watch?v=tjTCD-_ItHs
0135デフォルトの名無しさん
垢版 |
2018/09/21(金) 12:18:18.34ID:r2s4zPem
よく考えたら、日本語処理(当然のことながら、
自然言語処理の一部だ)技術者というのは、
単に社会的に冷遇されているだけではなく、
法的にも保護されていない。
このあたりの話は、広く世の中に伝えておいたほうが、
いいような気がする。
とはいえ、このあたりの話は『プログラム技術板』ではなく、
『プログラマ板(マ板)』で議論するのが筋だと思うので、
そっちの方に「日本語処理技術者の憂鬱」みたいな
スレを立てるというのはどうだろうか。
0138デフォルトの名無しさん
垢版 |
2018/09/21(金) 21:18:12.58ID:r2s4zPem
>>137
句読点が普及したのは、たぶん江戸後期あたりからだと
思うんだが、あんたは鎌倉・室町時代あたりの生まれなんだな?
あんたのおじいちゃんの時代に句読点があったというのを
文献・史料で示してくれるとありがたい。
あんたのおじいちゃんの時代だとすると、
『大鏡』あたりの平安時代とか、そういう頃
の生まれなんだよな?
花山天皇とか、安倍晴明とか、いろいろ聞きたい
ことがあるんで、ぜひ質問に答えてくれ。頼む m(_ _)m
0139デフォルトの名無しさん
垢版 |
2018/09/21(金) 21:30:46.68ID:qgyq16h9
気に障ったならもうしわけない
句読点が多いと読みづらいとだけ伝えておこう

読みやすさを犠牲にしてまで句読点を打とうと言うのは何かしら理由があるんだろうけど
0140デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:12:05.82ID:I+GiteTA
>>139
句読点を使ってやたら長々とぶつ切りで書かれた下手な文章は、俺も読みにくいと思う。

それとは別に、ネットとかで句読点を使わないのが普通だみたいな風潮があるけど、それには賛同できないな。
特にスマホで見てると横幅が狭いから、文末の改行がちょうど画面端に来て次の行との区切りが判別できないこともあるし。
0141デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:19:58.59ID:r2s4zPem
>>139
> 読みやすさを犠牲にしてまで句読点を打とうと言うのは
> 何かしら理由があるんだろうけど
つーか、“読みやすさ” を重視した結果が、句点・読点とか
括弧とか感嘆符とか疑問符なんだが。
で、文章の構造(解析木)を明示的に示すために括弧を使うと
うざったらしい(←これは方言かもしれん)ので、「読点( ‘、’ )」
というものが使われたという経緯があるのだ。
大類 雅敏『そこに句読点を打て!』(一九七六)という本も
あるのだぞ?
0142Mr.Moto
垢版 |
2018/09/21(金) 22:31:54.14ID:r2s4zPem
>>140
いや、言うたらなんやけど、句点はともかくも(改行でなんとかなる)、
読点や括弧は適切に入ってないと、“目が滑る” 感じがする。
『句読点を使ってやたら長々とぶつ切りで書かれた下手な文章は、
俺も読みにくいと思う。
それとは別に、ネットとかで句読点を使わないのが
普通だみたいな風潮があるけど、それには賛同できないな。
特にスマホで見てると横幅が狭いから、文末の改行が
ちょうど画面端に来て次の行との区切りが判別できない
こともあるし。』も、
『句読点を使って、やたら長々とぶつ切りで書かれた下手な文章は、
俺も読みにくいと思う。
それとは別に、ネットとかで「句読点を使わないのが
普通だ」みたいな風潮があるけど、それには賛同できないな。
特にスマホで見てると、横幅が狭いから、文末の改行が
ちょうど画面端に来て、次の行との区切りが判別できない
こともあるし。』くらいに切ったほうが読みやすいように
思うんだが、これは世代の差なのかな? それともスマホ
で読んでると、改行禁則とか いろいろ面倒臭い話があるんで
また別のルールがあるんかな?
おれは読みやすさに配慮して(和欧混植の文章とかもあるんで)
半角スペースを入れたりしてるんだが、そのあたりについての
意見も聞きたいと思う。
0143デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:42:24.73ID:qgyq16h9
>>141

>>133を読み返してほしい
駄文の典型例だと思う
、を使って長々とつづけた文が二つだけ
こんなに読みづらいレスはやめてほしい
0144デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:52:40.08ID:qgyq16h9
そうなると、「
それとは別に、

これらの読点は間違いなく不要
このスレを「と、」検索してみて思ったのは大体の と の後の読点はいらない
0145デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:18:19.78ID:I+GiteTA
>>142
世代の差でもスマホ固有の問題でもなく、あなた個人の感性とか資質、恐らく脳の働きの問題かと思うよ。

俺は自分の文章が上手いと思い上がるつもりはないが、新聞なり市販の書籍なりのまっとうな文章は、あなたの書いているぶつ切りの文章ではなく俺の文章の方がより近いはず。
そこまでぶつ切りに書かれてなくても、普通の人は頭の中で自然に無意識に構文解析して読み解けているよ。

>>106のコテハン使い分けは別人格設定なのという質問に別部署だからと回答していたけど、同一人物であることを否定しているということかな。
ここまで独特の感性で同じ特徴をもつ文章を書かれると、とても別人によるものとは思えない。

自然言語処理やってますとはいうけれど、どちらかと言えば不自然言語処理なのではないだろうか?
0146デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:36:16.24ID:tLJHZkGc
>>145
>ここまで独特の感性で同じ特徴をもつ文章を書かれると、とても別人によるものとは思えない。

ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか?

チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。

オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。

違うか?

「胸がドキドキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!
0147デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:43:15.25ID:tLJHZkGc
>>132
>「物理的現実と言語表現との関係」はひとまず横に置いて、
>「人間の内的な概念と言語表現との関係」について考える

前者はシミュレーション(>>30)を使えば何とかなるが、後者についてはどうていいのかわからない。
人間の内的な概念なんて自分でも何がなんだかわからない、それは『阿頼耶識』とも言われているくらい。
0148デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:49:43.70ID:tLJHZkGc
>>128
>入試問題においては,問題文がすべてであり,作者の意図を忖度することは不要です。

言葉に出ていない作者の意図を忖度するなんて、それでは『阿頼耶識』の研究が必要になってくるよな。
0149デフォルトの名無しさん
垢版 |
2018/09/22(土) 00:35:51.38ID:cF7bdgqK
>>141
読点の入れ方なら本多勝一「日本語の作文技術」も参考になる、いろいろと問題な人だが、これはわりあいにおもしろい
0150デフォルトの名無しさん
垢版 |
2018/09/22(土) 00:54:07.16ID:SEkCl5sl
『下手なセックスより上手なオナニー』

諺としてどうだろう?
0151デフォルトの名無しさん
垢版 |
2018/09/22(土) 01:35:42.88ID:45tQNfwq
団塊ジュニア世代なら、学生時代にスポーツに燃えた経験が有るだろう?

1 若い力と 感激に
  燃えよ若人 胸を張れ
  歓喜あふれる ユニホーム
  肩にひとひら 花が散る
  花も輝け 希望に満ちて
  競え青春 強きもの
http://takurou.co-site.jp/natumero/21-25/wakaitikara.html

しかしながら、

>歓喜あふれる ユニホーム

    ブ ル マ な ん て 恥 ず か し い !
0152デフォルトの名無しさん
垢版 |
2018/09/22(土) 01:43:30.38ID:45tQNfwq
世代によっても価値観が違う。かつてはスポーツに燃えるのが美徳であったが、
今では『ブルマなんて恥ずかしい!』。
0153デフォルトの名無しさん
垢版 |
2018/09/22(土) 01:51:24.31ID:45tQNfwq
>>92
>「ネイティブ英語とは何か」

何しろ世代によっても価値観が違うので、ネイティブ英語とやらも時代によって変わってくる。例えば、

>歓喜あふれる ユニホーム

1980年代団塊ジュニア世代のユニフォームを画像認識させても、現在の若者には通じない!
0154デフォルトの名無しさん
垢版 |
2018/09/22(土) 02:04:08.12ID:aTZDRDvn
>>150
1980年代のエロ漫画はセックスシーン、現在のエロ漫画はオナニーシーン。
0155デフォルトの名無しさん
垢版 |
2018/09/22(土) 02:12:18.33ID:L02/JuB3
>>146
>「胸がドキドキする」は良いが、「チンボがシコシコする」はダメな理由を、

「胸がドキドキする」恋愛表現はもはや時代遅れで、これからは新しい恋愛表現が開発されることだろう。
0157デフォルトの名無しさん
垢版 |
2018/09/22(土) 02:58:42.55ID:13EpgKaq
>>148
>それでは『阿頼耶識』の研究が必要になってくるよな

未来の俺が何を考え何をしているかは、俺にだってわからない。
0158デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:10:36.97ID:13EpgKaq
14 デフォルトの名無しさん 2014/06/14(土) 14:59:25.78 ID:C3RmOQgD
例えば、こんな問題はいかがでしょうか。
ちなみにこれは昨日、ラジオで聞いた問題です。
「300円もって買い物に行きました。そして、100円のお菓子と
40円のお菓子と60円のお菓子を買いました。
おつりはいくらでしょう?」
という問題です。

これを聞いて100円と答える時、その思考は以下のようなものではないでしょうか。
300ー(100+40+60)=100

間違っていませんね。
買ったお菓子の合計は200円なので、300?200は100としているわけです。

これを、図を使って場面をイメージしてみるのです。

このようにお金が図として描ければ見えてきませんか。

そうなんです。
これはいわゆるクイズなので、実は・・・「おつりなし」が答えなんです。
300円持っていって、200円のお菓子を買ったところで、
200円を出すわけですから、おつりはありませんよね。

ずるい!という声が聞こえそうですが、
でも、これを「いや、おつりはないでしょ!?」と答えられるかどうかって
文章問題がイメージできているかという大切なところであると思うのです。
問題文を与えられて、見た数字だけで演算決定をしてしまうから間違えるのです。

http://mhidetoshi.exblog.jp/22011978
0159デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:12:59.06ID:B/nnNqsD
>>158
>100円のお菓子と40円のお菓子と60円のお菓子を買いました。

100円のお菓子
40円のお菓子
60円のお菓子

それぞれいくつ買ったのかも不明なんだが?
0160デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:15:31.04ID:13EpgKaq
900 :デフォルトの名無しさん:2009/02/20(金) 20:46:21.00
「類似文検索システム」としては、名詞+助詞「の」+名詞+、のように文構造のパターンを網羅しておき、
目新しい文章が出た時に文構造パターン認知できるようにしておくとか。
例えば「身長の高い男が私の横を通り過ぎた」「髪の長い女が彼の手を握った」はいずれも、
名詞+助詞「の」+形容詞+名詞+助詞「が」+名詞+助詞「の」+名詞+助詞「を」+動詞。
0161デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:21:13.52ID:13EpgKaq
27 デフォルトの名無しさん 2014/06/19(木) 03:03:30.38 ID:xTtna/5L
「まわるまわるよ、時代は回る」
「 地球は回る、君を乗せて 」

上の二つの「回る」は、同じ意味ですか?
0162デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:23:20.31ID:13EpgKaq
29 デフォルトの名無しさん 2014/06/19(木) 11:47:01.23 ID:7DkBqMX+
>>28
>地球は回る

太陽の回りを公転して回っている、というのも有りだろ?
0163デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:25:27.18ID:13EpgKaq
>>159
デフォルトで「一つずつ」、更に言えば店屋が会計を間違える可能性とか、挙げたらキリが無くなる。
0164デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:28:21.69ID:13EpgKaq
246 デフォルトの名無しさん sage 2014/11/26(水) 10:03:34.88 ID:NpjnEUfO
国や自治体は、地球儀で表現できる。物体・流体とその運動は、シミュレーターで表現できる。
人物とその行動はオブジェクトで表現できる。けれども「民主主義」とかの抽象概念は表現できず、
せいぜい共起関係を調べるのみ。例えば朝鮮民主主義人民共和国だって「民主主義」ということで、
北朝鮮=民主主義国家なんて理屈も成り立つ。しかしこれは一般的なイメージとはかけ離れている。
従って抽象概念を一般的なイメージに帰着させるためには、いくつかの具体物を結びつけるしかない。

「世間」とは何か
http://www.pat.hi-ho.ne.jp/nobu-nisi/kokugo/seken.htm

「世間」とは・・・近所のおばさん、警察、新聞、学校、勤め先の会社、知り合い・・・・
0165デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:31:56.59ID:13EpgKaq
>>158
>300円持っていって、200円のお菓子を買ったところで、
>200円を出すわけですから、おつりはありませんよね。

ところが最近になって、300円玉が新硬貨として発行されて、事情は異なっている。
0166デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:37:48.94ID:B/nnNqsD
>>165
電子マネー『EDY』の300円だったら?
0167デフォルトの名無しさん
垢版 |
2018/09/22(土) 03:52:54.17ID:s3nzRYMi
『龍が如く』追加クエスト

タクシー運転手『では会計1500円です』
桐生『一万円札でおつりくれ』
タクシー運転手『すいませんただいま千円札一枚と百円玉二枚しかなくて』
桐生『どうしてくれるんだ、約束の時間に間に合わないじゃないか』
タクシー運転手『えーと・・・』
桐生『先を急ぐんで失礼』
タクシー運転手『タダ乗り犯罪てすよ』
桐生『うるさい』
0168デフォルトの名無しさん
垢版 |
2018/09/22(土) 04:10:38.53ID:B/nnNqsD
>>166
一円玉200枚で200円のお菓子を買うのか?
0169デフォルトの名無しさん
垢版 |
2018/09/22(土) 04:14:01.12ID:B/nnNqsD
お金には使用できる枚数の制限はありますか
【答】
日本銀行券(いわゆる紙幣、お札)は、「日本銀行法」第46条第2項で「無制限に通用する」と規定されています。
一方、貨幣(いわゆる硬貨)は、「通貨の単位及び貨幣の発行等に関する法律」
第7条で「額面価格の20倍まで」を限度として通用することと規定されています。つまり、
20枚までは貨幣による支払いが行っても良いということです。
https://www.mof.go.jp/faq/currency/07ab.htm
0171デフォルトの名無しさん
垢版 |
2018/09/22(土) 04:36:54.81ID:2Mr7WngO
>>169
>額面価格の20倍まで

【テキ屋・桐生雑貨】
桐生「合計3650円」
少年「これ一年分の貯金」
桐生「全部十円玉じゃないか」
少年「365日分」
桐生「おい」
0172デフォルトの名無しさん
垢版 |
2018/09/22(土) 09:13:14.05ID:Iv5lsF/+
>>155
> 「胸がドキドキする」恋愛表現はもはや時代遅れで、
> これからは新しい恋愛表現が開発されることだろう。
言葉ってインフレを起こすから鬱陶しいんだよな (-_-!)
大笑い → 爆笑 → 大爆笑
とか
キレのいい → キレキレの → キレッキレの
とか。
大盛り → メガ盛り → ギガ盛り
とか。
そのうち「ドキドキ」も「超凄くドッキンドッキンする」
とかになるのかな。
0173デフォルトの名無しさん
垢版 |
2018/09/22(土) 09:18:13.03ID:Iv5lsF/+
>>163
少なくとも消費税は考えなきゃダメだろうな。
近所の八百屋で一袋150円のナス買ったら
162円だった。
0174Mr.Moto
垢版 |
2018/09/22(土) 09:32:39.01ID:Iv5lsF/+
>>147
コンピュータで処理することを考えると、
そこまで難しいことは考えていられないので、
「カレーライス」と「ライスカレー」は
「とりあえず別物」だが「具体的にはどこが違うか」
までは考えない。内部的に ID を持っていて、
それぞれの ID に「カレーライス」「ライスカレー」
といった名前が紐づけされている。だから ID が違えば別物。
「これ」「あれ」「それ」なんかは、名前がなくても
話題にできる。
0175Mr.Moto
垢版 |
2018/09/22(土) 10:00:52.98ID:Iv5lsF/+
>>160
省略のパターンについては有効だが、
修飾関係については問題あり。
ex.「黒い瞳の美しい水車小屋の娘」
水車小屋に瞳はないから、「瞳の美しい」は娘に
かかるのだが、「黒い」が「瞳」にかかるのか、
「娘」にかかるのかは不明。
0176Maria
垢版 |
2018/09/22(土) 10:22:27.03ID:Iv5lsF/+
>>153
そもそも「ネイティブ英語」の定義が曖昧ですね。
「クレオール言語としての英語」もネイティブ英語に
含まれるのかどうか。
せめて母集団を限定してもらわないと。
多民族国家だと、父親と母親の母語が違うので
共通語で会話し、その共通語が子供の母語に
なったりすることがしばしばあります。
0177デフォルトの名無しさん
垢版 |
2018/09/22(土) 10:59:22.20ID:KheVhAuS
>>170
地球と人間では、質量も体積も無限大に近いくらいに差があるので、その公式は通じない。
0178Mr.Moto
垢版 |
2018/09/22(土) 13:16:15.64ID:Iv5lsF/+
>>177
物理屋は、「無視できる」「ネグリジブルである」と
云う。
0179Maria
垢版 |
2018/09/22(土) 13:21:51.64ID:Iv5lsF/+
そういえば、
「灰色で透明な液体」とか、
「灰色のサングラス」とかいった
言葉は、有意味であるのかどうか。
水鳥の写真を撮るカメラマンが使う
偏光フィルターとか、渓流釣りを
している人が使う偏光サングラスとかは、
「色彩を変えずに、光度・明度だけを
変えて減光するだけなので、それは
『灰色』と表現するのは “常識的” なのだ
ろうか?」っていう意見が所内である。
0182Mb
垢版 |
2018/09/22(土) 14:10:03.03ID:Iv5lsF/+
>>181
じつはは色彩学の研究の初期から問題になっているんで
ニュートンとかゲーテとかを読んでから出直してくるべし。

“Colorless green ideas sleep furiously.”とかいった話と
勘違いしてるんなら、自然言語処理に関して勉強しなおして
くることをお奨めする。
0183Maria
垢版 |
2018/09/22(土) 14:22:39.16ID:Iv5lsF/+
>>181
その昔(「ライトアップ」というのが一般的ではなかったころ)に、
東京タワーをライトアップしたら、「なんで、あんな気持悪い色の
光を当てるんだ!」という苦情がきたそうです。
赤いものを白い光でライトアップすると、赤い光を当てているように
見えるんですよ。
そんなわけで、青色 LED が普及した結果、近代建築のライトアップは
光源そのものの色によることになっています。花火みたいなもんですね。
歴史的建築物に関しては、いわゆる「タングステン・カラー」
(「デイライト・カラー」の反対語です。黒体輻射で、蝋燭の火
くらいの温度のときの色温度です)を使うのが一般的のようです。
まぁ、「薪能」とかに使う光源ですね。

>>180
さぁ、いい子のみんな、勉強になったかな?
(大森総合研究所の実力をナメんじゃねーよヴォケ)
0184デフォルトの名無しさん
垢版 |
2018/09/22(土) 21:44:26.65ID:B/nnNqsD
>>178
自然言語から物理学の公式を連想するというのが受験物理だ。
0185デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:34:25.08ID:B/nnNqsD
>>175
>ex.「黒い瞳の美しい水車小屋の娘」

『黒い腎臓の美しい水車小屋の娘』というのはどうか?

どんなに美しい女性でも、列車飛び込み自殺すれば、内臓が飛び出してくるものだろう?
0186デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:36:16.41ID:I9muF0Sl
>>185
『黒い乳首の美しい水車小屋の娘』ならアリなんだが?
0187デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:38:45.82ID:PGp2AKzL
グルーのパラドックスみたいな
古典的な哲学な話してんのか

そして今日本では
モジャモジャみたいなインチキ科学者もどきが
クオリア、クオリアとわめいてるワケ
0188デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:40:04.05ID:B/nnNqsD
『黒いほくろの美しい娘』ならここに!

口もとにセクシーなワンポイント、ほくろ型のシールです。
さりげない、大人の色っぽさを演出できちゃうアイテムです。
アンルシアとおそろいのほくろで、王家の迷宮へお出かけしよう♪
https://hiroba.dqx.jp/sc/shop/item/6689b1658f64e0f8cbad65af31e211aa36/
0189デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:48:32.68ID:B/nnNqsD
黒い陰毛の美しい娘
0190デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:50:19.36ID:I9muF0Sl
陰毛は美しいが顔は醜い?
0191デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:51:16.19ID:B/nnNqsD
黒人女性だろう?
0192デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:53:57.33ID:PGp2AKzL
頭髪は金髪ストレート
マンゲは真っ黒モジャモジャ
マンコは真っ黒ブラックホール
0193デフォルトの名無しさん
垢版 |
2018/09/22(土) 23:58:56.01ID:PGp2AKzL
そもそもブラックホールという名前はおかしい
ブラックホールは光学的に視認できない
0194デフォルトの名無しさん
垢版 |
2018/09/23(日) 01:26:18.07ID:HOGwDyHh
師が言うことには、「ここにも一人月見をする人(月をめでる風流人がおります)と、
自分から名のり出たことにしたならば、どれほど風流であろうか。ぜひ自称の句とするほうがよい。
この句は私も大事にして、『笈の小文』に書き入れておいた。」と(いうことだ)。
http://text.yarukifinder.com/kobun/4436

>ここにも

『ここ』とは何処の誰なのか、どういう状況なのか写真付きにしないと理解できない。
他人の写真をアップにするか自分の写真をアップにするかで、意味が違ってくることだろう。
0195デフォルトの名無しさん
垢版 |
2018/09/23(日) 01:39:56.98ID:HOGwDyHh
黒いホクロの黒い瞳の黒い乳首の黒い陰毛の美しい水車小屋の娘
0196デフォルトの名無しさん
垢版 |
2018/09/23(日) 01:50:29.64ID:HOGwDyHh
>>186
水車小屋の前に真っ黒になった女性の腐乱死体ってのはナシね。だって死体は既に人間ではないから。
0197デフォルトの名無しさん
垢版 |
2018/09/23(日) 01:56:39.77ID:t4mA6Vu2
オブジェクト『小渕恵三』は、 2000年5月14日をもって、完全消滅ということだ。
0198デフォルトの名無しさん
垢版 |
2018/09/23(日) 04:25:56.08ID:krEWWZRu
>>188
>アンルシアとおそろいのほくろで

ガッシュ村長の娘であるミシュアお嬢さんは、『ホクロの美しき水車小屋の娘』というストーリー設定だからな。
0199デフォルトの名無しさん
垢版 |
2018/09/23(日) 04:47:31.11ID:AdpWnqlS
>>175
>ex.「黒い瞳の美しい水車小屋の娘」

水車から戻ってみるとミシュアがやってきます
嫌味をうまくかわしながらコペばあさんをメルサンディの村に戻るよう説得します
https://pepedash.biz/dq10-2ndstory-mersundy-gi

青い瞳の美しい水車小屋の娘!
0200デフォルトの名無しさん
垢版 |
2018/09/23(日) 05:33:07.42ID:/NO8Aa0s
水車から戻ってみるとミシュアがやってきます
嫌味をうまくかわしながらコペばあさんをメルサンディの村に戻るよう説得します
https://pepedash.biz/dq10-2ndstory-mersundy-gi

Hatt ich tausend千本の手で
Arme zu ruhren!掻きまわせたら…
Konnt ich brausendすごい勢いで
Die Rader fuhren!水車を回せたら…
Konnt ich wehen風のように
Durch alle Haine!森を疾走できたら…
Konnt ich drehenすべての石臼を
Alle Steine!回せたら…
Das die schone Mullerinあの美しい水車小屋の娘が
Merkte meinen treuen Sinn!僕の誠実な心に気がついてくれるように
http://yamamasu.world.coocan.jp/lieder_text_schubert_d795-5.html
0201デフォルトの名無しさん
垢版 |
2018/09/23(日) 10:34:44.08ID:J4PTRHfz
>>200
>Das die schone Mullerinあの美しい水車小屋の娘が
>Merkte meinen treuen Sinn!僕の誠実な心に気がついてくれるように

チンボがシコシコする!
0202デフォルトの名無しさん
垢版 |
2018/09/23(日) 10:38:10.32ID:sYdHD3Za
>>200
>Das die schone Mullerinあの美しい水車小屋の娘が
>Merkte meinen treuen Sinn!僕の誠実な心に気がついてくれるように

胸がドキドキする!
0203Maria
垢版 |
2018/09/23(日) 15:25:35.21ID:/9eqLEMo
で、自然言語処理に関して、
何か質問があれば
承りますよ?
初期スレの話題でも、
「これってどうよ?」ってな話があれば、
どうぞ。
0204Maria
垢版 |
2018/09/23(日) 15:34:48.00ID:/9eqLEMo
と、いうわけで、長尾 真先生による、
「とりあえず、『漢字以外の文字から、漢字にかわる
ところ』で切ると、だいたい文節で切れる」っていう
のを検証するための Java プログラムを晒しとこうと
思うんですが …… SJIS か UNICODE か、コマンドライン
なのか GUI なのか(「メソッド部分だけ貰えりゃ、
こっちでなんとかする」っていうのもアリです)、
そのあたりのご要望ってございますか?

辞書やらソースコードやらを渡すのに面倒臭いから、
nsb14421@nifty.com
までメールとか頂けるとありがたく思います。
0205デフォルトの名無しさん
垢版 |
2018/09/23(日) 19:33:15.20ID:/9eqLEMo
そういえば、
ユークリッド幾何学における平行線定理は、
「矛盾はしてないけど、正しくないと思っても
話がややこしくなるだけで、体系自体は破綻しない」
というのが分かり、「非・ユークリッド幾何学」が
生まれたわけだが、ユークリッド幾何学はユークリッド幾何学て、
それなりに機能してるわけだ。
このあたり、自然言語処理の分野では、どう扱ったらいいのかね?
ニュートン力学と特殊相対性理論とかの話で、
もうお手上げになりそうな気はするんだが。
0206デフォルトの名無しさん
垢版 |
2018/09/24(月) 01:53:45.47ID:l1tbaaE1
>>205
>このあたり、自然言語処理の分野では、どう扱ったらいいのかね?

素数は無限に存在する(ユークリッド幾何学)、 メルセンヌ素数なんて実用性無い(非ユークリッド幾何学)。
物理学も大半は近似式であってユークリッド幾何学は通じない。従って自然言語処理の分野では後者が中心。

>>128
>問題文が2通りに解釈できて,解釈により結論が異なれば,

自然言語処理は常に中間言語を介した近似式であり、人によって解釈が異なるのは当たり前。
水の沸点が100度というのも地表面で観測した近似値であって、高山地帯であれば80度でも沸騰する。
0207デフォルトの名無しさん
垢版 |
2018/09/24(月) 02:03:05.05ID:l1tbaaE1
>>205
>このあたり、自然言語処理の分野では、どう扱ったらいいのかね?

例えば『地球』はあくまで立体なので、平面図で表すとメルカトル図法かモルワイデ図法とかになる。
従ってシミュレーションというのも、メルカトル図法を選ぶかモルワイデ図法を選ぶかということになる。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況