自然言語処理スレッド その5
■ このスレッドは過去ログ倉庫に格納されています
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・ 文章生成などの、実装とそれに付帯する技術および理論について 扱いたいと思っています。
>>106 担当部署が違うんだよ。 自然言語処理を真面目にやろうと思うと、 アルゴリズム開発(「形態素解析はチャート法でなんとかなるのは 分かったが、探索戦略は どんな感じで組んだらいいのか?」)とか、 実装(可変長文字列を扱うとすれば Java あたりが適当なんだろうけど 云々)とか、辞書管理(これは辞書的に持ったらいいのかアルゴリズム のほうで持ったほうがいいのか)とか、文法記述担当(出現頻度が高くて 不規則なものと、規則で処理できるから辞書でカバーしてもらうのと、 歴史的な事情があるらしいから別扱いしたほうがいいらしいのとの 切り分けと、みたいな)とか、いろいろ分担があるわけ。 そういえば、このスレに集ってる真面目なメンバーに訊きたいんだが、 漢語の音便についての、公開されている使用料フリーのデータベースって、 どっかにあるんかいな。 で、あったとするなら、その表現形式って、どんなもの なのか。そのあたりの 情報が知りたいんだが。 たとえば、「説得」だったら「せっとく」なんだが、本来の音としては 「せつ-とく」だろ? それが音便の結果として「せっとく」に なってるわけじゃないか。 だったら、「{{説|せっ}{得|とく}(せつ-とく)}」みたいなデータとして 表現されててくれないと、自然言語処理を行う上では不自由だろ? そういうデータは、自由に使えないと困るじゃないか。 「{蒲公英|たんぽぽ}(タンポポ/たんぽぽ/{{蒲/ほ}{公/こう}{英/えい}})」 でもいいと思う。ただし、XML で書かれたりすると、こんどは国語学とかを やってる人には理解できないし、わかるように表示すると、こんどはデータを いじるのが面倒臭いんだよな。 だったら、「日本語処理と国語学の橋渡しをするような、共通言語としての なんかしらの言語(表現形式)」っつーのは、あっていいんじゃねぇの? たぶん Zipf の法則とかに絡んでくると思うんだが、 言語表現っていうのは「擦り減る」んだ。 つまり、「しょっちゅう使ってると、不規則化する」 んだよ。つーことは、「これ(不規則な表現)は データで処理して、これ(規則的な表現)はアルゴリズムで 処理する。ただし、歴史的な事情があって、『出現頻度は 低いのに、不規則な形で残っているものがある』」っつー コトなんだ。 で、そういうことに関するデータは共有しとこうぜ、って話。 >>109 > このスレに集ってる 「集ってる」が「あつまってる」なのか「つどってる」なのかが 気になる自分がイヤといえばイヤかも、と思うけど、 そこは適宜「どっちですか?」とシステムが配慮してくれる (つーか、IME のレベルで情報持ってるんだから 勝手に棄てじゃねーよ、と思うけど)のが 正解っていうモンじゃないの? >>107 「ラッダイト運動」という機械破壊運動がかつて存在し、それは 「産業革命にともなう機械使用の普及により、失業のおそれを 感じた手工業者・労働者が起こした。産業革命に対する反動とも、 後年の労働運動の先駆ともされる。機械所有の資本家には 憎悪の対象であったが、詩人には創作の霊感を与えた。」そうだけど、 「コンピュータ技術の発展にともなうパーソナル・コンピュータの使用と AI 技術の普及により、失業のおそれを感じた労働者が起こした。 自然言語処理技術に対する反動とも、反コンピュータ運動の一部ともされる。 コンピュータ技術者には憎悪の対象であったが、『プロレタリアートの権利の 庇護者』を自称する左派リベラル運動家には反政府運動としてのテロ行為の 正当化の口実を与えた。」みたいなことになるんかな? こんなマイナーなスレを荒らしてるヒマがあったら、グーグルに対して 「Google Home の販売をすぐさま中止しろ!」とか言ってくりゃいいのに、 と思う。 >>95 > 現在のところ確認されている『素数』はここまで。 より厳密にいうと、「現時点で、実際に記述され、しかも 『素数である』ことが検証されている素数として知られている ものは、50番めのメルセンヌ素数。」だ。 もっと大きな素数は定義できる(「素数は無限個ある」のが 古代ギリシャの時代に証明されている)が、今のところ、わざわざ 具体的に求めることのメリットが(ほぼ)ないから放ったらかされてる だけだと思う。 なんという見にくい文章なんだ… 専門板特有のアレな人がここに居着いてしまったか >>114 >>57 をよく読め。 つーか、「見にくい」は連体修飾句だから、 主語は きさまだ。 「荒らし」呼ばわりされたくなかったら、 まず読解力を磨いてから出直してこい。 言いたいことがあるなら、せめてアンカーを附けろ。 >>115 ファーwwwwww安価付けてないのに反応してて草草の草ァ!!! やっぱ自覚あるんすねぇ(笑) >>35 >死んだ鳥は飛ばないが、鳥は鳥だ。 小便を出さないチンボは、チンボとしての機能を果たしていないから、それはチンボと呼ぶに値しない! >>5 >所有者の意思とは無関係に、勃起して「シコシコする」 チンボは必ず勃起する存在で、勃起しないチンボは、チンボと呼ぶに値しない! 念のために言っておこう。 このスレは、『自然言語処理スレッド』だ。 日本語の文章は、ほぼ餌だぞ? どっかの研究機関で、「電子掲示板における 荒らしの自動検出について」みたいな論文に 取りあげられて、自分が書いた文章が晒されても 自業自得なんだぞ? 「自分を大切にしてくれ」と、お願いしておこう。 >>116 > ファーwwwwww安価付けてないのに反応してて草草の草ァ!!! > やっぱ自覚あるんすねぇ(笑) 「ファーwwwwww」 → 自然言語処理というか、精神病理の分野の対象と思われる。 「安価付けてないのに反応してて草草の草ァ!!!」 → 「安価」は、「アンカー」(「錨(anchor)」の意) という語を規定している権威に対する異議申し立てと考えうるが、 「なんとなく」感があるので、知性を感じられない。 「草草の草ァ!!!」という、論理的な応答を拒絶した 態度から、やはり自然言語処理よりも、精神病理の分野の 分析対象と思われる。 「やっぱ自覚あるんすねぇ(笑)」 → 私は社会人であり、都市文化に対して敬意を持っているので、 社会秩序を尊重している。したがって、その意味では「自覚がある」 という認識はあり、その点に関して恥じるところなはいので、 なんら問題はない。私は文脈(その「文脈」という言葉を正確に 定義することができない自分を恥じるところはあるのだが)から 察するに、>>116 は反社会性パーソナリティ障害者であるという であることを強く疑う。 ただし、それもまた精神病理の分野の対象と思われるが、 「その言説から、精神病理学的な予備診断を行う」という ことは、自然言語処理の ひとつの応用として、興味深いものが ある。 >>117 >>118 > チンボと呼ぶに値しない! おまえの価値観なんぞは、 科学技術とはなんの関係もねーんだよヴォケ。 >>95 50番目のメルセンヌ素数より小さい素数がすべて求められているわけではないので… というか、素数を小さい順に列挙しているサイトはありませんか? >>98 >幾何も整数も、中間言語さえ充実させれば、後は『 Mathematica』で楽勝 Mathematica 7では,数列生成,変換,数列認識を含めた新しいレベルの系統だっ た整数列解析を導入している.Wolfram Researchにおける最近のアルゴリズム的躍進によって, 数列要素のリストを取ってそれらに対して大きなクラスの閉形 Mathematica 式を系統的に求めることが初め て可能になった.これで強固な整数列の認識が実験数学におけるプログラム的な発見のルーチン部分となった. https://www.wolfram.com/mathematica/newin7/content/IntegerSequenceAnalysis/index.ja.html?footer=lang >>124 >素数を小さい順に列挙するプログラム そのままをインプットすればいいだけでは? 物理においては、大学では数学の微分積分を駆使して問題を解くのが一般的だが、 高校では微分積分を使った解法は用いない。他の教科においても、大学と高校では教育内容がかけ離れてい ることが多く、大学教員が無理に高校生に合わせて試験問題を作るためにミスが起きやすいとの指摘もある。 https://s.kyoto-np.jp/politics/article/20180201000207 高校履修範囲に合わせて入試問題を作成するのも苦労するのだと。 >>121 でも飛ばない飛行機は飛行機とは呼べないだろう? 燃えていない炎なんて有り得んだろう? >>104 >このフロントエンドが英語または日本語の曖昧性を排除するように、 自然言語の解釈は、完璧なものには出来ない。中間言語は必ずしも完璧である必要は無い。 も しも下記の解説を本気で書いたならば「独りよがりな日本語の解釈を押し付ける所は,さすがだ!」 となります。いくらなんでも本気ではないと思いますが,出 題 を正当化するために書いたのならば 「苦しさは分かりますが,こんな論理で納得する訳がない!」が私の考えです。したがって,私の結論は, この問題は大学の検証結果と異なり,「与えられた選択肢の中に正解がない。」となります。 また,入試問題においては,問題文がすべてであり,作者の意図を忖度することは不要です。 問題文が2通りに解釈できて,解釈により結論が異なれば,出題ミスであるとするのが常識です。 したがって,大阪大学が大学の解説のような意図で出題したとしても,問1は出題ミスであると断言できることになります。 http://www.geocities.jp/midarekazu/oosaka.html >>13 > y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルづつ速度が上がる』 www >>123 >強固な整数列の認識 『整数』『素数』『自然数』が問題文に与えられたら、その全てを列挙してしまうくらいでいい。 自然言語処理で今のところ最も困難極まりないのは、『中間言語の生成』であろう。 >「独りよがりな日本語の解釈を押し付ける所は,さすがだ!」 自然言語で書かれている文章をどう解釈するか、人間にだってわからない出題もされているくらいだから。 スレ違いだが、エラトステネスの篩とか使って 地道に計算するが吉。 >>127 > でも飛ばない飛行機は飛行機とは呼べないだろう? 試作機は飛ばしてみないと飛ぶか飛ばないかがわからんけど いちおう「飛行機」の範疇に入るのが困ったところ。 少なくとも ・今現在飛んでいる ・過去に飛んだことがあり、着陸してここにある ・飛ばそうと思ったら、たぶんまた飛ぶだろう あたりのものが「飛行機」で、墜落した飛行機の残骸は、 「かつて飛行機であったもの」であって、“飛行機”ではない、 という推論は間違っていないと思う。 > 燃えていない炎なんて有り得んだろう? 太陽のプロミネンスは燃焼してないけど、いちおう「炎」。 「炎のない燃焼」としては白金触媒によるベンジンの燃焼 (ハクキンカイロ)がある。 「物理的現実と言語表現との関係」はひとまず横に置いて、 「人間の内的な概念と言語表現との関係」について考える のが、効率のよいアプローチだと思っている。 すなわち、「人工のキチガイを作っておいて、それを改造・ 教育・治療することで、マトモな人間に近づける」という アプローチ。 >>129 > 『整数』『素数』『自然数』が問題文に与えられたら、 > その全てを列挙してしまうくらいでいい。 現在のコンピュータの性能を考慮すると、それで あらかたうまくいってボロが出ないだろうとは思うんだが、 筋を通すんだったら、「1は自然数」「自然数+自然数は 自然数」ってところから自然数の諸性質を証明して、 0 とマイナスの自然数から整数を定義して …… みたいな 形で持ってゆきたいな。 「1はなぜ素数ではないのか?」とか「0はなぜ自然数では ないのか?」とかみたいな質問が出てきたときに、コンピュータが どれだけ丁寧に答えられるか、というところに興味があるし、 それぞれ別のアプローチで初等整数論を教えたコンピュータを 相互学習(必ずしも自然言語を経由させなくてもいい)させたら 何が起きるか?とかは、かなり興味深い。 >>132 >太陽のプロミネンスは燃焼してないけど、 太陽は燃えている Love Me With All Of Your Heart/Engelbert Humperdinck https://m.youtube.com/watch?v=tjTCD-_ItHs よく考えたら、日本語処理(当然のことながら、 自然言語処理の一部だ)技術者というのは、 単に社会的に冷遇されているだけではなく、 法的にも保護されていない。 このあたりの話は、広く世の中に伝えておいたほうが、 いいような気がする。 とはいえ、このあたりの話は『プログラム技術板』ではなく、 『プログラマ板(マ板)』で議論するのが筋だと思うので、 そっちの方に「日本語処理技術者の憂鬱」みたいな スレを立てるというのはどうだろうか。 このスレ句読点が多いな おじいちゃんがいるんだろうな >>137 句読点が普及したのは、たぶん江戸後期あたりからだと 思うんだが、あんたは鎌倉・室町時代あたりの生まれなんだな? あんたのおじいちゃんの時代に句読点があったというのを 文献・史料で示してくれるとありがたい。 あんたのおじいちゃんの時代だとすると、 『大鏡』あたりの平安時代とか、そういう頃 の生まれなんだよな? 花山天皇とか、安倍晴明とか、いろいろ聞きたい ことがあるんで、ぜひ質問に答えてくれ。頼む m(_ _)m 気に障ったならもうしわけない 句読点が多いと読みづらいとだけ伝えておこう 読みやすさを犠牲にしてまで句読点を打とうと言うのは何かしら理由があるんだろうけど >>139 句読点を使ってやたら長々とぶつ切りで書かれた下手な文章は、俺も読みにくいと思う。 それとは別に、ネットとかで句読点を使わないのが普通だみたいな風潮があるけど、それには賛同できないな。 特にスマホで見てると横幅が狭いから、文末の改行がちょうど画面端に来て次の行との区切りが判別できないこともあるし。 >>139 > 読みやすさを犠牲にしてまで句読点を打とうと言うのは > 何かしら理由があるんだろうけど つーか、“読みやすさ” を重視した結果が、句点・読点とか 括弧とか感嘆符とか疑問符なんだが。 で、文章の構造(解析木)を明示的に示すために括弧を使うと うざったらしい(←これは方言かもしれん)ので、「読点( ‘、’ )」 というものが使われたという経緯があるのだ。 大類 雅敏『そこに句読点を打て!』(一九七六)という本も あるのだぞ? >>140 いや、言うたらなんやけど、句点はともかくも(改行でなんとかなる)、 読点や括弧は適切に入ってないと、“目が滑る” 感じがする。 『句読点を使ってやたら長々とぶつ切りで書かれた下手な文章は、 俺も読みにくいと思う。 それとは別に、ネットとかで句読点を使わないのが 普通だみたいな風潮があるけど、それには賛同できないな。 特にスマホで見てると横幅が狭いから、文末の改行が ちょうど画面端に来て次の行との区切りが判別できない こともあるし。』も、 『句読点を使って、やたら長々とぶつ切りで書かれた下手な文章は、 俺も読みにくいと思う。 それとは別に、ネットとかで「句読点を使わないのが 普通だ」みたいな風潮があるけど、それには賛同できないな。 特にスマホで見てると、横幅が狭いから、文末の改行が ちょうど画面端に来て、次の行との区切りが判別できない こともあるし。』くらいに切ったほうが読みやすいように 思うんだが、これは世代の差なのかな? それともスマホ で読んでると、改行禁則とか いろいろ面倒臭い話があるんで また別のルールがあるんかな? おれは読みやすさに配慮して(和欧混植の文章とかもあるんで) 半角スペースを入れたりしてるんだが、そのあたりについての 意見も聞きたいと思う。 >>141 >>133 を読み返してほしい 駄文の典型例だと思う 、を使って長々とつづけた文が二つだけ こんなに読みづらいレスはやめてほしい そうなると、「 それとは別に、 これらの読点は間違いなく不要 このスレを「と、」検索してみて思ったのは大体の と の後の読点はいらない >>142 世代の差でもスマホ固有の問題でもなく、あなた個人の感性とか資質、恐らく脳の働きの問題かと思うよ。 俺は自分の文章が上手いと思い上がるつもりはないが、新聞なり市販の書籍なりのまっとうな文章は、あなたの書いているぶつ切りの文章ではなく俺の文章の方がより近いはず。 そこまでぶつ切りに書かれてなくても、普通の人は頭の中で自然に無意識に構文解析して読み解けているよ。 >>106 のコテハン使い分けは別人格設定なのという質問に別部署だからと回答していたけど、同一人物であることを否定しているということかな。 ここまで独特の感性で同じ特徴をもつ文章を書かれると、とても別人によるものとは思えない。 自然言語処理やってますとはいうけれど、どちらかと言えば不自然言語処理なのではないだろうか? >>145 >ここまで独特の感性で同じ特徴をもつ文章を書かれると、とても別人によるものとは思えない。 ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか? チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。 オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、 全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体 が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。 例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。 違うか? 「胸がドキドキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ! >>132 >「物理的現実と言語表現との関係」はひとまず横に置いて、 >「人間の内的な概念と言語表現との関係」について考える 前者はシミュレーション(>>30 )を使えば何とかなるが、後者についてはどうていいのかわからない。 人間の内的な概念なんて自分でも何がなんだかわからない、それは『阿頼耶識』とも言われているくらい。 >>128 >入試問題においては,問題文がすべてであり,作者の意図を忖度することは不要です。 言葉に出ていない作者の意図を忖度するなんて、それでは『阿頼耶識』の研究が必要になってくるよな。 >>141 読点の入れ方なら本多勝一「日本語の作文技術」も参考になる、いろいろと問題な人だが、これはわりあいにおもしろい 『下手なセックスより上手なオナニー』 諺としてどうだろう? 団塊ジュニア世代なら、学生時代にスポーツに燃えた経験が有るだろう? 1 若い力と 感激に 燃えよ若人 胸を張れ 歓喜あふれる ユニホーム 肩にひとひら 花が散る 花も輝け 希望に満ちて 競え青春 強きもの http://takurou.co-site.jp/natumero/21-25/wakaitikara.html しかしながら、 >歓喜あふれる ユニホーム ブ ル マ な ん て 恥 ず か し い ! 世代によっても価値観が違う。かつてはスポーツに燃えるのが美徳であったが、 今では『ブルマなんて恥ずかしい!』。 >>92 >「ネイティブ英語とは何か」 何しろ世代によっても価値観が違うので、ネイティブ英語とやらも時代によって変わってくる。例えば、 >歓喜あふれる ユニホーム 1980年代団塊ジュニア世代のユニフォームを画像認識させても、現在の若者には通じない! >>150 1980年代のエロ漫画はセックスシーン、現在のエロ漫画はオナニーシーン。 >>146 >「胸がドキドキする」は良いが、「チンボがシコシコする」はダメな理由を、 「胸がドキドキする」恋愛表現はもはや時代遅れで、これからは新しい恋愛表現が開発されることだろう。 >>148 >それでは『阿頼耶識』の研究が必要になってくるよな 未来の俺が何を考え何をしているかは、俺にだってわからない。 14 デフォルトの名無しさん 2014/06/14(土) 14:59:25.78 ID:C3RmOQgD 例えば、こんな問題はいかがでしょうか。 ちなみにこれは昨日、ラジオで聞いた問題です。 「300円もって買い物に行きました。そして、100円のお菓子と 40円のお菓子と60円のお菓子を買いました。 おつりはいくらでしょう?」 という問題です。 これを聞いて100円と答える時、その思考は以下のようなものではないでしょうか。 300ー(100+40+60)=100 間違っていませんね。 買ったお菓子の合計は200円なので、300?200は100としているわけです。 これを、図を使って場面をイメージしてみるのです。 このようにお金が図として描ければ見えてきませんか。 そうなんです。 これはいわゆるクイズなので、実は・・・「おつりなし」が答えなんです。 300円持っていって、200円のお菓子を買ったところで、 200円を出すわけですから、おつりはありませんよね。 ずるい!という声が聞こえそうですが、 でも、これを「いや、おつりはないでしょ!?」と答えられるかどうかって 文章問題がイメージできているかという大切なところであると思うのです。 問題文を与えられて、見た数字だけで演算決定をしてしまうから間違えるのです。 http://mhidetoshi.exblog.jp/22011978 >>158 >100円のお菓子と40円のお菓子と60円のお菓子を買いました。 100円のお菓子 40円のお菓子 60円のお菓子 それぞれいくつ買ったのかも不明なんだが? 900 :デフォルトの名無しさん:2009/02/20(金) 20:46:21.00 「類似文検索システム」としては、名詞+助詞「の」+名詞+、のように文構造のパターンを網羅しておき、 目新しい文章が出た時に文構造パターン認知できるようにしておくとか。 例えば「身長の高い男が私の横を通り過ぎた」「髪の長い女が彼の手を握った」はいずれも、 名詞+助詞「の」+形容詞+名詞+助詞「が」+名詞+助詞「の」+名詞+助詞「を」+動詞。 27 デフォルトの名無しさん 2014/06/19(木) 03:03:30.38 ID:xTtna/5L 「まわるまわるよ、時代は回る」 「 地球は回る、君を乗せて 」 上の二つの「回る」は、同じ意味ですか? 29 デフォルトの名無しさん 2014/06/19(木) 11:47:01.23 ID:7DkBqMX+ >>28 >地球は回る 太陽の回りを公転して回っている、というのも有りだろ? >>159 デフォルトで「一つずつ」、更に言えば店屋が会計を間違える可能性とか、挙げたらキリが無くなる。 246 デフォルトの名無しさん sage 2014/11/26(水) 10:03:34.88 ID:NpjnEUfO 国や自治体は、地球儀で表現できる。物体・流体とその運動は、シミュレーターで表現できる。 人物とその行動はオブジェクトで表現できる。けれども「民主主義」とかの抽象概念は表現できず、 せいぜい共起関係を調べるのみ。例えば朝鮮民主主義人民共和国だって「民主主義」ということで、 北朝鮮=民主主義国家なんて理屈も成り立つ。しかしこれは一般的なイメージとはかけ離れている。 従って抽象概念を一般的なイメージに帰着させるためには、いくつかの具体物を結びつけるしかない。 「世間」とは何か http://www.pat.hi-ho.ne.jp/nobu-nisi/kokugo/seken.htm 「世間」とは・・・近所のおばさん、警察、新聞、学校、勤め先の会社、知り合い・・・・ >>158 >300円持っていって、200円のお菓子を買ったところで、 >200円を出すわけですから、おつりはありませんよね。 ところが最近になって、300円玉が新硬貨として発行されて、事情は異なっている。 >>165 電子マネー『EDY』の300円だったら? 『龍が如く』追加クエスト タクシー運転手『では会計1500円です』 桐生『一万円札でおつりくれ』 タクシー運転手『すいませんただいま千円札一枚と百円玉二枚しかなくて』 桐生『どうしてくれるんだ、約束の時間に間に合わないじゃないか』 タクシー運転手『えーと・・・』 桐生『先を急ぐんで失礼』 タクシー運転手『タダ乗り犯罪てすよ』 桐生『うるさい』 >>166 一円玉200枚で200円のお菓子を買うのか? お金には使用できる枚数の制限はありますか 【答】 日本銀行券(いわゆる紙幣、お札)は、「日本銀行法」第46条第2項で「無制限に通用する」と規定されています。 一方、貨幣(いわゆる硬貨)は、「通貨の単位及び貨幣の発行等に関する法律」 第7条で「額面価格の20倍まで」を限度として通用することと規定されています。つまり、 20枚までは貨幣による支払いが行っても良いということです。 https://www.mof.go.jp/faq/currency/07ab.htm >>169 >額面価格の20倍まで 【テキ屋・桐生雑貨】 桐生「合計3650円」 少年「これ一年分の貯金」 桐生「全部十円玉じゃないか」 少年「365日分」 桐生「おい」 >>155 > 「胸がドキドキする」恋愛表現はもはや時代遅れで、 > これからは新しい恋愛表現が開発されることだろう。 言葉ってインフレを起こすから鬱陶しいんだよな (-_-!) 大笑い → 爆笑 → 大爆笑 とか キレのいい → キレキレの → キレッキレの とか。 大盛り → メガ盛り → ギガ盛り とか。 そのうち「ドキドキ」も「超凄くドッキンドッキンする」 とかになるのかな。 >>163 少なくとも消費税は考えなきゃダメだろうな。 近所の八百屋で一袋150円のナス買ったら 162円だった。 >>147 コンピュータで処理することを考えると、 そこまで難しいことは考えていられないので、 「カレーライス」と「ライスカレー」は 「とりあえず別物」だが「具体的にはどこが違うか」 までは考えない。内部的に ID を持っていて、 それぞれの ID に「カレーライス」「ライスカレー」 といった名前が紐づけされている。だから ID が違えば別物。 「これ」「あれ」「それ」なんかは、名前がなくても 話題にできる。 >>160 省略のパターンについては有効だが、 修飾関係については問題あり。 ex.「黒い瞳の美しい水車小屋の娘」 水車小屋に瞳はないから、「瞳の美しい」は娘に かかるのだが、「黒い」が「瞳」にかかるのか、 「娘」にかかるのかは不明。 >>153 そもそも「ネイティブ英語」の定義が曖昧ですね。 「クレオール言語としての英語」もネイティブ英語に 含まれるのかどうか。 せめて母集団を限定してもらわないと。 多民族国家だと、父親と母親の母語が違うので 共通語で会話し、その共通語が子供の母語に なったりすることがしばしばあります。 >>170 地球と人間では、質量も体積も無限大に近いくらいに差があるので、その公式は通じない。 >>177 物理屋は、「無視できる」「ネグリジブルである」と 云う。 そういえば、 「灰色で透明な液体」とか、 「灰色のサングラス」とかいった 言葉は、有意味であるのかどうか。 水鳥の写真を撮るカメラマンが使う 偏光フィルターとか、渓流釣りを している人が使う偏光サングラスとかは、 「色彩を変えずに、光度・明度だけを 変えて減光するだけなので、それは 『灰色』と表現するのは “常識的” なのだ ろうか?」っていう意見が所内である。 >>179 そういうことは自然言語の研究の初歩中の初歩なんで 一冊専門書を読むべきだよ >>181 じつはは色彩学の研究の初期から問題になっているんで ニュートンとかゲーテとかを読んでから出直してくるべし。 “Colorless green ideas sleep furiously.”とかいった話と 勘違いしてるんなら、自然言語処理に関して勉強しなおして くることをお奨めする。 >>181 その昔(「ライトアップ」というのが一般的ではなかったころ)に、 東京タワーをライトアップしたら、「なんで、あんな気持悪い色の 光を当てるんだ!」という苦情がきたそうです。 赤いものを白い光でライトアップすると、赤い光を当てているように 見えるんですよ。 そんなわけで、青色 LED が普及した結果、近代建築のライトアップは 光源そのものの色によることになっています。花火みたいなもんですね。 歴史的建築物に関しては、いわゆる「タングステン・カラー」 (「デイライト・カラー」の反対語です。黒体輻射で、蝋燭の火 くらいの温度のときの色温度です)を使うのが一般的のようです。 まぁ、「薪能」とかに使う光源ですね。 >>180 さぁ、いい子のみんな、勉強になったかな? (大森総合研究所の実力をナメんじゃねーよヴォケ) >>178 自然言語から物理学の公式を連想するというのが受験物理だ。 >>175 >ex.「黒い瞳の美しい水車小屋の娘」 『黒い腎臓の美しい水車小屋の娘』というのはどうか? どんなに美しい女性でも、列車飛び込み自殺すれば、内臓が飛び出してくるものだろう? >>185 『黒い乳首の美しい水車小屋の娘』ならアリなんだが? グルーのパラドックスみたいな 古典的な哲学な話してんのか そして今日本では モジャモジャみたいなインチキ科学者もどきが クオリア、クオリアとわめいてるワケ 『黒いほくろの美しい娘』ならここに! 口もとにセクシーなワンポイント、ほくろ型のシールです。 さりげない、大人の色っぽさを演出できちゃうアイテムです。 アンルシアとおそろいのほくろで、王家の迷宮へお出かけしよう♪ https://hiroba.dqx.jp/sc/shop/item/6689b1658f64e0f8cbad65af31e211aa36/ 頭髪は金髪ストレート マンゲは真っ黒モジャモジャ マンコは真っ黒ブラックホール そもそもブラックホールという名前はおかしい ブラックホールは光学的に視認できない 師が言うことには、「ここにも一人月見をする人(月をめでる風流人がおります)と、 自分から名のり出たことにしたならば、どれほど風流であろうか。ぜひ自称の句とするほうがよい。 この句は私も大事にして、『笈の小文』に書き入れておいた。」と(いうことだ)。 http://text.yarukifinder.com/kobun/4436 >ここにも 『ここ』とは何処の誰なのか、どういう状況なのか写真付きにしないと理解できない。 他人の写真をアップにするか自分の写真をアップにするかで、意味が違ってくることだろう。 黒いホクロの黒い瞳の黒い乳首の黒い陰毛の美しい水車小屋の娘 >>186 水車小屋の前に真っ黒になった女性の腐乱死体ってのはナシね。だって死体は既に人間ではないから。 オブジェクト『小渕恵三』は、 2000年5月14日をもって、完全消滅ということだ。 >>188 >アンルシアとおそろいのほくろで ガッシュ村長の娘であるミシュアお嬢さんは、『ホクロの美しき水車小屋の娘』というストーリー設定だからな。 >>175 >ex.「黒い瞳の美しい水車小屋の娘」 水車から戻ってみるとミシュアがやってきます 嫌味をうまくかわしながらコペばあさんをメルサンディの村に戻るよう説得します https://pepedash.biz/dq10-2ndstory-mersundy-gi 青い瞳の美しい水車小屋の娘! 水車から戻ってみるとミシュアがやってきます 嫌味をうまくかわしながらコペばあさんをメルサンディの村に戻るよう説得します https://pepedash.biz/dq10-2ndstory-mersundy-gi Hatt ich tausend千本の手で Arme zu ruhren!掻きまわせたら… Konnt ich brausendすごい勢いで Die Rader fuhren!水車を回せたら… Konnt ich wehen風のように Durch alle Haine!森を疾走できたら… Konnt ich drehenすべての石臼を Alle Steine!回せたら… Das die schone Mullerinあの美しい水車小屋の娘が Merkte meinen treuen Sinn!僕の誠実な心に気がついてくれるように http://yamamasu.world.coocan.jp/lieder_text_schubert_d795-5.html >>200 >Das die schone Mullerinあの美しい水車小屋の娘が >Merkte meinen treuen Sinn!僕の誠実な心に気がついてくれるように チンボがシコシコする! >>200 >Das die schone Mullerinあの美しい水車小屋の娘が >Merkte meinen treuen Sinn!僕の誠実な心に気がついてくれるように 胸がドキドキする! で、自然言語処理に関して、 何か質問があれば 承りますよ? 初期スレの話題でも、 「これってどうよ?」ってな話があれば、 どうぞ。 と、いうわけで、長尾 真先生による、 「とりあえず、『漢字以外の文字から、漢字にかわる ところ』で切ると、だいたい文節で切れる」っていう のを検証するための Java プログラムを晒しとこうと 思うんですが …… SJIS か UNICODE か、コマンドライン なのか GUI なのか(「メソッド部分だけ貰えりゃ、 こっちでなんとかする」っていうのもアリです)、 そのあたりのご要望ってございますか? 辞書やらソースコードやらを渡すのに面倒臭いから、 nsb14421@nifty.com までメールとか頂けるとありがたく思います。 そういえば、 ユークリッド幾何学における平行線定理は、 「矛盾はしてないけど、正しくないと思っても 話がややこしくなるだけで、体系自体は破綻しない」 というのが分かり、「非・ユークリッド幾何学」が 生まれたわけだが、ユークリッド幾何学はユークリッド幾何学て、 それなりに機能してるわけだ。 このあたり、自然言語処理の分野では、どう扱ったらいいのかね? ニュートン力学と特殊相対性理論とかの話で、 もうお手上げになりそうな気はするんだが。 >>205 >このあたり、自然言語処理の分野では、どう扱ったらいいのかね? 素数は無限に存在する(ユークリッド幾何学)、 メルセンヌ素数なんて実用性無い(非ユークリッド幾何学)。 物理学も大半は近似式であってユークリッド幾何学は通じない。従って自然言語処理の分野では後者が中心。 >>128 >問題文が2通りに解釈できて,解釈により結論が異なれば, 自然言語処理は常に中間言語を介した近似式であり、人によって解釈が異なるのは当たり前。 水の沸点が100度というのも地表面で観測した近似値であって、高山地帯であれば80度でも沸騰する。 >>205 >このあたり、自然言語処理の分野では、どう扱ったらいいのかね? 例えば『地球』はあくまで立体なので、平面図で表すとメルカトル図法かモルワイデ図法とかになる。 従ってシミュレーションというのも、メルカトル図法を選ぶかモルワイデ図法を選ぶかということになる。 ■ このスレッドは過去ログ倉庫に格納されています
read.cgi ver 07.5.1 2024/04/28 Walang Kapalit ★ | Donguri System Team 5ちゃんねる