X



自然言語処理スレッド その5
■ このスレッドは過去ログ倉庫に格納されています
0001Mr.Moto
垢版 |
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
0049デフォルトの名無しさん
垢版 |
2018/09/18(火) 05:40:28.87ID:uaIbFfyV
水(水溜りではない!)や蒸気(サウナ風呂ではない!)の上は歩けないが、氷の上は歩ける。
0050デフォルトの名無しさん
垢版 |
2018/09/18(火) 05:42:49.67ID:KMpXV1+r
>>45
可能世界解釈だと、「エンジェルが存在する世界」と
「エンジェルが存在しない世界」があって、どちらも
可能だがどっちかを選ぶ、みたいな推論をするので、
むやみに場合分けが増えて処理系がパンクする。
「翼の折れたエンジェル」は「投資に失敗して
財産を失った投資家」のメタファーであるかもしれない。

かつて古代中国には「鴆」と呼ばれる「毒を持った鳥」が
いたと云われていたが、「毒を持った鳥なんて伝説上の
生物だろう」と思われていた。そうしたらパプアニューギニアで
ビトフーイという毒を持った鳥が発見されてしまった。
「じゃあ、エンジェルはまだ未発見で、じつは存在する可能性を
排除できない」という見方もありうる。
「すべての動物は消化管を持つ」は正しそうだが、チューブワームは
消化管を持たない。

非単調論理を持ちこんでも矛盾が起きないようにするのが確実だが、
計算の手間が増えるのと無矛盾性を保証するのが難しいのが弱点。
0051デフォルトの名無しさん
垢版 |
2018/09/18(火) 05:48:06.72ID:KMpXV1+r
>>48
フロイト心理学者の岸田秀や吉本隆明が、「人間は本能が
壊れているので、基本的に共同幻想の中で生きている」と
いう「唯幻論」をとなえている。
昆虫は本能だけで生きているので、現実と認識が乖離して
いないため、昆虫の世界は現実と一致している、という。
0052デフォルトの名無しさん
垢版 |
2018/09/18(火) 05:53:32.88ID:pP0ghNjp
そういや『複素数平面』なんてのも、現実世界で存在するものではないな。試験には必須だけど。
0053デフォルトの名無しさん
垢版 |
2018/09/18(火) 05:59:23.32ID:KMpXV1+r
>>49
まぁ、詩的な表現だと思えば、高山で雲海を見下ろしながら
歩くのは、「雲の上を歩く」と表現されても不自然ではないがね。
ハイマツとかコマクサとかライチョウとか森林限界とか高山病
とか串田孫一とかいった語が出てきたら、共起関係で解析候補に
出てきてもおかしくはないと思う。
0054デフォルトの名無しさん
垢版 |
2018/09/18(火) 06:08:27.03ID:KMpXV1+r
>>52
電子回路とか電磁波とかの関係の仕事をしている連中には、
複素平面は現実世界の一部らしい。「それで飯を食って
いる」わけだから、気分としては納得できる。
0055デフォルトの名無しさん
垢版 |
2018/09/18(火) 06:24:37.75ID:pP0ghNjp
>>54
>複素平面は現実世界の一部らしい。

『ハチワンダイバー』なんて、将棋盤(9×9=81)に飛び込んでやろうなんて漫画もあるくらいだからな。
0056デフォルトの名無しさん
垢版 |
2018/09/18(火) 06:28:17.46ID:/g7mGHNd
ハチワン(将棋盤)に飛び込む者(ダイバー)!
0057デフォルトの名無しさん
垢版 |
2018/09/18(火) 06:35:57.13ID:KMpXV1+r
>>32
> 長文はなるべく句読点で句切って短い文章にすれば、
> 機械翻訳も簡単になるだろう。
> 中間言語方式が廃れているというが、長文を短く区切って
> 短文にするくらいの中間処理はしておきたいところ。
> 句読点で句切るのは簡単だが、句読点が無い場合でも
> 自動で補うアルゴリズムも考えておきたい。
実際にやってみると、文章として読んだときにすっきりした
分かりやすい表現にならないのが悩みの種。
まず、どこまで省略するか、代名詞をどう使うか、括弧や句読点で
意味的なブロックをどう表現するか、文と文との接続関係を
どう表すか、一文の長さをどうやって決めるか(ブツ切りでも
ダラダラ続いても読みにくい)とかいった基準(つまり、正書法)を
決めてほしいと思う。
そこは作文や小論文の技術として重要だと思うが、そういった指導が
できる教師が少ない(一貫した原則がなく、当然「こうしたほうが、
こういう理由で、よい文章になる」ということが説明できず、結果として
自分の好みを押しつけている指導者が多い)のが問題。
0058デフォルトの名無しさん
垢版 |
2018/09/18(火) 06:48:03.63ID:KMpXV1+r
>>56
昔の貧弱なマシン環境に慣れたプログラマが
昨今のマシン環境にダイブすると溺れかける。

そこいらの海っぺりでダイビングしてた奴が、
小笠原へ行って船からダイブしたら、水深が
四十メートルくらいあってパニック起こすような
もん。「水深十メートルちょいくらいのところに
テーブル程のサイズのマンタがいると思ったら、
三十メートルくらいんとこにいる四畳半くらいの奴だった」
みたいな話をしてた奴がいた。
0059Maria
垢版 |
2018/09/18(火) 09:19:56.05ID:KMpXV1+r
>>32 さま。
>>57 のレスは、かなり不親切なものだと思うので、
あらためて補足いたします。
全体的な意見としては、「日本語には正書法が確立していない」と
いうことです。ただし、それ以前に「国語学上の用語の、スタンダードな
定義が決まっていない」という問題があります。
たとえば、「長文」の定義です。要するに「長い文章」なんですが、
「全体の文字数が多い文章」なのか、「センテンス(一般的には、句点
「。」で区切られる部分)の文字数が多い文章」なのか、「文のなかの、
意味上のブロックの文字数が多い文章」(これは、一般的には読点「、」で
区切ることで短くできます)なのかが、はっきりしません。そもそも、
「文章」と「文」が同じ意味なのか、違うとすればどこが違うのか、からして
明確に定義されていません。
句点に関しては、「大きいブロックから切ってゆく」という原則があり、
場合によっては「括弧によって範囲を示す」という手段があります。
センテンスの場合は、長すぎると思ったら接続助詞の手前で切り、
接続詞で置きかえることで短くすることができます。
そういったことの「具体的な手法」や「適用の基準」を説明するための
道具である「用語」が整備されていないというのが、日本の作文・小論文
作成の教育システムの欠陥のひとつではないでしょうか。
0060Maria
垢版 |
2018/09/18(火) 11:36:08.09ID:KMpXV1+r
>>32
てなワケで、
> 長文はなるべく句読点で句切って短い文章にすれば、
> 機械翻訳も簡単になるだろう。
> 中間言語方式が廃れているというが、長文を短く区切って
> 短文にするくらいの中間処理はしておきたいところ。
> 句読点で句切るのは簡単だが、句読点が無い場合でも自動で補う
> アルゴリズムも考えておきたい。
のは重々承知しているんだけど、運用上の問題については、
「どのように解決するのか?」という配慮が必要だと思います。
0061Mb
垢版 |
2018/09/18(火) 12:13:37.33ID:KMpXV1+r
つーか、古典論理が悪いとは言わんけどさ、
「実生活では、古典論理ではカバーできない
分野がある」ということを理解できてない人間の
人権を、どこまで認めるか、っていう話になると
思うんだよね。
「間違っていないことが証明できないならば、それは
正しい」とか、「正しいことに従うことは正しいけれど、
正しくないことに従う奴は正しくない」んなら、
「自爆テロは正しく、それを防止しようとする行為は
正しくない」ことになっちゃうわけだよ。
「いや、われわれは正しいと思っているから、そう行動している」
ということを、自爆テロを防止しようとする人間が言っちゃったら、
それはテロリストと同一の地平に立つことだろう?
「知っている」は、「正しい∧信じている」なんだけど、
「正しい」が証明可能かどうか、というのは前提あってのことだろう?
そうなると、「神は正しい」「神はそう命じられた」とかいう奴に
対抗することは、力でしかできないワケじゃないですか。
われわれ自然言語処理を研究している人間は、どう対処したら
いいんですかね?
0062デフォルトの名無しさん
垢版 |
2018/09/18(火) 12:27:34.51ID:Q0o7k5H4
>>59
>「全体の文字数が多い文章」なのか、「センテンス(一般的には、
>句点「。」で区切られる部分)の文字数が多い文章」なのか、

反対の賛成=賛成の反対、そういう日本語もアリということなら、賛成の反対の反対、反対の反対の賛成、
賛成の反対の反対の賛成、などとキリがなくなってしまう。『文節』で区切るにせよ、『文節』数には限度を。
長文を短文の箇条書きに変える中間言語を、最終的には『 (v, s, o, c) =(述語、主格、目的格, 与格) 』へ。

998 Maria sage 2018/09/17(月) 15:10:53.47 ID:rTQuL7Ni
>>282
> (x,y,z)=(主語,述語,目的語)で、出現頻度の多い順に並べる、
> あるいは少ない順に並べる。高頻度のトリプルがやたら多いと
> いうことは、
> 逆に言えば他と似たり寄ったりでつまらないコンテンツである
> 可能性が高い。出現頻度の少ない組み合わせは、オリジナル表現か
> あるいはナンセンス文かのどちらか。
に関してコメントしておくと、これは
(v, s, o, c) =(述語、主格、目的格, 与格)
くらいにしておくのが順当だと思われます。
述語がないと文にならないし、
「れる・られる」が入ってくると、主語と目的語の
交替が起きたりします。
方向格とか到達格とかいうのが あるのか、という問題は
あると思うんですけど、とりあえず、「なくても困らないんじゃないか」
という意見はあります。
0063デフォルトの名無しさん
垢版 |
2018/09/18(火) 13:31:54.13ID:AsveLQIg
>>59
> 「全体の文字数が多い文章」なのか、

『スリランカの首都はスリジャヤワルダナプラコッテ』
『日本の首都は東京』

前者と後者は、文節数では同じ。文字数ではなくて文節数で。
0064Maria
垢版 |
2018/09/18(火) 13:37:40.67ID:KMpXV1+r
>>62
古典論理では認められてるんですが、「二重否定の除去」は、
直観論理では認められていないんですよ。すなわち、
「¬¬A ≡ A」は成立しないんです。
このあたりは、クルト・ゲーデルというひとが、
「完全性定理」(無矛盾な公理系があって、
その中では「正しいことは、すべてその体系の中で
証明できる」)とか「第一不完全性定理」(その公理系の
中で記述された命題のうち、「正しいんだけど証明できない
命題」があっても矛盾しない)とか「第二不完全性定理」
(その公理系の中に矛盾があっても、その公理系の中では
「矛盾がある」ということが証明できない)とかいうことを、
「ゲーデル数」という概念を使って証明しちゃったんで、
このあたりの話は、けっこう活発に議論されているテーマ
なんです。
「数学基礎論」とか「連続体仮説」とか「選択公理」とかについて
勉強してみると、けっこう面白いですよ?
0065Maria
垢版 |
2018/09/18(火) 13:45:11.26ID:KMpXV1+r
>>63
「タイ王国の首都は『クルンテープ・マハーナコーン・アモーンラッタナコーシン・
マヒンタラーユッタヤー・マハーディロック・ポップ・ノッパラット・
ラーチャタニーブリーロム・ウドムラーチャニウェートマハーサターン・
アモーンピマーン・アワターンサティット・サッカタッティヤウィサヌカム
プラシット』」
「パブロ・ピカソの本名は、『パブロ・ディエゴ・ホセ・フランシスコ・
デ・パウラ・ファン・ネポムセーノ・チプリアーノ・デ・
ラ・サンティシマ・トリニダード・ルイス・ピカソ』」

文節数 “だけ” っちゅーのも、若干ムリがあるような気はするので、
「文節数は、一応の目安になるのではないか?」という意見として
承っておきます m(_ _)m
0066Maria
垢版 |
2018/09/18(火) 13:51:22.81ID:KMpXV1+r
ちなみに、バブロ・ピカソと同じくカタルーニャ
(カタロニア)地方出身のパブロ・カザルス(パウ・カサールス)の
本名は、「パウ・カルラス・サルバドー・カザルス・イ・ダフィリョー」。
0067デフォルトの名無しさん
垢版 |
2018/09/18(火) 14:06:35.15ID:AsveLQIg
>>64
『なきにしもあらず』なんて表現もあるからなぁ。
0068デフォルトの名無しさん
垢版 |
2018/09/18(火) 14:21:04.13ID:58z5OVIK
>>65
『こちら葛飾区亀有公園前派出所』『ドラえもん』は同じ。
0070デフォルトの名無しさん
垢版 |
2018/09/18(火) 19:16:37.29ID:cP0HB/Ch
>>11
>各操作で、(「記号○と×のいずれかを」「表示させる操作」を「k回繰り返す」。)

例えば『テトリス』で、初期状態がどうで、時間経過でどう推移して、プレイヤーの操作はいかにとか。
0071デフォルトの名無しさん
垢版 |
2018/09/18(火) 19:39:54.35ID:gesmqwNm
458 デフォルトの名無しさん 2017/05/23(火) 16:39:02.27 ID:BN0kPFXk
y=x^2 のグラフを x 軸方向に 2 だけ平行移動し,
それをx軸に関して対称移動したグラフを求めよ.
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D5-1.pdf

y=x^2

グラフ

x 軸方向

2
だけ
平行移動


それ

x軸

関して
対称移動
した
グラフ

求めよ



このように全ての単語と助詞を「オブジェクト」に分解し、かつその「多態性」を分析し、然る後に形式変換すべきだと思う。
0072デフォルトの名無しさん
垢版 |
2018/09/18(火) 19:44:34.55ID:gesmqwNm
556 Mb sage 2018/07/17(火) 15:08:30.84 ID:iAzNVHws
「日本人は髪が黒い」という表現は、「黒い」が「髪」を連体修飾
してて、「髪」がとりたてによって強調されているから、「黒い」
の前に出てきて、とりたて詞「が」が用いられる、って言っただけで、
学会で吊るし上げを喰らうんだぞ?
で、まともな反論が返ってくるならともかく、
「くぁwせdrftgyふじこふじこふじこ!」
みたいなコトになるんだぞ?
「いや、ちゃんと動いてるシステムがあるんですが」とか
言っても、「あーあーあーあーあー聞こえない聞こえない聞こえなーい」
みたいな反応しか返ってこないんだぞ?
だけど、普通の研究者は逆らえないんだ。そういう連中は、大っぴらには
言えんけど大きな企業で国の予算を貰っていて、その一部をスポンサーとして
研究機関に流してるところから来た、背広着てネクタイ締めて学会に来てる
ような連中だからだ。
「日本語処理が実用化されたりなんかしたら、研究費が出なくなって
自分らが干上がる」というのを知っている連中が、日本語処理業界に
巣食ってるんだよ。
0073Maria
垢版 |
2018/09/18(火) 19:52:24.66ID:KMpXV1+r
>>720
完全情報ゲームである将棋においては、
420 手で「引き分け」になったそうです。
ただし、「千日手」というルールがあるので、
10^70〜10^80 手以内で(というか、局面の
数が、その程度の組合せになる以前に、ですから、
手数自体はもっと少ないはずですが)決着がつくようです。
ちゃんと検証はしていませんが。
0074デフォルトの名無しさん
垢版 |
2018/09/18(火) 19:54:38.35ID:gesmqwNm
789 デフォルトの名無しさん sage 2018/09/09(日) 06:53:27.52 ID:SSGV4TJO
構文解析をやっていると、「やっぱり文法や形態素解析の知識は
必要だな」と思う。
「なぜ」が連用修飾詞であるとか、「ません」が連体修飾詞で
あるとかいった視点がないと、構文解析の結果が交差してしまって、
支離滅裂になる。

801 デフォルトの名無しさん sage 2018/09/09(日) 15:11:46.35 ID:SSGV4TJO
そういえば、
助詞「が」の用法について、大野晋先生に
「とりたて詞の『が』と、所属の『が』」を
ごっちゃにして喧嘩売ってた奴がいたけと
思うんだけど、その後どうなったんだろうかな?
つーか、誰だっけ? 誰か知ってるヒトいる?
「鼻が長い」の「が」と、「我が家」の「が」は、
同表記だけど意味が違う、というのを納得できなくて
大野晋先生に延々絡んでたヒトがいたと思うんだが、
だれか名前を憶えていないか?
0075デフォルトの名無しさん
垢版 |
2018/09/18(火) 20:01:04.24ID:iAiSJ3tX
>>73
>完全情報ゲームである将棋においては、
> 420 手で「引き分け」になったそうです。

『自然数nの問題』は東ロボも苦手だったとのことだが、テトリスは将棋とは違い、手数も時間も無限大。
テトリスで『t時間後にn回目の操作』が行われた時にゲームオーバーになったのだとか。
0076 ◆QZaw55cn4c
垢版 |
2018/09/18(火) 20:11:29.59ID:Iw2LHuqq
>>64
>「第二不完全性定理」(その公理系の中に矛盾があっても、その公理系の中では「矛盾がある」ということが証明できない)
ちょっと違うのでは?
「その公理系の中に矛盾ないとき、『その公理系の中では矛盾がない』ということを、その公理系では証明できない」

>「二重否定の除去」は、直観論理では認められていないんですよ。すなわち、「¬¬A ≡ A」は成立しないんです。
厳密ではないですね
二重否定の除去は、「排中律」+「矛盾の公理:矛盾から任意の命題を導くことができる」のダブルパンチの威力があります
直観主義論理は、「排中律」を公理として含みませんが、「矛盾の公理」は含んでいます
0077デフォルトの名無しさん
垢版 |
2018/09/18(火) 20:37:31.01ID:bwmUwMwk
では『友達の友達』というのはどうか?
『友達のトモダチの、そのまた友達』もアリなのか?
0078デフォルトの名無しさん
垢版 |
2018/09/18(火) 20:43:06.63ID:bwmUwMwk
成功⇔失敗でなく、成功⇔中止(挑戦しない)という意見もある。しかしながら数学的には、
勝利か敗北か試合放棄か、正答か誤答か白紙か、プラスかマイナスかゼロかとしか考えられない。
0079デフォルトの名無しさん
垢版 |
2018/09/18(火) 20:50:15.62ID:bwmUwMwk
 先週ロシアはクリミア編入手続きを正式に完了し、欧州大陸の戦略環境は激変した。佐世保には17日に入ったが、その前日にはクリミアで
住民投票があり、ロシア編入案が圧倒的多数で支持された。さらに、前々日の15日には国連安保理で住民投票を
無効とする決議案がロシアの拒否権で否決された。従来ならロシアに同調する中国はなぜか今回棄権している。
その理由を長崎でずっと考えていた。
http://www.canon-igs.org/column/security/20140331_2467.html

>中国はなぜか今回棄権し

賛成⇔反対、成功⇔失敗、けれどもそれ以外の場合もあるということだ。
0080Maria
垢版 |
2018/09/18(火) 21:36:20.68ID:KMpXV1+r
>>76
数学者は疑い深いので、
「その公理系の中に矛盾があった場合でも、『その公理系の中では
 “矛盾がある”』ということを、その公理系の中では
証明できないかもしれない」っていう話になるんですよ。
「その公理系の中で、X と ¬X の両方が証明されちゃったら、
どっかに矛盾がある」んですけど、「X と ¬X のどっちを仮定しても、
Y は正しい」のが証明されちゃったんで Y は正しい、みたいな
実例がホントにあったりするんで。
0081Maria
垢版 |
2018/09/18(火) 21:49:47.72ID:KMpXV1+r
>>76
> 直観主義論理は、「排中律」を公理として含みませんが、
> 「矛盾の公理」は含んでいます
Prolog のベースになっているホーン節の論理だと、
ゲーデルの完全性定理が成立するので、「正しいことが
証明できなかった」場合は「間違っている」ことが
証明されるのですが、問題は「数学は無矛盾である」ことが
数学の中では証明できないかもしれない(数学の中で、
X と ¬X が同時に証明されたら、どっかで矛盾があるだろう、
ということが謂えるんですけど)のと、「正しいんだけど
証明できない命題があるかもしれない」(つーか、連続体仮説と
選択公理は、数学の枠組のなかでは証明できないことが証明されて
いる)んだけど、「どの問題が、証明可能ではないのか?」というのが
わからない(コラッツ予想とかは、けっこう怪しい。リーマン予想とかは、
いけると思う。みたいな話はあります)というのが悩ましいところ。
0082Mb
垢版 |
2018/09/18(火) 21:56:28.98ID:KMpXV1+r
>>77
つーか、おんなじ NATO 陣営のトルコとギリシャが
紛争してたことが、昔あったような気が ……
0083Mr.Moto
垢版 |
2018/09/18(火) 22:03:43.68ID:KMpXV1+r
つーか、おまいら数学板の
『数理論理学(数学基礎論) その13 』
(ttps://rio2016.5ch.net/test/read.cgi/math/1532721493/)
へ逝け。
0084デフォルトの名無しさん
垢版 |
2018/09/18(火) 22:41:02.67ID:oE0uJFU6
キプロスの争いはまだ終わってはいない
そして、イギリスのアクロティリ・デケリアもそのまんま残ってる
世界史を学んだことがあるなら
キプロスがどういう歴史を辿ったかは分かってるハズだからココでは省略する
0085デフォルトの名無しさん
垢版 |
2018/09/18(火) 23:01:51.63ID:Iw2LHuqq
>>80
>「その公理系の中に矛盾があった場合でも、『その公理系の中では “矛盾がある”』ということを、その公理系の中では証明できないかもしれない」
ちょっと違うと思います
「(ある特定の)公理系が無矛盾であれば、その公理系内で自分自身の無矛盾を証明できない」です

>「X と ¬X のどっちを仮定してもY は正しい」のが証明されちゃった
これは興味深いですね、キーワードを教えてください
0086デフォルトの名無しさん
垢版 |
2018/09/19(水) 09:10:16.35ID:u73AcyrQ
>>85
> これは興味深いですね、キーワードを教えてください
たしか三年くらい前の数学セミナーに載ってた話なんで、
ちょっとバックナンバー漁ってみる
0087Maria
垢版 |
2018/09/19(水) 14:58:37.46ID:u73AcyrQ
>>85
> 「その公理系の中に矛盾がないとき、『その公理系の中では「矛盾がない」』と
> いうことを、その公理系では証明できない」
って、なんか、数学的には、わりと自明な雰囲気があると思うんですが。
「どんなに素っ頓狂な公理系でも、その中では『その公理系の中では
「矛盾がない」』ということを、その公理系では証明できない」んなら、
「それはそれでアリ」というのが「数学の自由性」っていうものでしょ?
現在、われわれの多くが信じている公理系が、「唯一、絶対に正しい」と
いうことが証明されなきゃいけない、という必然性はありませんよね?
0088Mb
垢版 |
2018/09/19(水) 16:49:52.14ID:u73AcyrQ
>>71
> y=x^2 のグラフを x 軸方向に 2 だけ平行移動し,
> それをx軸に関して対称移動したグラフを求めよ.
伊藤 巧と松崎 拓也と佐藤 理史に、「なに上から目線で
勝手なこと言っとんじゃボケカスが」と言うとけや。
「グラフを求めよ」って言っといて、「言ってみただけでーす。
あとは知りませーん」とか言うんなら、いますぐ行って殺して
きますが何か?
「方程式 f(x.y) ≡ {y=x^2} の X-Y 平面上のグラフを、『X 軸方向に 2 だけ
平行移動し,それをX軸に関して対称移動した』ものと一致する
グラフを表す方程式 f(x, y) は、どのようなものか示してください」
くらい書けや。
名古屋大学の大学院の学生っつーのは、みんな馬鹿なんか? それを
論文にして日本全国の研究者に向けて発表させるような指導教官って、
何を考えてんだ? 「学生の自主性を重んじている」のかも知れんが、
少しは学校の体面とか学生の将来とかについても配慮してやれや。
0089Maria
垢版 |
2018/09/19(水) 17:20:11.22ID:u73AcyrQ
>>59 に関して、
前スレ『自然言語処理スレッド その4』
(ttps://mevius.5ch.net/test/read.cgi/tech/1401741600/)
の >>654より。
森敦『月山』の冒頭は
「長く庄内平野を転々としながらも私は肘折の渓谷に分け入るまで
月山がなぜ月の山と云われるのかを知りませんでした。」
は、形容詞「長い」の暗黙の主語として話者を要求するので、
正確かつ わかりやすく記述しようと思うと
「(私は)(私にとって長い期間)庄内平野を転々としていました。
しかしながら、私は肘折の渓谷に分け入るまで、『なぜ
(庄内地方の人々は)月山を月山(月の山)と呼ぶのか』を
知りませんでした。」ということになり、これは確かに
翻訳には向いていると思うのですが、「それでは原文の味わいが」
とか文句をつける人はいそうに思います。
「古池や蛙飛び込む水の音」も、「古池(ふるいけ)や。蛙(かわず)
飛び込む〔水の音〕。」と書いちゃっていいのか(このスレで
話題になっている、「中間言語」としては、これはこれでいいと
思いますが)、という話にはなると思います。

古典作品の「現代語訳」というのはけっこう多いように思いますが、
現代文の「文語訳」というのは、ほとんど見たことがありません。
ですから、漢文・古文の教育を充実して「論文は文語で書け」という
のも、アリなんじゃないかと思います。
文語だったら構文チェックも現代文よりなんぼかラクですし、外国語
にも翻訳しやすいと思うので。
0090デフォルトの名無しさん
垢版 |
2018/09/19(水) 17:35:22.43ID:u73AcyrQ
>>86
ごめん。まだ探索中で、大掃除みたいなコトになっている。
たしか、「選択公理が正しい」ということを仮定して
証明して、「選択公理が間違っている」ことを仮定して
証明して、どっちでも証明できたから「正しい」ことに
なった、という話があって、「じゃあ選択公理要らねぇじゃん!」
と思ったけど、「もし連続体仮説が間違っていたなら」とか
「もし選択公理が間違っていたなら」とかで研究してる数学者が
大勢いるので、その成果が利用しやすい、というメリットがあるようです。

だけど、『連続体仮説』を著したコーエンが「おれは選択公理は
正しくないと思う」と言っていたというのを聞いて、ビールを鼻から
吹きそうなりました。
0091デフォルトの名無しさん
垢版 |
2018/09/19(水) 19:32:51.37ID:wmsNWe/u
>>42
>問題の本質は「飛んでいる飛行機が墜落する確率を0にすることはできない」こと

『飛行機』とは必ず『飛ぶ』『機械』であり、『墜落』の可能性を考慮しなければならない。
それくらいに厳密な定義をしておかないと、人工知能は飛行機という単語を理解したことにはならない。

>>44
>Cycは人間には電気の部品がないことは知っているが、

人間は電気の部品を(機械)を『道具』として扱うことができるが、動物にはそれが出来ない。
0092デフォルトの名無しさん
垢版 |
2018/09/19(水) 19:45:02.62ID:wmsNWe/u
>>90
>「もし選択公理が間違っていたなら」

現在のところ『例外』『間違い』は確認されていない、という程度でいい。バグが無いことは証明できない。

「俺はどんな奴にも勝てる」とか言っちゃったら
「自分より強いのか? → 強くても弱くても引き分けでも矛盾」
みたいな形のパラドックスが起きる可能性がある。
http://samidare.halfmoon.jp/mathematics/AxiomOfChoice/index.html

囲碁の棋力については、『DeepMind』が『今のところは』世界最強で良い。
『DeepMind』に勝つ存在が確認されたところで、新たに修正すれば良いことだ。

【人工知能】世界最強の囲碁AIを開発したDeepMindが「人間を超越したFPSプレイヤー」のAIを開発[07/06]
http://egg.5ch.net/test/read.cgi/scienceplus/1530936191/

自然言語については、『今のところは』で良い。

5、結論
  以上の結果より導き出される京大英語で8割を超すための対策は、「ネイティブ英語とは何か」
を定義づけして学ぶことに尽きるだろう。
  たとえば、「この料理はまずい」という英作文なら受験生に多いのが
 This dish tastes poor.
しかし、これは評価されない。なぜなら、英語として正しくてもマナー違反。英検英語なら否定文にして、
This dish isn't good. これでマナーは改善された。
  しかし、ネイティブなら I don't like this dish. と言うだろう。本当に不味い場合は、
Yuck! と叫ぶ。そういう違いだ。
 問題は、
「受験英語の参考書や問題集で取り上げられている構文や表現が現実に使われている英語と違う」
  という事実。それを指導している教師や講師も、外国生活がなく50年前の表現を気づかずに指導して
いること。そのために、校内テストや模試で高得点や上位の順位をとっても落ちてしまうこと。
https://storys.jp/story/18159
0093デフォルトの名無しさん
垢版 |
2018/09/19(水) 20:18:39.76ID:wmsNWe/u
>>90
>「もし選択公理が間違っていたなら」

人間の走行能力は、今のところこれが最大値である!

100メートル競走
9秒58
ウサイン・ボルト
ジャマイカ
2009年8月16日 ベルリン、ドイツ
0094デフォルトの名無しさん
垢版 |
2018/09/19(水) 20:26:08.99ID:wmsNWe/u
>>88
>「方程式 f(x.y) ≡ {y=x^2} の X-Y 平面上のグラフを、『X 軸方向に 2 だけ
>平行移動し,それをX軸に関して対称移動した』ものと一致する
>グラフを表す方程式 f(x, y) は、どのようなものか示してください」
>くらい書けや。

『中間言語方式は廃れた』なんてとんでもないことだな。機械翻訳は中間言語をどうするかが焦点。
0095デフォルトの名無しさん
垢版 |
2018/09/19(水) 20:49:14.80ID:wmsNWe/u
>>90
>「もし選択公理が間違っていたなら」

人工知能としては、『現在確認されている範囲』だけでいい。

史上最大の素数を発見。50番目となるメルセンヌ素数は、原稿用紙5万8000枚分
https://www.huffingtonpost.jp/2018/01/05/gimps-m77232917_a_23324596/

現在のところ確認されている『素数』はここまで。
0096デフォルトの名無しさん
垢版 |
2018/09/19(水) 21:04:08.72ID:wmsNWe/u
もし数学の問題文で『全ての素数aについて』『〜であることを示せ』と出ていたら、
人工知能としては『確認されている全ての素数』について調べればいい。但し、

「素数p,qを用いてp ^ q + q^ pで表される素数を全てもとめよ。」
https://math-jp.net/2017/02/24/problem-checking-whether-prime/

>p,qが奇数だった場合は、pq+qpは偶数である

『偶数』『奇数』の何たるか、 (偶数・奇数)^ (偶数・奇数)の定理くらいは記憶させときたい。
0097デフォルトの名無しさん
垢版 |
2018/09/19(水) 21:55:41.31ID:9e69M8SH
そもそもコンピューターというのはただの計算機であり、更に言えば0と1の集合体にすぎない。
10進法とは単に人間の指が10本あるというだけで定義された人為的創作概念であり、
コンピューターからすると偶数も奇数も素数も、何のことだかわかりはしない。

(奇数)^ (奇数)= (奇数)、 (偶数)+(奇数)=(奇数)、というのはインプットするしかない。
0098デフォルトの名無しさん
垢版 |
2018/09/20(木) 04:50:42.52ID:AQOwxhQf
大学入試における数列の問題を解くための自動推論とその実装について
http://www.kurims.kyoto-u.ac.jp/~kyodo/kokyuroku/contents/pdf/2022-11.pdf
センター試験「数学」整数問題解答システムにおける 探索空間の削減
https://confit.atlas.jp/guide/event-img/jsai2018/2B4-04/public/pdf

幾何も整数も、中間言語さえ充実させれば、後は『 Mathematica』で楽勝。
0099デフォルトの名無しさん
垢版 |
2018/09/20(木) 07:54:27.01ID:eE0U1qQD
>>97
言いたいことは分かるし、「間違っている」とも謂えないが、
最終的にはコンピュータの問題というより入出力の問題だと
思われる。
> 更に言えば0と1の集合体にすぎない。
内部で十進数を使っているコンピュータもある。
> 10進法とは単に人間の指が10本あるというだけで
> 定義された人為的創作概念であり、
古代バビロニア人は六進法と十進法をごっちゃに使っていた。
「三進法が意外にいい」という意見もある。処理の問題よりも、
「人間側の使い勝手に配慮する」という意味では、
つまるところ人間の都合。
> コンピューターからすると偶数も奇数も素数も、
> 何のことだかわかりはしない。
内部が二進法だったら、「LSB が ON」でいい。

> (奇数)^ (奇数)= (奇数)、 (偶数)+(奇数)=(奇数)、
> というのはインプットするしかない。
そうだな。そこは人間とのすり合わせをするしかない。
で、インプットとアウトプットを合わせて入出力と呼ぶ。
0100Mr.Moto
垢版 |
2018/09/20(木) 08:11:43.97ID:eE0U1qQD
>>91
これは「飛行機」の定義によるのだが、「落ちない飛行機」に
相当するものは存在する。それは「魚雷」である。
魚雷は(マイナスの)浮力で沈んでいるわけではなく、
推力を(マイナスの)浮力に転換して沈んでいる。
だから、推力がなくなると水面に浮上するだけだから
「落ちない」。「その場合、『水面に浮上する』
ことをもって『落ちる』と呼称するのが論理的だ」という
意見もありうるが。

つーわけで、「人間魚雷」って、わりと人道的な
兵器なんだよ。電池切れしたら浮上するんだから、
魚雷ぶっ放して攻撃能力がなくなったら、そのまんま
浮上して白旗上げりゃいい。
0101デフォルトの名無しさん
垢版 |
2018/09/20(木) 08:26:35.74ID:eE0U1qQD
>>98
> 中間言語さえ充実させれば、後は『 Mathematica』で楽勝。
そこで文語(古文+漢文)ですよ。
・使用期間が千年以上と、長い。
・ジャンルを問わない。公用文から文藝まで、幅広くイケる。
(パーリー語やサンスクリット語は、ほぼ佛典限定)
・既存の文献が豊富にある。
・「正式な表現」としてのイメージが定着している。
・ほぼ死語(まだ使ってる人も、わずかながらいる)であり、
これから変化する気遣いがほぼない。

英語だと、「正式な表現」になりづらく、おそらく
対抗できるのはラテン語かギリシャ語だが、ラテン語は
ローマ帝国の公用語だったのでバリエーションが多すぎ、
ギリシャ語は理解できる奴が少ない(英語では、「ちんぷんかんぷん」を
「それは私にとってギリシャ語である」と表現する)。
日本語は漢字ひらがなカタカナにアルファベットと算用数字、
みたいに表記が混在させられるのもいい。
0102デフォルトの名無しさん
垢版 |
2018/09/20(木) 09:00:46.06ID:AQOwxhQf
>>99
>内部で十進数を使っているコンピュータもある。

コンピューターはオンかオフかの二通りしかないが、 2進化10進コードなら十進法がそのまま使える。
昔と違い現在の高性能化したコンピューターなら、多少のムダは気にならない。

2進化10進コード(Binary Coded Decimal, BCD)
4ビットあると0から15まで表せた。これによって、10進の1ケタが表せる。 つまり、0から9までだけを使って
残りは使わない(少しムダがある)。 0000(2進) から 1001(2進) だけを使って、1010 から 1111 まで
の6パターンは 使わない。 こうして、10進数の各ケタを4ビットの2進数に機械的に置き換えて行く。
http://www.cc.kyoto-su.ac.jp/~kbys/kiso/number/bcd.html
0103デフォルトの名無しさん
垢版 |
2018/09/20(木) 09:06:37.69ID:GAdj/nia
>>96
>人工知能としては『確認されている全ての素数』について調べればいい。

『素数』については、『素数』という単語が出たその時に、素数についての全てを網羅するライブラリ関数を。
0104Mr.Moto
垢版 |
2018/09/20(木) 09:26:08.03ID:eE0U1qQD
>>102
> 昔と違い現在の高性能化したコンピューターなら、
> 多少のムダは気にならない。
つーか、昨今のコンピュータは高性能すぎて、リソースを
全部使いきるのは容易じゃない (^_^!)
だったら、「いっそ分数とかもサポートしちゃったほうが
嬉しくね?」みたいな話はあっていい。
そうすれば (1 ÷ 3)× 3 = 1 になって、0.999999 …… を
四捨五入して 1 、みたいにスッキリする。
どうせなら代数的実数まで拡張して、e とか π みたいな超越数は
別扱いとか。そうすると、>>98 が言ってるように、
> 中間言語さえ充実させれば、後は『 Mathematica』で楽勝。
という感じになると思う。
「BAOBAB みたいな自然言語インタフェースの皮を被せりゃ
イケるんじゃねぇ?」と考えたこともあるんだが、中間言語を
考えると、出力はともかく入力が面倒臭いことになるんで
行き詰まってた。
だけど、「ユーザの入力は英語か日本語、システムの出力は
中間言語としての文語だが、文語を英語または日本語に変換する
システムはフロントエンドとして用意する。このフロントエンドが
英語または日本語の曖昧性を排除するように、ユーザの入力を
対話的に処理する」とかいった方法なら、ちょっと実現性が
見えてくる。
0105Maria
垢版 |
2018/09/20(木) 09:42:45.48ID:eE0U1qQD
>>101
「1足す1は?」
「汝は我に『[1+1]を評価(evaluate)せよ』と命じたるか」
「はい」
「 2 なり」
「 2 は偶数か?」
「然り」
「理由は?」
「汝は『ペアノの公準』を前提とした導出示せを命ずるか、
或いは『素因数分解の一意性』を仮定したる証明を示すによりて
足るか?」
「後のほうで十分」
「我、『素因数分解の一意性』を仮定したる証明を示さん。可なりや?」
「うん」
「2を素因数分解したる結果は、2を因数として含むなればなり」
「善哉(よきかな)、善哉」(←感染(うつ)ってる)
これくらいならイケそうな気はするんだけどね。
『モンティ・パイソン』の「頭の悪いタイピストが口述筆記する」
みたいなコトは避けられそうに思う。
0107デフォルトの名無しさん
垢版 |
2018/09/20(木) 10:03:23.39ID:Xjr6uCs9
>>106
俺はただパソコンに向かって独り言をプツプツ言って、チンボがシコシコしてるだけだが?
0108所長
垢版 |
2018/09/20(木) 11:49:39.95ID:eE0U1qQD
>>106
担当部署が違うんだよ。
自然言語処理を真面目にやろうと思うと、
アルゴリズム開発(「形態素解析はチャート法でなんとかなるのは
分かったが、探索戦略は どんな感じで組んだらいいのか?」)とか、
実装(可変長文字列を扱うとすれば Java あたりが適当なんだろうけど
云々)とか、辞書管理(これは辞書的に持ったらいいのかアルゴリズム
のほうで持ったほうがいいのか)とか、文法記述担当(出現頻度が高くて
不規則なものと、規則で処理できるから辞書でカバーしてもらうのと、
歴史的な事情があるらしいから別扱いしたほうがいいらしいのとの
切り分けと、みたいな)とか、いろいろ分担があるわけ。
0109所長
垢版 |
2018/09/20(木) 12:06:24.31ID:eE0U1qQD
そういえば、このスレに集ってる真面目なメンバーに訊きたいんだが、
漢語の音便についての、公開されている使用料フリーのデータベースって、
どっかにあるんかいな。
で、あったとするなら、その表現形式って、どんなもの なのか。そのあたりの
情報が知りたいんだが。
たとえば、「説得」だったら「せっとく」なんだが、本来の音としては
「せつ-とく」だろ? それが音便の結果として「せっとく」に
なってるわけじゃないか。
だったら、「{{説|せっ}{得|とく}(せつ-とく)}」みたいなデータとして
表現されててくれないと、自然言語処理を行う上では不自由だろ?
そういうデータは、自由に使えないと困るじゃないか。
「{蒲公英|たんぽぽ}(タンポポ/たんぽぽ/{{蒲/ほ}{公/こう}{英/えい}})」
でもいいと思う。ただし、XML で書かれたりすると、こんどは国語学とかを
やってる人には理解できないし、わかるように表示すると、こんどはデータを
いじるのが面倒臭いんだよな。
だったら、「日本語処理と国語学の橋渡しをするような、共通言語としての
なんかしらの言語(表現形式)」っつーのは、あっていいんじゃねぇの?
0110Mr.Moto
垢版 |
2018/09/20(木) 12:17:35.52ID:eE0U1qQD
たぶん Zipf の法則とかに絡んでくると思うんだが、
言語表現っていうのは「擦り減る」んだ。
つまり、「しょっちゅう使ってると、不規則化する」
んだよ。つーことは、「これ(不規則な表現)は
データで処理して、これ(規則的な表現)はアルゴリズムで
処理する。ただし、歴史的な事情があって、『出現頻度は
低いのに、不規則な形で残っているものがある』」っつー
コトなんだ。
で、そういうことに関するデータは共有しとこうぜ、って話。
0111Maria
垢版 |
2018/09/20(木) 13:27:23.43ID:eE0U1qQD
>>109
> このスレに集ってる
「集ってる」が「あつまってる」なのか「つどってる」なのかが
気になる自分がイヤといえばイヤかも、と思うけど、
そこは適宜「どっちですか?」とシステムが配慮してくれる
(つーか、IME のレベルで情報持ってるんだから
勝手に棄てじゃねーよ、と思うけど)のが
正解っていうモンじゃないの?
0112Mb
垢版 |
2018/09/20(木) 13:39:24.31ID:eE0U1qQD
>>107
「ラッダイト運動」という機械破壊運動がかつて存在し、それは
「産業革命にともなう機械使用の普及により、失業のおそれを
感じた手工業者・労働者が起こした。産業革命に対する反動とも、
後年の労働運動の先駆ともされる。機械所有の資本家には
憎悪の対象であったが、詩人には創作の霊感を与えた。」そうだけど、
「コンピュータ技術の発展にともなうパーソナル・コンピュータの使用と
AI 技術の普及により、失業のおそれを感じた労働者が起こした。
自然言語処理技術に対する反動とも、反コンピュータ運動の一部ともされる。
コンピュータ技術者には憎悪の対象であったが、『プロレタリアートの権利の
庇護者』を自称する左派リベラル運動家には反政府運動としてのテロ行為の
正当化の口実を与えた。」みたいなことになるんかな?
こんなマイナーなスレを荒らしてるヒマがあったら、グーグルに対して
「Google Home の販売をすぐさま中止しろ!」とか言ってくりゃいいのに、
と思う。
0113Mb
垢版 |
2018/09/20(木) 13:50:14.92ID:eE0U1qQD
>>95
> 現在のところ確認されている『素数』はここまで。
より厳密にいうと、「現時点で、実際に記述され、しかも
『素数である』ことが検証されている素数として知られている
ものは、50番めのメルセンヌ素数。」だ。
もっと大きな素数は定義できる(「素数は無限個ある」のが
古代ギリシャの時代に証明されている)が、今のところ、わざわざ
具体的に求めることのメリットが(ほぼ)ないから放ったらかされてる
だけだと思う。
0114デフォルトの名無しさん
垢版 |
2018/09/20(木) 14:04:07.52ID:U5cihaS9
なんという見にくい文章なんだ…
専門板特有のアレな人がここに居着いてしまったか
0115デフォルトの名無しさん
垢版 |
2018/09/20(木) 14:22:48.35ID:eE0U1qQD
>>114
>>57 をよく読め。
つーか、「見にくい」は連体修飾句だから、
主語は きさまだ。
「荒らし」呼ばわりされたくなかったら、
まず読解力を磨いてから出直してこい。
言いたいことがあるなら、せめてアンカーを附けろ。
0116デフォルトの名無しさん
垢版 |
2018/09/20(木) 14:46:12.15ID:U5cihaS9
>>115
ファーwwwwww安価付けてないのに反応してて草草の草ァ!!!
やっぱ自覚あるんすねぇ(笑)
0117デフォルトの名無しさん
垢版 |
2018/09/20(木) 15:34:02.12ID:2HjKrs3D
>>35
>死んだ鳥は飛ばないが、鳥は鳥だ。

小便を出さないチンボは、チンボとしての機能を果たしていないから、それはチンボと呼ぶに値しない!
0118デフォルトの名無しさん
垢版 |
2018/09/20(木) 15:36:37.71ID:wcfmqma2
>>5
>所有者の意思とは無関係に、勃起して「シコシコする」

チンボは必ず勃起する存在で、勃起しないチンボは、チンボと呼ぶに値しない!
0119Mb
垢版 |
2018/09/20(木) 16:15:02.06ID:eE0U1qQD
念のために言っておこう。
このスレは、『自然言語処理スレッド』だ。
日本語の文章は、ほぼ餌だぞ?
どっかの研究機関で、「電子掲示板における
荒らしの自動検出について」みたいな論文に
取りあげられて、自分が書いた文章が晒されても
自業自得なんだぞ?
「自分を大切にしてくれ」と、お願いしておこう。
0120デフォルトの名無しさん
垢版 |
2018/09/20(木) 16:34:15.99ID:eE0U1qQD
>>116
> ファーwwwwww安価付けてないのに反応してて草草の草ァ!!!
> やっぱ自覚あるんすねぇ(笑)
「ファーwwwwww」
→ 自然言語処理というか、精神病理の分野の対象と思われる。
「安価付けてないのに反応してて草草の草ァ!!!」
→ 「安価」は、「アンカー」(「錨(anchor)」の意)
という語を規定している権威に対する異議申し立てと考えうるが、
「なんとなく」感があるので、知性を感じられない。
「草草の草ァ!!!」という、論理的な応答を拒絶した
態度から、やはり自然言語処理よりも、精神病理の分野の
分析対象と思われる。
「やっぱ自覚あるんすねぇ(笑)」
→ 私は社会人であり、都市文化に対して敬意を持っているので、
社会秩序を尊重している。したがって、その意味では「自覚がある」
という認識はあり、その点に関して恥じるところなはいので、
なんら問題はない。私は文脈(その「文脈」という言葉を正確に
定義することができない自分を恥じるところはあるのだが)から
察するに、>>116 は反社会性パーソナリティ障害者であるという
であることを強く疑う。
ただし、それもまた精神病理の分野の対象と思われるが、
「その言説から、精神病理学的な予備診断を行う」という
ことは、自然言語処理の ひとつの応用として、興味深いものが
ある。
0121Mb
垢版 |
2018/09/20(木) 16:38:10.29ID:eE0U1qQD
>>117 >>118
> チンボと呼ぶに値しない!
おまえの価値観なんぞは、
科学技術とはなんの関係もねーんだよヴォケ。
0122デフォルトの名無しさん
垢版 |
2018/09/20(木) 21:26:09.65ID:iJVr7ybn
>>95
50番目のメルセンヌ素数より小さい素数がすべて求められているわけではないので…
というか、素数を小さい順に列挙しているサイトはありませんか?
0123デフォルトの名無しさん
垢版 |
2018/09/20(木) 21:57:04.42ID:PEguqjAD
>>98
>幾何も整数も、中間言語さえ充実させれば、後は『 Mathematica』で楽勝

Mathematica 7では,数列生成,変換,数列認識を含めた新しいレベルの系統だっ
た整数列解析を導入している.Wolfram Researchにおける最近のアルゴリズム的躍進によって,
数列要素のリストを取ってそれらに対して大きなクラスの閉形 Mathematica 式を系統的に求めることが初め
て可能になった.これで強固な整数列の認識が実験数学におけるプログラム的な発見のルーチン部分となった.
https://www.wolfram.com/mathematica/newin7/content/IntegerSequenceAnalysis/index.ja.html?footer=lang
0125デフォルトの名無しさん
垢版 |
2018/09/21(金) 01:30:25.71ID:TFbNiTND
>>124
>素数を小さい順に列挙するプログラム

そのままをインプットすればいいだけでは?
0126デフォルトの名無しさん
垢版 |
2018/09/21(金) 04:44:27.86ID:TFbNiTND
 物理においては、大学では数学の微分積分を駆使して問題を解くのが一般的だが、
高校では微分積分を使った解法は用いない。他の教科においても、大学と高校では教育内容がかけ離れてい
ることが多く、大学教員が無理に高校生に合わせて試験問題を作るためにミスが起きやすいとの指摘もある。
https://s.kyoto-np.jp/politics/article/20180201000207

高校履修範囲に合わせて入試問題を作成するのも苦労するのだと。
0127デフォルトの名無しさん
垢版 |
2018/09/21(金) 04:46:57.18ID:TFbNiTND
>>121
でも飛ばない飛行機は飛行機とは呼べないだろう? 燃えていない炎なんて有り得んだろう?
0128デフォルトの名無しさん
垢版 |
2018/09/21(金) 07:09:25.14ID:TFbNiTND
>>104
>このフロントエンドが英語または日本語の曖昧性を排除するように、

自然言語の解釈は、完璧なものには出来ない。中間言語は必ずしも完璧である必要は無い。

も しも下記の解説を本気で書いたならば「独りよがりな日本語の解釈を押し付ける所は,さすがだ!」
となります。いくらなんでも本気ではないと思いますが,出 題 を正当化するために書いたのならば
「苦しさは分かりますが,こんな論理で納得する訳がない!」が私の考えです。したがって,私の結論は,
この問題は大学の検証結果と異なり,「与えられた選択肢の中に正解がない。」となります。
また,入試問題においては,問題文がすべてであり,作者の意図を忖度することは不要です。
問題文が2通りに解釈できて,解釈により結論が異なれば,出題ミスであるとするのが常識です。
したがって,大阪大学が大学の解説のような意図で出題したとしても,問1は出題ミスであると断言できることになります。
http://www.geocities.jp/midarekazu/oosaka.html

>>13
> y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルづつ速度が上がる』

www
0129デフォルトの名無しさん
垢版 |
2018/09/21(金) 07:19:37.61ID:TFbNiTND
>>123
>強固な整数列の認識

『整数』『素数』『自然数』が問題文に与えられたら、その全てを列挙してしまうくらいでいい。
0130デフォルトの名無しさん
垢版 |
2018/09/21(金) 07:29:53.25ID:TFbNiTND
自然言語処理で今のところ最も困難極まりないのは、『中間言語の生成』であろう。

>「独りよがりな日本語の解釈を押し付ける所は,さすがだ!」

自然言語で書かれている文章をどう解釈するか、人間にだってわからない出題もされているくらいだから。
0131Mb
垢版 |
2018/09/21(金) 07:52:18.54ID:r2s4zPem
スレ違いだが、エラトステネスの篩とか使って
地道に計算するが吉。
0132Mr.Moto
垢版 |
2018/09/21(金) 08:30:50.58ID:r2s4zPem
>>127
> でも飛ばない飛行機は飛行機とは呼べないだろう?
試作機は飛ばしてみないと飛ぶか飛ばないかがわからんけど
いちおう「飛行機」の範疇に入るのが困ったところ。
少なくとも
・今現在飛んでいる
・過去に飛んだことがあり、着陸してここにある
・飛ばそうと思ったら、たぶんまた飛ぶだろう
あたりのものが「飛行機」で、墜落した飛行機の残骸は、
「かつて飛行機であったもの」であって、“飛行機”ではない、
という推論は間違っていないと思う。
> 燃えていない炎なんて有り得んだろう?
太陽のプロミネンスは燃焼してないけど、いちおう「炎」。
「炎のない燃焼」としては白金触媒によるベンジンの燃焼
(ハクキンカイロ)がある。

「物理的現実と言語表現との関係」はひとまず横に置いて、
「人間の内的な概念と言語表現との関係」について考える
のが、効率のよいアプローチだと思っている。
すなわち、「人工のキチガイを作っておいて、それを改造・
教育・治療することで、マトモな人間に近づける」という
アプローチ。
0133Mr.Moto
垢版 |
2018/09/21(金) 09:37:05.84ID:r2s4zPem
>>129
> 『整数』『素数』『自然数』が問題文に与えられたら、
> その全てを列挙してしまうくらいでいい。
現在のコンピュータの性能を考慮すると、それで
あらかたうまくいってボロが出ないだろうとは思うんだが、
筋を通すんだったら、「1は自然数」「自然数+自然数は
自然数」ってところから自然数の諸性質を証明して、
0 とマイナスの自然数から整数を定義して …… みたいな
形で持ってゆきたいな。
「1はなぜ素数ではないのか?」とか「0はなぜ自然数では
ないのか?」とかみたいな質問が出てきたときに、コンピュータが
どれだけ丁寧に答えられるか、というところに興味があるし、
それぞれ別のアプローチで初等整数論を教えたコンピュータを
相互学習(必ずしも自然言語を経由させなくてもいい)させたら
何が起きるか?とかは、かなり興味深い。
0134デフォルトの名無しさん
垢版 |
2018/09/21(金) 10:42:10.68ID:NW3l5rZR
>>132
>太陽のプロミネンスは燃焼してないけど、

太陽は燃えている
Love Me With All Of Your Heart/Engelbert Humperdinck
https://m.youtube.com/watch?v=tjTCD-_ItHs
0135デフォルトの名無しさん
垢版 |
2018/09/21(金) 12:18:18.34ID:r2s4zPem
よく考えたら、日本語処理(当然のことながら、
自然言語処理の一部だ)技術者というのは、
単に社会的に冷遇されているだけではなく、
法的にも保護されていない。
このあたりの話は、広く世の中に伝えておいたほうが、
いいような気がする。
とはいえ、このあたりの話は『プログラム技術板』ではなく、
『プログラマ板(マ板)』で議論するのが筋だと思うので、
そっちの方に「日本語処理技術者の憂鬱」みたいな
スレを立てるというのはどうだろうか。
0138デフォルトの名無しさん
垢版 |
2018/09/21(金) 21:18:12.58ID:r2s4zPem
>>137
句読点が普及したのは、たぶん江戸後期あたりからだと
思うんだが、あんたは鎌倉・室町時代あたりの生まれなんだな?
あんたのおじいちゃんの時代に句読点があったというのを
文献・史料で示してくれるとありがたい。
あんたのおじいちゃんの時代だとすると、
『大鏡』あたりの平安時代とか、そういう頃
の生まれなんだよな?
花山天皇とか、安倍晴明とか、いろいろ聞きたい
ことがあるんで、ぜひ質問に答えてくれ。頼む m(_ _)m
0139デフォルトの名無しさん
垢版 |
2018/09/21(金) 21:30:46.68ID:qgyq16h9
気に障ったならもうしわけない
句読点が多いと読みづらいとだけ伝えておこう

読みやすさを犠牲にしてまで句読点を打とうと言うのは何かしら理由があるんだろうけど
0140デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:12:05.82ID:I+GiteTA
>>139
句読点を使ってやたら長々とぶつ切りで書かれた下手な文章は、俺も読みにくいと思う。

それとは別に、ネットとかで句読点を使わないのが普通だみたいな風潮があるけど、それには賛同できないな。
特にスマホで見てると横幅が狭いから、文末の改行がちょうど画面端に来て次の行との区切りが判別できないこともあるし。
0141デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:19:58.59ID:r2s4zPem
>>139
> 読みやすさを犠牲にしてまで句読点を打とうと言うのは
> 何かしら理由があるんだろうけど
つーか、“読みやすさ” を重視した結果が、句点・読点とか
括弧とか感嘆符とか疑問符なんだが。
で、文章の構造(解析木)を明示的に示すために括弧を使うと
うざったらしい(←これは方言かもしれん)ので、「読点( ‘、’ )」
というものが使われたという経緯があるのだ。
大類 雅敏『そこに句読点を打て!』(一九七六)という本も
あるのだぞ?
0142Mr.Moto
垢版 |
2018/09/21(金) 22:31:54.14ID:r2s4zPem
>>140
いや、言うたらなんやけど、句点はともかくも(改行でなんとかなる)、
読点や括弧は適切に入ってないと、“目が滑る” 感じがする。
『句読点を使ってやたら長々とぶつ切りで書かれた下手な文章は、
俺も読みにくいと思う。
それとは別に、ネットとかで句読点を使わないのが
普通だみたいな風潮があるけど、それには賛同できないな。
特にスマホで見てると横幅が狭いから、文末の改行が
ちょうど画面端に来て次の行との区切りが判別できない
こともあるし。』も、
『句読点を使って、やたら長々とぶつ切りで書かれた下手な文章は、
俺も読みにくいと思う。
それとは別に、ネットとかで「句読点を使わないのが
普通だ」みたいな風潮があるけど、それには賛同できないな。
特にスマホで見てると、横幅が狭いから、文末の改行が
ちょうど画面端に来て、次の行との区切りが判別できない
こともあるし。』くらいに切ったほうが読みやすいように
思うんだが、これは世代の差なのかな? それともスマホ
で読んでると、改行禁則とか いろいろ面倒臭い話があるんで
また別のルールがあるんかな?
おれは読みやすさに配慮して(和欧混植の文章とかもあるんで)
半角スペースを入れたりしてるんだが、そのあたりについての
意見も聞きたいと思う。
0143デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:42:24.73ID:qgyq16h9
>>141

>>133を読み返してほしい
駄文の典型例だと思う
、を使って長々とつづけた文が二つだけ
こんなに読みづらいレスはやめてほしい
0144デフォルトの名無しさん
垢版 |
2018/09/21(金) 22:52:40.08ID:qgyq16h9
そうなると、「
それとは別に、

これらの読点は間違いなく不要
このスレを「と、」検索してみて思ったのは大体の と の後の読点はいらない
0145デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:18:19.78ID:I+GiteTA
>>142
世代の差でもスマホ固有の問題でもなく、あなた個人の感性とか資質、恐らく脳の働きの問題かと思うよ。

俺は自分の文章が上手いと思い上がるつもりはないが、新聞なり市販の書籍なりのまっとうな文章は、あなたの書いているぶつ切りの文章ではなく俺の文章の方がより近いはず。
そこまでぶつ切りに書かれてなくても、普通の人は頭の中で自然に無意識に構文解析して読み解けているよ。

>>106のコテハン使い分けは別人格設定なのという質問に別部署だからと回答していたけど、同一人物であることを否定しているということかな。
ここまで独特の感性で同じ特徴をもつ文章を書かれると、とても別人によるものとは思えない。

自然言語処理やってますとはいうけれど、どちらかと言えば不自然言語処理なのではないだろうか?
0146デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:36:16.24ID:tLJHZkGc
>>145
>ここまで独特の感性で同じ特徴をもつ文章を書かれると、とても別人によるものとは思えない。

ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか?

チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。

オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。

違うか?

「胸がドキドキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!
0147デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:43:15.25ID:tLJHZkGc
>>132
>「物理的現実と言語表現との関係」はひとまず横に置いて、
>「人間の内的な概念と言語表現との関係」について考える

前者はシミュレーション(>>30)を使えば何とかなるが、後者についてはどうていいのかわからない。
人間の内的な概念なんて自分でも何がなんだかわからない、それは『阿頼耶識』とも言われているくらい。
0148デフォルトの名無しさん
垢版 |
2018/09/21(金) 23:49:43.70ID:tLJHZkGc
>>128
>入試問題においては,問題文がすべてであり,作者の意図を忖度することは不要です。

言葉に出ていない作者の意図を忖度するなんて、それでは『阿頼耶識』の研究が必要になってくるよな。
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況