X



自然言語処理スレッド その4

■ このスレッドは過去ログ倉庫に格納されています
0001デフォルトの名無しさん
垢版 |
2014/06/03(火) 05:40:00.54ID:yefNLumx
前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
0441デフォルトの名無しさん
垢版 |
2017/05/08(月) 12:37:00.42ID:vY0SYpKn
>>391
>和田秀樹の黒塗り教科書、二冊用意して一冊を塗り潰す、

 先行研究として、Kanayamaら [1]およびKobayashi
ら [2] によるセンター試験「世界史」の自動解答シス
テムがある。これらの研究では、選択肢中のキーワー
ドを一つずつ隠し、隠した語を問う factoid 問題に対
するシステムの解答を隠した語と比較することで誤り
を検出する手法を用いている。
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/C7-3.pdf
0442デフォルトの名無しさん
垢版 |
2017/05/08(月) 16:29:03.69ID:b93vRxrz
深層学習を駆使し辞書無しで日本語分かち書きできるライブラリはやく作ってください
人間に出来るのだから余裕だろ?
0447デフォルトの名無しさん
垢版 |
2017/05/10(水) 14:36:25.96ID:Kj7x3S1t
回転放物面の方程式と東大の問題
http://mathtrain.jp/kaitenhobutsu

「放物線 y = 3/4 - x^2」

「y軸の回りに回転させる」

・・・例えば、こういう操作ができる3次元CADって開発されてないんですか?

統計的機械翻訳では自然言語処理は無理という話も聞いているけれど、高校数学でやることは内容が限られており、
一般的な機械翻訳よりは難易度は低いと思われます。
0449デフォルトの名無しさん
垢版 |
2017/05/20(土) 10:09:44.32ID:RV6Qdphw
>>143
>線分QTと線分QRの関係を求めるのに、どの線が必要で、どの線が不要なのか。
>また必要な線が無い場合は、点と点同士を結んだり線分を延長させたりして、補助線を引く。
>計算力にモノを言わせて、しらみつぶしに全ての場合を調べつくすというやり方もある。

音楽より画像処理の方が凄いな。ディープラーニングで画像補完。
フォトショでCG加工や写真補正をチマチマやる必要のないレベルに来てる。
そのうちディープラーニングで自動作曲とか出てきそう。

画像を塗りつぶした部分に一瞬で自然な画像を補完する技術を早稲田大学の研究者が開発
http://gigazine.net/news/20170501-globally-locally-consistent-image-completion/
0450デフォルトの名無しさん
垢版 |
2017/05/20(土) 21:53:06.95ID:rcfMwuXb
ちなみにこれが機械学習で機械が作った寝室の画像

もちろん現実のどこにも存在しない、機械が学習した「寝室」の概念画像

遠くから見ると普通に寝室の写真に見えるが、よーく見るとちょっとおかしいことに気づくと思う

http://blog.aylien.com/wp-content/uploads/2016/08/gan-samples-1.png

ってか、既存のGANでも機械にエロ画像の概念を学習させることはできるんだよな
やってみようかな

匿名でやらないと頭硬い奴らに訴えられて面倒なことになりそうだが
0452デフォルトの名無しさん
垢版 |
2017/05/21(日) 00:11:37.70ID:S5rss42C
>>451
自然言語処理にも画像理解やシミュレーションが必要なのでは?
0453デフォルトの名無しさん
垢版 |
2017/05/21(日) 00:14:45.81ID:S5rss42C
画像理解技術が進歩すれば、東大物理も満点近く取れると思う。

>>136
>次にBの図ろ考えると、点線が途中までになっていて、「何かが入っている箱」と考えられる。

>>449
>画像を塗りつぶした部分に一瞬で自然な画像を補完する技術を早稲田大学の研究者が開発
0454デフォルトの名無しさん
垢版 |
2017/05/21(日) 00:28:19.74ID:eegh9j+G
>>452
東ロボみたいなセンター問題回答に物理シミュレーションが使えるのでは? っていうアイデアならまだ理解できるけど、それはもう自然言語処理じゃないだろ
まあいいけど
0455デフォルトの名無しさん
垢版 |
2017/05/21(日) 00:32:02.89ID:eegh9j+G
ディープラーニングは大量のデータから特徴を抽出して確率的に生成するんだから、問題文中の図を補完するなら大量の過去問が必要だろう。
しかし過去問はスモールデータだからなぁ
0456デフォルトの名無しさん
垢版 |
2017/05/23(火) 05:12:53.15ID:BN0kPFXk
確率の問題はまだ当分無理と思われる。一度には読み込めないからまず小さな文節に区切って、
何が何のことを指しているのかを把握しなければならない。

コンピューターの画面に、(※※)
記号○と×のいずれかを(記号〇と記号×は2つに一つで「背反」である)
表示させる(※)
操作をくり返し行う。(k回繰り返す)

このとき、(どんな時?)
各操作で、(「記号○と×のいずれかを」「表示させる操作」を「k回繰り返す」。)
直前の記号と(「k回の各操作」において)
同じ記号を(○か×か)
続けて表示する確率は、(・・・○〇・・・または・・・××・・・)
それまでの過程に(k回の各操作全てにおいて)
関係なく、(一定である)
pであるとする。(確率は0<p<1)

最初に、(k=1において)
コンピュータの画面に(※※)
記号×が
表示された。(※)
操作をくり返し行い、(k回繰り返す)
記号×が
最初のものも含めて(k=1のものも含めて)
3個出る(×・・・×・・・×、×××、××・・・×、×・・・××)
よりも前に(×・・・×・・・、××、××・・・、×・・・×)、
記号○がn個出る確率をPnとする。
http://math.nakaken88.com/problem/tokyo-u-r-2006-2/
0457デフォルトの名無しさん
垢版 |
2017/05/23(火) 08:39:25.38ID:BN0kPFXk
>>282
>RDFトリプルセットは「連想・推論」に利用できるので、人力でRDF辞典を作成しておきたい。

RDFDNN において, 予測失敗を以上の 4 種類に分けてカウ
ントを行ったところ表 2 のようになった. 訓練データの中から
RDFDNN が予測に失敗したトリプルを無作為に 100 個サン
プリングし人手でカウントを行った.
表 2 のとおり最も多かった予測失敗はタイプ A である. A の
例としては,”Leslie Dilley”と”レイダース 失われたアーク”
の関係予測において, 正しくは”アートディレクター”であると
ころを”出演者”と予測した例が挙げられる. この例の場合, 人
間と映画の間に張られる関係の中で”出演俳優”という関係が
最も多いために”出演俳優”と間違った予測をしたと考えられ
る. このように RDFDNN の予測失敗 100 個のうち A,B,C の
68 個の間違いには何らかの妥当性があった.

https://kaigi.org/jsai/webprogram/2017/pdf/718.pdf
0458デフォルトの名無しさん
垢版 |
2017/05/23(火) 16:39:02.27ID:BN0kPFXk
y=x^2 のグラフを x 軸方向に 2 だけ平行移動し,
それをx軸に関して対称移動したグラフを求めよ.
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D5-1.pdf

y=x^2

グラフ

x 軸方向

2
だけ
平行移動


それ

x軸

関して
対称移動
した
グラフ

求めよ



このように全ての単語と助詞を「オブジェクト」に分解し、かつその「多態性」を分析し、然る後に形式変換すべきだと思う。
0459デフォルトの名無しさん
垢版 |
2017/05/23(火) 17:09:27.18ID:BN0kPFXk
[ 2017年03月13日 - 00:40 ]
【数学の大学入試問題、被りすぎやろ(2017年入試)】
■ 1993年和歌山県立医科大医学部医学科→1994年京大理系数学(後期)→2016年東大理系→
2017年杏林大医学部医学科の巴戦の確率の極限の問題(まったく同じ問題で難問)
2000年東工大→2017年上智大理工の立体の側面積の最大、最小問題(東工大の問題に丁寧な誘導を付けて標準レベルにした問題)
1977年千葉大文系数学→2017年早稲田大理工の漸化式で表された数列の和をニ項定理をつかって考察する問題(全く同じ。やや難レベル)
2006年早稲田大理工→2017年早稲田大理工の3次方程式の解が三角関数で循環することを論証する問題(全く同じ。難問)
1999年名古屋市立大医学部と2001年東京農工大前期試験を合わせた問題→2017年早稲田大理工の複素数平面上の直線公式の導き出し、
複素数平面上の任意の点が複素数平面上の三角形の周及び内部にある存在条件を図示する問題(存在条件を複素数平面上に図示するのが難しい)
1986年東大文系数学→2016年同志社大全学入試文系→2017年東大理系数学の置き換えを利用して三角関数から2次関数に帰着して最大、
最小を求める問題(文系の問題が東大理系で出題されるのか・・・基本レベル)
1993年上智大理工学部→2017年東大文理共通の平面上のランダムウォークの確率の問題(反復試行の確率に帰着する問題。標準レベル)
2013年大阪大理系→2017年東大理系の円錐をy軸で回転してできる立体の体積を求める問題。一様多面体の円錐曲線を背景にした問題。
(大阪大の問題に誘導をつけ、阪大より易しくした問題だがやや難レベル)
2005年お茶の水女子大理学部→2017年東大理系の2つの放物線の共通接線の本数問題。(お茶の水女子大の問題から共通接線が
引ける本数の条件を変えた問題。標準レベル)
1999年名古屋市立大医学部→2017年東大理系数学の複素数平面上の任意の点が複素数平面上の三角形の周及び内部にある存在条件
を図示する問題(早稲田大理工に数値を変えただけ。早稲田大理工よりは存在条件を複素数平面上に図示するのは易しい。標準レベル)
<以下略>
http://www.fuoriclasse2.com/cgi-bin/read.cgi?2017-03-13004037
0462デフォルトの名無しさん
垢版 |
2017/07/04(火) 03:55:25.73ID:NogRrZwu
 機械翻訳事業を手掛けるみらい翻訳が、深層学習技術を用いたニューラル機械翻訳エンジンを発表した。
現在、同社のサイトでデモが体験可能になっている。
 これは同社と国立研究開発法人情報通信研究機構(NICT)との共同研究によるもので、
深層学習技術の導入により、従来の統計的機械翻訳に比べて翻訳精度が大幅に向上していることが特徴。
対象となるのは日英双方向の翻訳で、なかでも和文英訳においては「TOEIC900点程度
のスコアを持つビジネスマンと同等以上の作文能力があることを確認」できたとアピールしている。
これらを搭載した企業向け翻訳アプリケーションサービスを本年11月から提供するとしているが、現在、
同社のサイトで「お試し翻訳」と称する無料版が利用できるようになっているほか、
共同開発を行ったNICTでは、Android/iOS向け音声翻訳アプリ「VoiceTra(ボイストラ)」
において同日付でこの技術を組み込んでいる。気になる人はまずは、こちらを試してみるとよさそうだ。

お試し翻訳(みらい翻訳)
https://www.miraitranslate.com/index.php#txt-t
TOEIC900点以上の英作文能力を持つ 深層学習による機械翻訳エンジンをリリース(みらい翻訳)
https://miraitranslate.com/news/313
ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現(NICT)
http://www.nict.go.jp/press/2017/06/28-1.html
http://internet.watch.impress.co.jp/docs/yajiuma/1067830.html
0463デフォルトの名無しさん
垢版 |
2017/07/04(火) 04:20:24.35ID:8q3gEZqY
【大発見】おいwww3の倍数じゃない奇数を思い浮かべて2乗してから1引いてみろwwww絶対に24で割りきれるぞwwwww
0468デフォルトの名無しさん
垢版 |
2017/09/17(日) 21:31:26.60ID:kSa7kRax
ねえ?
0470デフォルトの名無しさん
垢版 |
2018/03/09(金) 22:58:34.64ID:GTHolLBp
これ翻訳できる?
なんでみんな笑っているかわからん
Topic modelの授業の冒頭
I'm from Princeton in New Jersey where it's four o'clock in the morning.
(笑)
教えてくれ
0471デフォルトの名無しさん
垢版 |
2018/03/10(土) 01:12:32.33ID:uUYTpCvs
>>470
たいへん。壺魔人がトイレから出てこない。
改札通れないんだと思う。

って言ってる。
0472デフォルトの名無しさん
垢版 |
2018/03/10(土) 01:49:36.91ID:xzUBTHi1
↑全然おもろない
阿保丸出し
0474デフォルトの名無しさん
垢版 |
2018/03/15(木) 17:51:17.69ID:8tnce99v
新井紀子教授はすごくなかった
『新井紀子教授は研究者としてすごい』とタイトルにありますが、
皮肉で書いたわけではなく、本当にすごいと思っていました。
宣伝を大きくして予算を確保するということができる研究者は多くありません。
私も研究の世界にいたのでわかるのですが、いろいろと疑問のあるプロジェクトというのはよくあることで、
新井紀子教授の場合は宣伝が上手いゆえに、悪目立ちして損をしている部分はあると思います。
そして、そもそも個人攻撃は私の意図したところではありません。
https://mywarstory.tokyo/our-enemy/
0475デフォルトの名無しさん
垢版 |
2018/03/15(木) 18:11:41.15ID:8tnce99v
新井紀子教授のAIやコンピュータに関する知識は素人に毛が生えた程度
新井紀子教授の『AI vs. 教科書が読めない子どもたち』という本が大変売れているようです。
私も本を購入し精読させていただきました。
一言で感想を言うと、新井紀子教授のAI技術に関する知識はせいぜいAI関連ニュースに詳しい人レベルであり、
そのベースであるコンピュータに関する知識もほぼ素人だということがわかりました。
https://mywarstory.tokyo/inconvenient-truth/
0476デフォルトの名無しさん
垢版 |
2018/03/15(木) 21:50:00.22ID:8tnce99v
新井紀子教授はUniversity of Illinois Urbana-Champaignから1985年に数学の学士を授与された後、
博士課程に5年間在籍しているのにもかかわらず、1990年に修士号だけ授与されて退学しているようなので、
数学はあまり得意でないのかもしれません。
しかしそれにもかかわらずこれだけ世間をにぎわせていることは、能力よりも宣伝力の方が世間
に対するインパクトが大きいことを示していると思います。
https://mywarstory.tokyo/being-employed-is-easy/
0478デフォルトの名無しさん
垢版 |
2018/03/19(月) 10:56:01.35ID:N8hV/6aX
初歩の整数論プログラミング
https://www.saoyagi2.net/integer/

整数問題を解答するプログラムも造っておきたい。
0480デフォルトの名無しさん
垢版 |
2018/03/19(月) 13:27:48.98ID:pEbY2e08
>>476
途中までしか読んでいないけど、「現在の社会は人間のために作られていて、機械にとって優しくない。これはAI差別でなかろうか」という視点はどうでしょうか。
0481デフォルトの名無しさん
垢版 |
2018/03/21(水) 20:30:25.43ID:QInlrutD
チンボがシコシコする!
0482デフォルトの名無しさん
垢版 |
2018/03/22(木) 01:02:52.70ID:Z1JBGYGJ
チンボがシコシコする!
0483デフォルトの名無しさん
垢版 |
2018/03/22(木) 04:56:52.06ID:HWN7MKDU
チンボがシコシコする!
0484デフォルトの名無しさん
垢版 |
2018/03/23(金) 21:35:06.73ID:BM3HBGyY
自然科学、特に変化の速い人工知能関連の分野で日本語で最新の情報を得ようとしても限界があるので、
自分で英語の論文を読む以外のいい方法はないと思います。(無料です。)
こちらから気になるワードで検索してみてください。
自然科学の基礎研究に関して議論するのに適した場所は知りませんが、まずはQuoraかredditあたりで同じ質問をしてみてはいかがでしょうか?
Quoraはとても親切な人が多いので、丁寧に教えてもらえると思います。
https://mywarstory.tokyo/qa40/
0485デフォルトの名無しさん
垢版 |
2018/03/24(土) 22:53:15.70ID:6mZ6T11K
(第1章 はじめに 2頁)
たとえば、CycはFredという名前の男が朝にひげをそるという話が理解できなかった。
Cycの推論エンジンは、この話の中に矛盾を見つけた。Cycは人間には電気の部品がないことは知っているが、
Fredが電気カミソリを持っていたので、エンティティ「Fredがひげそり中(FredWhileShaving)」
には電気の部品が含まれていると考えた。したがって、CycはFredがひげをそっている間、
Fredはそれでも人間なのかと尋ねた。

『深層学習』
著者:
Ian Goodfellow, イアングッドフェロー,
Yoshua Bengio, ヨシュアベンジオ,
Aaron Courville, アーロンカービル
0487デフォルトの名無しさん
垢版 |
2018/03/24(土) 22:55:30.16ID:6mZ6T11K
ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか?

チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。

オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。

違うか?

「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!
0488デフォルトの名無しさん
垢版 |
2018/03/25(日) 01:03:31.88ID:26j2IyXZ
「舌がピリピリする」みたいな
身体の受動的感覚なら文法的に可

「顔がニコニコする」みたいに
動作主体が人間なら不可
0490デフォルトの名無しさん
垢版 |
2018/03/25(日) 14:43:19.66ID:iTHR6DDw
自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては?
https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7
0491デフォルトの名無しさん
垢版 |
2018/03/25(日) 16:31:05.25ID:qleen6XJ
>>490
そこのリンク先
URL直接貼れんけど
コメントわろた
0492デフォルトの名無しさん
垢版 |
2018/03/25(日) 22:51:24.22ID:26j2IyXZ
>>490
何がしたいのか不明確だが
UIを自然言語にするだけなら昔からある
コマンド入力型ADVゲームとかな
0493デフォルトの名無しさん
垢版 |
2018/03/26(月) 01:29:09.56ID:FVXYqf1L
>>492
>コマンド入力型ADVゲームとかな

コマンドではなくて、50字以上100文字以下の、主語と述語と目的語と修飾語を含む自然言語文で。
0494デフォルトの名無しさん
垢版 |
2018/03/26(月) 03:16:49.02ID:1pM3oPKs
この質問されてるyu.とかいう人はそもそも何者なんだよ
twitterのプロフにPh.dと書くだけなら誰にでもできる
0496デフォルトの名無しさん
垢版 |
2018/03/26(月) 06:35:12.71ID:QR480mqW
コンピューターのための自然言語理解シミュレ
ーターというのは可能ですか?

例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。
0497デフォルトの名無しさん
垢版 |
2018/03/26(月) 20:51:09.10ID:tuciBVy7
残念だが人間と完全に同等のレベルで
自然言語を理解するのは現時点では不可能
人工無能を改良して上手く使っていくしかない
0498デフォルトの名無しさん
垢版 |
2018/03/28(水) 06:05:44.86ID:KZCr/n70
        ||
        ||
      ∧||∧   
     ( / ⌒ヽ
      | |   |
      ∪ / ノ
       | ||
       ∪∪

      -━━-
0500デフォルトの名無しさん
垢版 |
2018/04/11(水) 14:17:19.53ID:XeDgccB8
チンボがシコシコする!
0501デフォルトの名無しさん
垢版 |
2018/05/12(土) 10:59:50.86ID:pDgCeBjY
共同ツール 1
https://seleck.cc/685

https://trello.com/
ボードのメニュー → Power-Upsから拡張可能 Slack DropBoxなど
Trello Chrome拡張機能 elegant
ttp://www.kikakulabo.com/service-eft/
trelloのオープンソースあり

共同ツール 2
https://www.google.com/intl/ja_jp/sheets/about/

共同ツール 3
https://slack.com/intl/ja-jp
https://www.dropbox.com/ja/
https://bitbucket.org/
https://ja.atlassian.com/software/sourcetree
https://sketchapp.com/extensions/plugins/
ttp://photoshopvip.net/103903

ttps://goodpatch.com/blog/sketch-plugins/
0502デフォルトの名無しさん
垢版 |
2018/05/23(水) 19:52:19.56ID:Au5e7VGg
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

2OND8
0504デフォルトの名無しさん
垢版 |
2018/06/26(火) 00:19:49.53ID:suPxm0NB
冒険者の広場では提案広場・あしあと伝言板にて言論規制がしかれている。
提案広場では主にスクエニに対して不利になるような発言
WiiUで発売してすぐ、ウィンドウズ版では出さないといっておきながら
発売を発表、それにより広場は荒れたものの、超速で削除。
両手剣スレイプニールのチート問題、これもチート行為は絶対にないと
いいきってからの問題発覚、これも荒れて超速削除。
他全年齢対象のためちょっとでも卑猥と感じる内容は削除
ネタバレと書かなければ、ネタバレと思われるものは削除
これについては運営側がネタバレと加筆すればいいだけの話だと思うけど。
あしあと伝言板は悪口と思われる内容の言葉が含まれていれば
自動で削除される。
この装備イカす→カス
ちょっとバカンスに行ってきます→バカ
パチンコばっかりいってた→チンコ
どう考えても冤罪削除。しかも累積すると冒険者の広場利用停止。
横暴。
ちなみに冤罪削除を訴えた発言も削除される。
異議申し立ても悪だというらしい。
サポートセンターに問い合わせたところ、調べてもくれなかった。
https://ameblo.jp/cinnamon-rilakkuma/entry-12317442377.html
0505デフォルトの名無しさん
垢版 |
2018/07/04(水) 22:07:34.62ID:gFgZc5FG
5UX
0508Mb
垢版 |
2018/07/16(月) 06:02:54.03ID:RFTF6J3p
省略のある文を構文解析するときに、
あらかじめ「省略がある」と解っている場合は
いいんだが、文法が間違ってて「ないはずの省略が
あることになってしまっている」場合は
ややこしい話になりそうに思う。
「すごく面白い」は「省略なし」で「すごく」が
「面白い」にかかるんだが、「すごい面白い」だと、
構文解析木自体が変わってきてしまう。
それとも、「解析木自体が違う」と認識して、
もっと上位の意味解析とかで処理するほうが
いいのかね?
0509Mb
垢版 |
2018/07/16(月) 06:18:39.78ID:RFTF6J3p
逆に、誤用とか慣用として、辞書レベルで処理しちゃったほうが
実用上は便利なのかね?
「そうすべきだ」なんていうのは、構造としては、
「そうするべきことだ」のはずなんだが、
「××する」みたいな附属語的な用法や、「漢字一字+s」
の形の五段活用動詞の連体形の変化形とは違って、単独の
「する」の連体形が「す」として使われる例はあんまりない
(文語じゃねぇんだから)。
で、「べき」は連体形だから、助動詞「だ/です/である」に
接続する場合は、本来は間に体言が入らないとおかしい。
でなかったら、「べし」と命令形にしちゃうのが文法的には
正だろう。
こういうのは、処理の観点からいうと、どう扱ったらいいのかね?
0511Mb
垢版 |
2018/07/16(月) 08:41:11.73ID:RFTF6J3p
>>510
それは、「おれは好きにするからユーザは文句言うな」
なのか、「ユーザが好きに処理できるように、アプリに
自由度を持たせろ」なのか。
0512Mb
垢版 |
2018/07/16(月) 08:48:33.94ID:RFTF6J3p
そもそも、「人間のチェックには漏れがある」から
「コンピュータにチェックさせる」のが本筋なのに、
「コンピュータの解析精度が低いから、人間が
処理結果をチェックしないといけない」というのが
本末転倒だ。
標準表記外音は『常用漢字表』(昭和56内閣告示)によれば、
「時」には「と」の音はないため、「時計」を「とけい」と読むと
表記外になるとか、「日」には「に」の音はないため、「日本」を
「にほん」と読むと表記外となるとか、そんなの人間がチェックしたら
見落とすに決まってるだろ。
「じゃあ、他にはそういう例があるのか?」とかいったデータくらい、
ちゃんと用意してどっかに公開しておけというのだ。
0513Mb
垢版 |
2018/07/16(月) 11:05:42.72ID:RFTF6J3p
だいたい、中学校で
「活用するのが『用言』で、活用しないのが『体言』」とか
教えてるくせに、
天(あめ→あま)
天日嗣(あまつひつぎ)・天津日嗣(あまつひつぎ)・天照大神(あまてらすおおみかみ)・天の川(あまのがわ)・天水(あまみず)
雨(あめ→あま)
雨足(あまあし)・雨脚(あまあし)・雨蛙(あまがえる)・雨傘(あまがさ)
・雨具(あまぐ)・雨乞い(あまごい)・雨水(あまみず)・雨漏り(あまもり)
雨(あめ→さめ)
秋雨(あきさめ)・霧雨(きりさめ)・小雨(こさめ)・細雨(ささめ)
・春雨(はるさめ)・氷雨(ひさめ)・村雨(むらさめ)
とかいうのはどう説明したらいいんだよ。
「日本語処理の技術者は、中学校レベルの文法知識も持っていない」って、
中学校で教えるのかよ。
で、高校受験や大学受験で、「本当のこと」を主張したら減点されて
不合格のリスクを負うのか?
それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。
0514デフォルトの名無しさん
垢版 |
2018/07/16(月) 11:21:56.62ID:Tl1DHPio
>「活用するのが『用言』で、活用しないのが『体言』」とか
>教えてるくせに、

ええぇぇぇっ
0515Mb
垢版 |
2018/07/16(月) 11:36:38.15ID:RFTF6J3p
>>514
> ええぇぇぇっ
いや、ここは驚くとこじゃねぇだろう。
中学二年で習う「文法」だと、
まず「自立語」と「附属語」の区別があって、
自立語のうち「その役割によって形を変える語」を
「用言」といい、「形を変えない語」を「体言」というと、
しっかり教科書に書いてある。
だもんだから、教師はそれを信じてテストの問題を作り、
それに「教師が正しいと思った解答」を書かなかった
児童・生徒は成績評価が低くなる。
で、「それはおかしいんじゃないですか?」とかいって
文句をつける保護者は、「モンスター・ペアレント」として
扱われる。

めでてぇな。
0516デフォルトの名無しさん
垢版 |
2018/07/16(月) 11:36:41.25ID:1RDPQ2ba
最近少し興味を持った初心者なのですが、
2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で処理されるのですか?

例えば、

>それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。

おまいら自然言語処理をやっている人間は、それっておかしいとは思わんのか。

あなた方の様に自然言語の処理を行う人達は、「それはおかしい」と思わないのですか?
0517デフォルトの名無しさん
垢版 |
2018/07/16(月) 11:54:52.76ID:KKQqxuup
>>515
その「教え方(ほんとなら)」に驚いてるんじゃなくて

>>513 の認識に驚いてる
0518デフォルトの名無しさん
垢版 |
2018/07/16(月) 12:10:49.45ID:LulkQD8r
しょせんは人が決めた分類なんで従うしかない

って書こうとしたけど
漢字って単語のさらに一部分で雨水はいつだってあまみずだから
雨水を単語として分類するとき体言にするのはべつに間違ってないような

https://kotobank.jp/word/%E4%BD%93%E8%A8%80-91058
定義もっとこまかかった最初の前提からちがう
0519Mb
垢版 |
2018/07/16(月) 12:54:56.73ID:RFTF6J3p
>>518
> 漢字って単語のさらに一部分で雨水はいつだって「あまみず」だから
 開く(あく/ひらく)
 開ける(あける/ひらける)
 温める(あたためる/あっためる/ぬくめる)
 暖める(あたためる/あっためる)
 温まる(あたたまる/ぬくまる)
 言う・謂う・云う(いう/ゆう)
 怒る(いかる/おこる)
 行く・逝く・往く(いく/ゆく)
 射殺した(いころした/しゃさつした)
 抱く(いだく/だく)
 行った(いった/おこなった)
 出し((文)いでし/(現)だし/(文)でし)
 居る(いる/×おる)
 入る(いる/はいる)・入れない(いれない/はいれない)
 得る(うる/える)
(以下、規制に引っかかるので省略)
「雨水溝」は、「うすいこう」なのよ。
0520Mb
垢版 |
2018/07/16(月) 13:03:08.07ID:RFTF6J3p
>>516
> 2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で
> 処理されるのですか?
いや、普通に処理してるけど?
「文法格の一意性」とか「非交差則」とかで説明できるんだけど。
ただ、「処理の結果が気にくわない!」って言ってる、自然言語処理
分野のヒトが邪魔してるだけだし。文語文法とかの研究者は、
「使えるツールがあれば欲しい」っていう要望があるんだけど。
そのあたりは早稲田大学の文理学部の筧先生とかに嘆願してね。
0521Mb
垢版 |
2018/07/16(月) 13:08:49.98ID:RFTF6J3p
>>518
「の」とか「ん」で表される、いわゆる「準体助詞」は
主語にならないから体言じゃないんだな?
0522Mb
垢版 |
2018/07/16(月) 13:12:52.10ID:RFTF6J3p
>>516
そのあたりは運用上の意味論がある。
わりと有名な例だが、
「てめぇは馬鹿か?」は通るが、
「あなたは知恵遅れではありませんか?」と
言ったら、血の雨が降る。
0523Mb
垢版 |
2018/07/16(月) 13:16:06.01ID:RFTF6J3p
慣用・誤用、あるいはいわゆる“百姓読み”

口腔外科
「こうくうげか」ではなく「こうこうげか」。
清拭
「せいしき」ではなく「せいしょく」。
独壇場
正しくは「独擅場」と表記して、「どくせんじょう」。
疾病
「しつびょう」ではなく「しっぺい」。
偏執狂
「へんしつきょう」ではなく「へんしゅうきょう」。
情緒
慣用は「じょうちょ」。正式には「じょうしょ」。
膏肓
「病、膏肓に入る」は「やまいこうもうにいる」ではなく「やまいこうこうにいる」。
捏造
慣用は「ねつぞう」。正式には「でつぞう」。「捏ち上げる」は「でっちあげる」。
0524Mb
垢版 |
2018/07/16(月) 13:17:32.40ID:RFTF6J3p
>>523
あ、ごめん。うっかり送信しちゃった。
0525Mb
垢版 |
2018/07/16(月) 13:22:00.06ID:RFTF6J3p
>>519
続き。
 脅かす(おどかす/おびやかす)
 下り(おり/くだり)
 降り(おり/ふり)
 解す(かいす/ほぐす)
 通った(かよった/とおった)
 来る(きたる/くる)
 汚す(けがす/よごす)
 汚れる(けがれる/よごれる)
 煙る(けぶる/けむる)
 扱く(こく/しごく)
 栄える(さかえる/はえる)
 誘う(さそう/いざなう)
 認める(したためる/みとめる)
 狭まる(せばまる/はさまる)
 狭める(せばめる/はさめる)
 初めて(そめて/はじめて)
 逸らす(そらす/はやらす)
 逸れる(それる/はぐれる/はやれる)
 違う(たがう/ちがう)
 尊ぶ(たっとぶ/とうとぶ)
 貴ぶ(たっとぶ/とうとぶ)
 違える(たがえる/ちがえる)
 吐く(つく/はく)
 留める(とめる/とどめる)
 留まる(とまる/とどまる)
 叩く(たたく/はたく)
 弾く(はじく/ひく)
 瞬く(またたく/まばたく)
0526Mb
垢版 |
2018/07/16(月) 13:25:35.64ID:RFTF6J3p
せっかくだから、最後までやっとこうか。
 (文)悪し(あし/わろし)
 良い・善い・好い(いい/よい)
 鈍い(にぶい/のろい)
 辛い(からい/つらい)
 難い(かたい/にくい)
 臭い(くさい/におい)
 尊い(たっとい/とうとい)
 貴い(たっとい/とうとい)
 難しい(むずかしい/むつかしい)
 (文)良し(よし/よろし)

(まだ続く)
0527Mb
垢版 |
2018/07/16(月) 13:26:51.56ID:RFTF6J3p
 (文)悪し(あし/わろし)
 良い・善い・好い(いい/よい)
 鈍い(にぶい/のろい)
 辛い(からい/つらい)
 難い(かたい/にくい)
 臭い(くさい/におい)
 尊い(たっとい/とうとい)
 貴い(たっとい/とうとい)
 難しい(むずかしい/むつかしい)
 (文)良し(よし/よろし)

抜けてる例があったら知らせてくれ。
0528Mb
垢版 |
2018/07/16(月) 13:29:11.05ID:RFTF6J3p
で、質問があったらカモーン! 歓迎するぜぇ!
0529Mb
垢版 |
2018/07/16(月) 13:49:08.35ID:RFTF6J3p
>>517
> その「教え方(ほんとなら)」に驚いてるんじゃなくて
中学校の国語教科書なら神保町の三省堂書店で
売ってるから確かめてみたらどうだ。
0530Mb
垢版 |
2018/07/16(月) 15:36:36.28ID:RFTF6J3p
ところで、
「ところで」を漢字で表記する場合、
「処で」「所で」「處で」のどれが正しいのか、
知っているヒトがいるんだったら教えてほしい。
本当に。
0531デフォルトの名無しさん
垢版 |
2018/07/16(月) 16:15:34.93ID:Od4s/iux
>>523
確執は?
0532Mb
垢版 |
2018/07/16(月) 16:59:58.75ID:RFTF6J3p
>>531
それは別板の話題だと思うが …
「固執」「執事」「偏執狂」との絡みで解決してくれい。
0534Mb
垢版 |
2018/07/16(月) 17:22:46.07ID:RFTF6J3p
>>533
べつにおれの知ったこっちゃないんだが、
あっちゃこっちゃの板でヒトに嫌われるようなコトを
ホザいてたからだろう。
0535Mb
垢版 |
2018/07/16(月) 17:30:44.70ID:RFTF6J3p
>>533
なんか知らんが、数学板とかプログラマ板とか、
あっちゃこっちゃで粘着してくる香具師がいるんだよ。
どうしたもんかなぁ …
0536デフォルトの名無しさん
垢版 |
2018/07/16(月) 18:49:32.10ID:Weu21Vcy
国文法の細かい話題に参加する気はないが
人間が文法を間違えたときにどう処理するかは
自然言語処理で昔から問題になってる
0537Mb
垢版 |
2018/07/16(月) 21:00:28.41ID:RFTF6J3p
>>536
> 昔から問題になってる
っつーのはよく解る。
清少納言が「べきにもあらず」とか
書いてるけど、文法的には「べからず」が
正しいと思う。

「慣用形」として認めるのはアリだと思うが、
しょっちゅう使うから「慣用」なんであって、
そこを網羅するのがコンピュータの出番だと
思うんだがどうだろう。

つーか、記述文法の精度が低すぎるのが
本来の問題なんだが、

おまいら記述文法を舐めてねぇか?

という連中が自然言語処理業界に多すぎるのが
問題だと思うが。
0538デフォルトの名無しさん
垢版 |
2018/07/16(月) 21:05:53.77ID:LulkQD8r
憤慨ポイントがよくわからない

自分のアプリで処理できないから怒ってるのか?
0539Mb
垢版 |
2018/07/16(月) 21:14:19.70ID:RFTF6J3p
>>536
“じつは”というか、“ぶっちゃけ”というか、
もう四半世紀(要するに二十五年以上)前から、
そこいらにあるパソコンの(形態素解析レベルの)チェック
能力は、人間を軽く超えているんだよ。
ただ、構文解析に関しては、国語学とか自然言語処理とか
数学とかコンピュータサイエンスとか認知心理学とか、
そのあたりの合意がとれてないわけよ。
だから、そのあたりを整理する必要があるわけなんだけど、
苫米地 英人とかが引っ掻き回しやがってバカヤロウ、
みたいな話があるんだわ。
■ このスレッドは過去ログ倉庫に格納されています