自然言語処理スレッド　その４

**デフォルトの名無しさん** · 2014/06/03(火) 05:40:00.54

前前スレ　自然言語処理スレッド　その２
http://mimizun.com/log/2ch/tech/1173105287/
前スレ　自然言語処理スレッド　その３
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。

**デフォルトの名無しさん** · 2017/04/29(土) 18:15:17.74

盛り上がってないね

**デフォルトの名無しさん** · 2017/05/08(月) 12:37:00.42

>>391
＞和田秀樹の黒塗り教科書、二冊用意して一冊を塗り潰す、

　先行研究として、Kanayamaら [1]およびKobayashi
ら [2] によるセンター試験「世界史」の自動解答シス
テムがある。これらの研究では、選択肢中のキーワー
ドを一つずつ隠し、隠した語を問う factoid 問題に対
するシステムの解答を隠した語と比較することで誤り
を検出する手法を用いている。
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/C7-3.pdf

**デフォルトの名無しさん** · 2017/05/08(月) 16:29:03.69

深層学習を駆使し辞書無しで日本語分かち書きできるライブラリはやく作ってください
人間に出来るのだから余裕だろ？

**デフォルトの名無しさん** · 2017/05/08(月) 17:54:54.52

>>442
子育てしたことあるかい?

**デフォルトの名無しさん** · 2017/05/08(月) 20:27:47.17

>>442
つsentencepiece

**デフォルトの名無しさん** · 2017/05/09(火) 08:28:02.29

深層学習でも何でもないし
くぃいたのバカが早速分かち書きに使ってたし

**デフォルトの名無しさん** · 2017/05/09(火) 14:03:42.42

>>445
だから分かち書きのライブラリが欲しいんだろ？いいじゃん

**デフォルトの名無しさん** · 2017/05/10(水) 14:36:25.96

回転放物面の方程式と東大の問題
http://mathtrain.jp/kaitenhobutsu

「放物線 y = 3/4 - ｘ^2」
を
「y軸の回りに回転させる」

・・・例えば、こういう操作ができる３次元ＣＡＤって開発されてないんですか？

統計的機械翻訳では自然言語処理は無理という話も聞いているけれど、高校数学でやることは内容が限られており、
一般的な機械翻訳よりは難易度は低いと思われます。

**デフォルトの名無しさん** · 2017/05/10(水) 15:22:11.14

「こういう操作」って、自然言語で方程式や回転操作を入力するってこと？

**デフォルトの名無しさん** · 2017/05/20(土) 10:09:44.32

>>143
＞線分ＱＴと線分ＱＲの関係を求めるのに、どの線が必要で、どの線が不要なのか。
＞また必要な線が無い場合は、点と点同士を結んだり線分を延長させたりして、補助線を引く。
＞計算力にモノを言わせて、しらみつぶしに全ての場合を調べつくすというやり方もある。

音楽より画像処理の方が凄いな。ディープラーニングで画像補完。
フォトショでＣＧ加工や写真補正をチマチマやる必要のないレベルに来てる。
そのうちディープラーニングで自動作曲とか出てきそう。

画像を塗りつぶした部分に一瞬で自然な画像を補完する技術を早稲田大学の研究者が開発
http://gigazine.net/news/20170501-globally-locally-consistent-image-completion/

**デフォルトの名無しさん** · 2017/05/20(土) 21:53:06.95

ちなみにこれが機械学習で機械が作った寝室の画像

もちろん現実のどこにも存在しない、機械が学習した「寝室」の概念画像

遠くから見ると普通に寝室の写真に見えるが、よーく見るとちょっとおかしいことに気づくと思う

http://blog.aylien.com/wp-content/uploads/2016/08/gan-samples-1.png

ってか、既存のGANでも機械にエロ画像の概念を学習させることはできるんだよな
やってみようかな

匿名でやらないと頭硬い奴らに訴えられて面倒なことになりそうだが

**デフォルトの名無しさん** · 2017/05/20(土) 22:47:21.48

面白い話題だけどスレ間違ってません？

**デフォルトの名無しさん** · 2017/05/21(日) 00:11:37.70

>>451
自然言語処理にも画像理解やシミュレーションが必要なのでは？

**デフォルトの名無しさん** · 2017/05/21(日) 00:14:45.81

画像理解技術が進歩すれば、東大物理も満点近く取れると思う。

>>136
＞次に③の図ろ考えると、点線が途中までになっていて、「何かが入っている箱」と考えられる。

>>449
＞画像を塗りつぶした部分に一瞬で自然な画像を補完する技術を早稲田大学の研究者が開発

**デフォルトの名無しさん** · 2017/05/21(日) 00:28:19.74

>>452
東ロボみたいなセンター問題回答に物理シミュレーションが使えるのでは？っていうアイデアならまだ理解できるけど、それはもう自然言語処理じゃないだろ
まあいいけど

**デフォルトの名無しさん** · 2017/05/21(日) 00:32:02.89

ディープラーニングは大量のデータから特徴を抽出して確率的に生成するんだから、問題文中の図を補完するなら大量の過去問が必要だろう。
しかし過去問はスモールデータだからなぁ

**デフォルトの名無しさん** · 2017/05/23(火) 05:12:53.15

確率の問題はまだ当分無理と思われる。一度には読み込めないからまず小さな文節に区切って、
何が何のことを指しているのかを把握しなければならない。

コンピューターの画面に、（※※）
記号○と×のいずれかを（記号〇と記号×は２つに一つで「背反」である）
表示させる（※）
操作をくり返し行う。（ｋ回繰り返す）
↓
このとき、（どんな時？）
各操作で、（「記号○と×のいずれかを」「表示させる操作」を「ｋ回繰り返す」。）
直前の記号と（「ｋ回の各操作」において）
同じ記号を（○か×か）
続けて表示する確率は、（・・・○〇・・・または・・・××・・・）
それまでの過程に（ｋ回の各操作全てにおいて）
関係なく、（一定である）
pであるとする。（確率は０＜ｐ＜１）
↓
最初に、（ｋ＝１において）
コンピュータの画面に（※※）
記号×が
表示された。（※）
操作をくり返し行い、（ｋ回繰り返す）
記号×が
最初のものも含めて（ｋ＝１のものも含めて）
3個出る（×・・・×・・・×、×××、××・・・×、×・・・××）
よりも前に（×・・・×・・・、××、××・・・、×・・・×）、
記号○がn個出る確率をPnとする。
http://math.nakaken88.com/problem/tokyo-u-r-2006-2/

**デフォルトの名無しさん** · 2017/05/23(火) 08:39:25.38

>>282
＞ＲＤＦトリプルセットは「連想・推論」に利用できるので、人力でＲＤＦ辞典を作成しておきたい。

RDFDNN において, 予測失敗を以上の 4 種類に分けてカウ
ントを行ったところ表 2 のようになった. 訓練データの中から
RDFDNN が予測に失敗したトリプルを無作為に 100 個サン
プリングし人手でカウントを行った.
表 2 のとおり最も多かった予測失敗はタイプ A である. A の
例としては,”Leslie Dilley”と”レイダース　失われたアーク”
の関係予測において, 正しくは”アートディレクター”であると
ころを”出演者”と予測した例が挙げられる. この例の場合, 人
間と映画の間に張られる関係の中で”出演俳優”という関係が
最も多いために”出演俳優”と間違った予測をしたと考えられ
る. このように RDFDNN の予測失敗 100 個のうち A,B,C の
68 個の間違いには何らかの妥当性があった.

https://kaigi.org/jsai/webprogram/2017/pdf/718.pdf

**デフォルトの名無しさん** · 2017/05/23(火) 16:39:02.27

y=x^2 のグラフを x 軸方向に 2 だけ平行移動し，
それをx軸に関して対称移動したグラフを求めよ．
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D5-1.pdf

y=x^2
の
グラフ
を
x 軸方向
に
2
だけ
平行移動
し
，
それ
を
x軸
に
関して
対称移動
した
グラフ
を
求めよ
．

↑
このように全ての単語と助詞を「オブジェクト」に分解し、かつその「多態性」を分析し、然る後に形式変換すべきだと思う。

**デフォルトの名無しさん** · 2017/05/23(火) 17:09:27.18

[ 2017年03月13日 - 00:40 ]
【数学の大学入試問題、被りすぎやろ（2017年入試）】
■ 1993年和歌山県立医科大医学部医学科→1994年京大理系数学（後期）→2016年東大理系→
2017年杏林大医学部医学科の巴戦の確率の極限の問題(まったく同じ問題で難問）
2000年東工大→2017年上智大理工の立体の側面積の最大、最小問題（東工大の問題に丁寧な誘導を付けて標準レベルにした問題）
1977年千葉大文系数学→2017年早稲田大理工の漸化式で表された数列の和をニ項定理をつかって考察する問題（全く同じ。やや難レベル）
2006年早稲田大理工→2017年早稲田大理工の3次方程式の解が三角関数で循環することを論証する問題（全く同じ。難問）
1999年名古屋市立大医学部と2001年東京農工大前期試験を合わせた問題→2017年早稲田大理工の複素数平面上の直線公式の導き出し、
複素数平面上の任意の点が複素数平面上の三角形の周及び内部にある存在条件を図示する問題（存在条件を複素数平面上に図示するのが難しい）
1986年東大文系数学→2016年同志社大全学入試文系→2017年東大理系数学の置き換えを利用して三角関数から2次関数に帰着して最大、
最小を求める問題（文系の問題が東大理系で出題されるのか・・・基本レベル）
1993年上智大理工学部→2017年東大文理共通の平面上のランダムウォークの確率の問題（反復試行の確率に帰着する問題。標準レベル）
2013年大阪大理系→2017年東大理系の円錐をy軸で回転してできる立体の体積を求める問題。一様多面体の円錐曲線を背景にした問題。
（大阪大の問題に誘導をつけ、阪大より易しくした問題だがやや難レベル）
2005年お茶の水女子大理学部→2017年東大理系の2つの放物線の共通接線の本数問題。（お茶の水女子大の問題から共通接線が
引ける本数の条件を変えた問題。標準レベル）
1999年名古屋市立大医学部→2017年東大理系数学の複素数平面上の任意の点が複素数平面上の三角形の周及び内部にある存在条件
を図示する問題（早稲田大理工に数値を変えただけ。早稲田大理工よりは存在条件を複素数平面上に図示するのは易しい。標準レベル）
＜以下略＞
http://www.fuoriclasse2.com/cgi-bin/read.cgi?2017-03-13004037

**デフォルトの名無しさん** · 2017/06/04(日) 09:01:30.87

まだ記号処理メインに考えることしかできないのか

**デフォルトの名無しさん** · 2017/06/04(日) 11:13:02.02

いろんなアプローチがあって然るべき

**デフォルトの名無しさん** · 2017/07/04(火) 03:55:25.73

　機械翻訳事業を手掛けるみらい翻訳が、深層学習技術を用いたニューラル機械翻訳エンジンを発表した。
現在、同社のサイトでデモが体験可能になっている。
　これは同社と国立研究開発法人情報通信研究機構（NICT）との共同研究によるもので、
深層学習技術の導入により、従来の統計的機械翻訳に比べて翻訳精度が大幅に向上していることが特徴。
対象となるのは日英双方向の翻訳で、なかでも和文英訳においては「TOEIC900点程度
のスコアを持つビジネスマンと同等以上の作文能力があることを確認」できたとアピールしている。
これらを搭載した企業向け翻訳アプリケーションサービスを本年11月から提供するとしているが、現在、
同社のサイトで「お試し翻訳」と称する無料版が利用できるようになっているほか、
共同開発を行ったNICTでは、Android/iOS向け音声翻訳アプリ「VoiceTra（ボイストラ）」
において同日付でこの技術を組み込んでいる。気になる人はまずは、こちらを試してみるとよさそうだ。

お試し翻訳（みらい翻訳）
https://www.miraitranslate.com/index.php#txt-t
TOEIC900点以上の英作文能力を持つ深層学習による機械翻訳エンジンをリリース（みらい翻訳）
https://miraitranslate.com/news/313
ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現（NICT）
http://www.nict.go.jp/press/2017/06/28-1.html
http://internet.watch.impress.co.jp/docs/yajiuma/1067830.html

**デフォルトの名無しさん** · 2017/07/04(火) 04:20:24.35

【大発見】おいｗｗｗ３の倍数じゃない奇数を思い浮かべて２乗してから１引いてみろｗｗｗｗ絶対に２４で割りきれるぞｗｗｗｗｗ

**デフォルトの名無しさん** · 2017/07/08(土) 21:24:46.98

これは、「記号の接地問題」が解決されたことを意味しており、
エージェントは、行動と結びついた内発的な記号表現として、
人間の言葉である英語の短文を学習していきます。

http://qiita.com/HirofumiYashima/items/9637d0a24fd661097c92

**デフォルトの名無しさん** · 2017/07/08(土) 21:25:35.80

DeepMindが自然言語理解の２難題を解決した

http://mabonki0725.hatenablog.com/entry/2017/07/08/132740

**デフォルトの名無しさん** · 2017/07/08(土) 21:26:30.44

https://www.youtube.com/embed/wJjdu1bPJ04?rel=0

**デフォルトの名無しさん** · 2017/09/16(土) 21:36:54.93

誰かmt summitに行く？

**デフォルトの名無しさん** · 2017/09/17(日) 21:31:26.60

ねえ？

**デフォルトの名無しさん** · 2017/09/20(水) 13:30:26.68

いないのかよ

**デフォルトの名無しさん** · 2018/03/09(金) 22:58:34.64

これ翻訳できる？
なんでみんな笑っているかわからん
Topic modelの授業の冒頭
I'm from Princeton in New Jersey where it's four o'clock in the morning.
（笑）
教えてくれ

**デフォルトの名無しさん** · 2018/03/10(土) 01:12:32.33

>>470
たいへん。壺魔人がトイレから出てこない。
改札通れないんだと思う。

って言ってる。

**デフォルトの名無しさん** · 2018/03/10(土) 01:49:36.91

↑全然おもろない
阿保丸出し

**デフォルトの名無しさん** · 2018/03/10(土) 03:40:10.38

キマリの寝言だからな

**デフォルトの名無しさん** · 2018/03/15(木) 17:51:17.69

新井紀子教授はすごくなかった
『新井紀子教授は研究者としてすごい』とタイトルにありますが、
皮肉で書いたわけではなく、本当にすごいと思っていました。
宣伝を大きくして予算を確保するということができる研究者は多くありません。
私も研究の世界にいたのでわかるのですが、いろいろと疑問のあるプロジェクトというのはよくあることで、
新井紀子教授の場合は宣伝が上手いゆえに、悪目立ちして損をしている部分はあると思います。
そして、そもそも個人攻撃は私の意図したところではありません。
https://mywarstory.tokyo/our-enemy/

**デフォルトの名無しさん** · 2018/03/15(木) 18:11:41.15

新井紀子教授のAIやコンピュータに関する知識は素人に毛が生えた程度
新井紀子教授の『AI vs. 教科書が読めない子どもたち』という本が大変売れているようです。
私も本を購入し精読させていただきました。
一言で感想を言うと、新井紀子教授のAI技術に関する知識はせいぜいAI関連ニュースに詳しい人レベルであり、
そのベースであるコンピュータに関する知識もほぼ素人だということがわかりました。
https://mywarstory.tokyo/inconvenient-truth/

**デフォルトの名無しさん** · 2018/03/15(木) 21:50:00.22

新井紀子教授はUniversity of Illinois Urbana-Champaignから1985年に数学の学士を授与された後、
博士課程に5年間在籍しているのにもかかわらず、1990年に修士号だけ授与されて退学しているようなので、
数学はあまり得意でないのかもしれません。
しかしそれにもかかわらずこれだけ世間をにぎわせていることは、能力よりも宣伝力の方が世間
に対するインパクトが大きいことを示していると思います。
https://mywarstory.tokyo/being-employed-is-easy/

**デフォルトの名無しさん** · 2018/03/17(土) 15:18:31.03

https://gigazine.net/news/20180315-microsoft-ai-chinese-translation/
MicrosoftのAI翻訳は中→英ニュース翻訳を人間の翻訳者と同じ精度でこなせるレベルに到達

**デフォルトの名無しさん** · 2018/03/19(月) 10:56:01.35

初歩の整数論プログラミング
https://www.saoyagi2.net/integer/

整数問題を解答するプログラムも造っておきたい。

**デフォルトの名無しさん** · 2018/03/19(月) 11:00:55.47

整数の操作と整数論に関連した関数
http://reference.wolfram.com/language/tutorial/IntegerAndNumberTheoreticalFunctions.html.ja

**デフォルトの名無しさん** · 2018/03/19(月) 13:27:48.98

>>476
途中までしか読んでいないけど、「現在の社会は人間のために作られていて、機械にとって優しくない。これはAI差別でなかろうか」という視点はどうでしょうか。

**デフォルトの名無しさん** · 2018/03/21(水) 20:30:25.43

チンボがシコシコする！

**デフォルトの名無しさん** · 2018/03/22(木) 01:02:52.70

チンボがシコシコする！

**デフォルトの名無しさん** · 2018/03/22(木) 04:56:52.06

チンボがシコシコする！

**デフォルトの名無しさん** · 2018/03/23(金) 21:35:06.73

自然科学、特に変化の速い人工知能関連の分野で日本語で最新の情報を得ようとしても限界があるので、
自分で英語の論文を読む以外のいい方法はないと思います。（無料です。）
こちらから気になるワードで検索してみてください。
自然科学の基礎研究に関して議論するのに適した場所は知りませんが、まずはQuoraかredditあたりで同じ質問をしてみてはいかがでしょうか？
Quoraはとても親切な人が多いので、丁寧に教えてもらえると思います。
https://mywarstory.tokyo/qa40/

**デフォルトの名無しさん** · 2018/03/24(土) 22:53:15.70

（第1章はじめに　2頁）
たとえば、CycはFredという名前の男が朝にひげをそるという話が理解できなかった。
Cycの推論エンジンは、この話の中に矛盾を見つけた。Cycは人間には電気の部品がないことは知っているが、
Fredが電気カミソリを持っていたので、エンティティ「Fredがひげそり中(FredWhileShaving)」
には電気の部品が含まれていると考えた。したがって、CycはFredがひげをそっている間、
Fredはそれでも人間なのかと尋ねた。

『深層学習』
著者:
Ian Goodfellow, イアングッドフェロー,
Yoshua Bengio, ヨシュアベンジオ,
Aaron Courville, アーロンカービル

**デフォルトの名無しさん** · 2018/03/24(土) 22:54:29.46

この人、素人面して海外でph.d取ってるじゃん

**デフォルトの名無しさん** · 2018/03/24(土) 22:55:30.16

ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか？

チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。

オブジェクト指向で言う「集約」は２種類あって、全体（俺）と部分（チンボ）が繋がっている場合と、
全体（俺）と部分（チンボ）が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。

違うか？

「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、５０字以内で述べろ！

**デフォルトの名無しさん** · 2018/03/25(日) 01:03:31.88

「舌がピリピリする」みたいな
身体の受動的感覚なら文法的に可

「顔がニコニコする」みたいに
動作主体が人間なら不可

**デフォルトの名無しさん** · 2018/03/25(日) 13:25:32.26

https://mywarstory.tokyo/qa40/

**デフォルトの名無しさん** · 2018/03/25(日) 14:43:19.66

自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては？
https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7

**デフォルトの名無しさん** · 2018/03/25(日) 16:31:05.25

>>490
そこのリンク先
URL直接貼れんけど
コメントわろた

**デフォルトの名無しさん** · 2018/03/25(日) 22:51:24.22

>>490
何がしたいのか不明確だが
UIを自然言語にするだけなら昔からある
コマンド入力型ADVゲームとかな

**デフォルトの名無しさん** · 2018/03/26(月) 01:29:09.56

>>492
＞コマンド入力型ADVゲームとかな

コマンドではなくて、50字以上100文字以下の、主語と述語と目的語と修飾語を含む自然言語文で。

**デフォルトの名無しさん** · 2018/03/26(月) 03:16:49.02

この質問されてるyu.とかいう人はそもそも何者なんだよ
twitterのプロフにPh.dと書くだけなら誰にでもできる

**デフォルトの名無しさん** · 2018/03/26(月) 03:34:41.60

>>493
ない、作れ

**デフォルトの名無しさん** · 2018/03/26(月) 06:35:12.71

コンピューターのための自然言語理解シミュレ
ーターというのは可能ですか？

例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。

**デフォルトの名無しさん** · 2018/03/26(月) 20:51:09.10

残念だが人間と完全に同等のレベルで
自然言語を理解するのは現時点では不可能
人工無能を改良して上手く使っていくしかない

**デフォルトの名無しさん** · 2018/03/28(水) 06:05:44.86

　　　　　　　||
　　　　　　　||
　　　　　　∧||∧　　　
　　　　　（ / ⌒ヽ
　　　　　　| | 　　|
　　　　　　∪ / ﾉ
　　　　　　 | ｜|
　　　　　　 ∪∪

　　　　　 -━━-

**デフォルトの名無しさん** · 2018/04/03(火) 08:25:58.10

誰かSudachi使った人いる？

**デフォルトの名無しさん** · 2018/04/11(水) 14:17:19.53

チンボがシコシコする！

**デフォルトの名無しさん** · 2018/05/12(土) 10:59:50.86

共同ツール 1
https://seleck.cc/685

https://trello.com/
ボードのメニュー → Power-Upsから拡張可能 Slack DropBoxなど
Trello Chrome拡張機能　elegant
ttp://www.kikakulabo.com/service-eft/
trelloのオープンソースあり

共同ツール 2
https://www.google.com/intl/ja_jp/sheets/about/

共同ツール 3
https://slack.com/intl/ja-jp
https://www.dropbox.com/ja/
https://bitbucket.org/
https://ja.atlassian.com/software/sourcetree
https://sketchapp.com/extensions/plugins/
ttp://photoshopvip.net/103903

ttps://goodpatch.com/blog/sketch-plugins/

**デフォルトの名無しさん** · 2018/05/23(水) 19:52:19.56

僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法　モニアレフヌノ』

2OND8

**デフォルトの名無しさん** · 2018/05/24(木) 11:01:13.03

2OND8

**デフォルトの名無しさん** · 2018/06/26(火) 00:19:49.53

冒険者の広場では提案広場・あしあと伝言板にて言論規制がしかれている。
提案広場では主にスクエニに対して不利になるような発言
WiiUで発売してすぐ、ウィンドウズ版では出さないといっておきながら
発売を発表、それにより広場は荒れたものの、超速で削除。
両手剣スレイプニールのチート問題、これもチート行為は絶対にないと
いいきってからの問題発覚、これも荒れて超速削除。
他全年齢対象のためちょっとでも卑猥と感じる内容は削除
ネタバレと書かなければ、ネタバレと思われるものは削除
これについては運営側がネタバレと加筆すればいいだけの話だと思うけど。
あしあと伝言板は悪口と思われる内容の言葉が含まれていれば
自動で削除される。
この装備イカす→カス
ちょっとバカンスに行ってきます→バカ
パチンコばっかりいってた→チンコ
どう考えても冤罪削除。しかも累積すると冒険者の広場利用停止。
横暴。
ちなみに冤罪削除を訴えた発言も削除される。
異議申し立ても悪だというらしい。
サポートセンターに問い合わせたところ、調べてもくれなかった。
https://ameblo.jp/cinnamon-rilakkuma/entry-12317442377.html

**デフォルトの名無しさん** · 2018/07/04(水) 22:07:34.62

5UX

**デフォルトの名無しさん** · 2018/07/05(木) 16:32:39.56

5UX

**デフォルトの名無しさん** · 2018/07/09(月) 09:01:50.15

誰か今日の研究会行く？

Mb · 2018/07/16(月) 06:02:54.03

省略のある文を構文解析するときに、
あらかじめ「省略がある」と解っている場合は
いいんだが、文法が間違ってて「ないはずの省略が
あることになってしまっている」場合は
ややこしい話になりそうに思う。
「すごく面白い」は「省略なし」で「すごく」が
「面白い」にかかるんだが、「すごい面白い」だと、
構文解析木自体が変わってきてしまう。
それとも、「解析木自体が違う」と認識して、
もっと上位の意味解析とかで処理するほうが
いいのかね？

Mb · 2018/07/16(月) 06:18:39.78

逆に、誤用とか慣用として、辞書レベルで処理しちゃったほうが
実用上は便利なのかね？
「そうすべきだ」なんていうのは、構造としては、
「そうするべきことだ」のはずなんだが、
「××する」みたいな附属語的な用法や、「漢字一字＋ｓ」
の形の五段活用動詞の連体形の変化形とは違って、単独の
「する」の連体形が「す」として使われる例はあんまりない
（文語じゃねぇんだから）。
で、「べき」は連体形だから、助動詞「だ／です／である」に
接続する場合は、本来は間に体言が入らないとおかしい。
でなかったら、「べし」と命令形にしちゃうのが文法的には
正だろう。
こういうのは、処理の観点からいうと、どう扱ったらいいのかね？

**デフォルトの名無しさん** · 2018/07/16(月) 07:59:54.86

好きにすれば？

Mb · 2018/07/16(月) 08:41:11.73

>>510
それは、「おれは好きにするからユーザは文句言うな」
なのか、「ユーザが好きに処理できるように、アプリに
自由度を持たせろ」なのか。

Mb · 2018/07/16(月) 08:48:33.94

そもそも、「人間のチェックには漏れがある」から
「コンピュータにチェックさせる」のが本筋なのに、
「コンピュータの解析精度が低いから、人間が
処理結果をチェックしないといけない」というのが
本末転倒だ。
標準表記外音は『常用漢字表』（昭和56内閣告示）によれば、
「時」には「と」の音はないため、「時計」を「とけい」と読むと
表記外になるとか、「日」には「に」の音はないため、「日本」を
「にほん」と読むと表記外となるとか、そんなの人間がチェックしたら
見落とすに決まってるだろ。
「じゃあ、他にはそういう例があるのか？」とかいったデータくらい、
ちゃんと用意してどっかに公開しておけというのだ。

Mb · 2018/07/16(月) 11:05:42.72

だいたい、中学校で
「活用するのが『用言』で、活用しないのが『体言』」とか
教えてるくせに、
天（あめ→あま）
天日嗣（あまつひつぎ）・天津日嗣（あまつひつぎ）・天照大神（あまてらすおおみかみ）・天の川（あまのがわ）・天水（あまみず）
雨（あめ→あま）
雨足（あまあし）・雨脚（あまあし）・雨蛙（あまがえる）・雨傘（あまがさ）
・雨具（あまぐ）・雨乞い（あまごい）・雨水（あまみず）・雨漏り（あまもり）
雨（あめ→さめ）
秋雨（あきさめ）・霧雨（きりさめ）・小雨（こさめ）・細雨（ささめ）
・春雨（はるさめ）・氷雨（ひさめ）・村雨（むらさめ）
とかいうのはどう説明したらいいんだよ。
「日本語処理の技術者は、中学校レベルの文法知識も持っていない」って、
中学校で教えるのかよ。
で、高校受験や大学受験で、「本当のこと」を主張したら減点されて
不合格のリスクを負うのか？
それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。

**デフォルトの名無しさん** · 2018/07/16(月) 11:21:56.62

>「活用するのが『用言』で、活用しないのが『体言』」とか
>教えてるくせに、

ええぇぇぇっ

Mb · 2018/07/16(月) 11:36:38.15

>>514
> ええぇぇぇっ
いや、ここは驚くとこじゃねぇだろう。
中学二年で習う「文法」だと、
まず「自立語」と「附属語」の区別があって、
自立語のうち「その役割によって形を変える語」を
「用言」といい、「形を変えない語」を「体言」というと、
しっかり教科書に書いてある。
だもんだから、教師はそれを信じてテストの問題を作り、
それに「教師が正しいと思った解答」を書かなかった
児童・生徒は成績評価が低くなる。
で、「それはおかしいんじゃないですか？」とかいって
文句をつける保護者は、「モンスター・ペアレント」として
扱われる。

めでてぇな。

**デフォルトの名無しさん** · 2018/07/16(月) 11:36:41.25

最近少し興味を持った初心者なのですが、
2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で処理されるのですか？

例えば、

>それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。

おまいら自然言語処理をやっている人間は、それっておかしいとは思わんのか。

あなた方の様に自然言語の処理を行う人達は、「それはおかしい」と思わないのですか？

**デフォルトの名無しさん** · 2018/07/16(月) 11:54:52.76

>>515
その「教え方(ほんとなら)」に驚いてるんじゃなくて

>>513 の認識に驚いてる

**デフォルトの名無しさん** · 2018/07/16(月) 12:10:49.45

しょせんは人が決めた分類なんで従うしかない

って書こうとしたけど
漢字って単語のさらに一部分で雨水はいつだってあまみずだから
雨水を単語として分類するとき体言にするのはべつに間違ってないような

https://kotobank.jp/word/%E4%BD%93%E8%A8%80-91058
定義もっとこまかかった最初の前提からちがう

Mb · 2018/07/16(月) 12:54:56.73

>>518
> 漢字って単語のさらに一部分で雨水はいつだって「あまみず」だから
　開く（あく／ひらく）
　開ける（あける／ひらける）
　温める（あたためる／あっためる／ぬくめる）
　暖める（あたためる／あっためる）
　温まる（あたたまる／ぬくまる）
　言う・謂う・云う（いう／ゆう）
　怒る（いかる／おこる）
　行く・逝く・往く（いく／ゆく）
　射殺した（いころした／しゃさつした）
　抱く（いだく／だく）
　行った（いった／おこなった）
　出し（(文)いでし／(現)だし／(文)でし）
　居る（いる／×おる）
　入る（いる／はいる）・入れない（いれない／はいれない）
　得る（うる／える）
（以下、規制に引っかかるので省略）
「雨水溝」は、「うすいこう」なのよ。

Mb · 2018/07/16(月) 13:03:08.07

>>516
> 2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で
> 処理されるのですか？
いや、普通に処理してるけど？
「文法格の一意性」とか「非交差則」とかで説明できるんだけど。
ただ、「処理の結果が気にくわない！」って言ってる、自然言語処理
分野のヒトが邪魔してるだけだし。文語文法とかの研究者は、
「使えるツールがあれば欲しい」っていう要望があるんだけど。
そのあたりは早稲田大学の文理学部の筧先生とかに嘆願してね。

Mb · 2018/07/16(月) 13:08:49.98

>>518
「の」とか「ん」で表される、いわゆる「準体助詞」は
主語にならないから体言じゃないんだな？

Mb · 2018/07/16(月) 13:12:52.10

>>516
そのあたりは運用上の意味論がある。
わりと有名な例だが、
「てめぇは馬鹿か？」は通るが、
「あなたは知恵遅れではありませんか？」と
言ったら、血の雨が降る。

Mb · 2018/07/16(月) 13:16:06.01

慣用・誤用、あるいはいわゆる“百姓読み”

口腔外科
「こうくうげか」ではなく「こうこうげか」。
清拭
「せいしき」ではなく「せいしょく」。
独壇場
正しくは「独擅場」と表記して、「どくせんじょう」。
疾病
「しつびょう」ではなく「しっぺい」。
偏執狂
「へんしつきょう」ではなく「へんしゅうきょう」。
情緒
慣用は「じょうちょ」。正式には「じょうしょ」。
膏肓
「病、膏肓に入る」は「やまいこうもうにいる」ではなく「やまいこうこうにいる」。
捏造
慣用は「ねつぞう」。正式には「でつぞう」。「捏ち上げる」は「でっちあげる」。

Mb · 2018/07/16(月) 13:17:32.40

>>523
あ、ごめん。うっかり送信しちゃった。

Mb · 2018/07/16(月) 13:22:00.06

>>519
続き。
　脅かす（おどかす／おびやかす）
　下り（おり／くだり）
　降り（おり／ふり）
　解す（かいす／ほぐす）
　通った（かよった／とおった）
　来る（きたる／くる）
　汚す（けがす／よごす）
　汚れる（けがれる／よごれる）
　煙る（けぶる／けむる）
　扱く（こく／しごく）
　栄える（さかえる／はえる）
　誘う（さそう／いざなう）
　認める（したためる／みとめる）
　狭まる（せばまる／はさまる）
　狭める（せばめる／はさめる）
　初めて（そめて／はじめて）
　逸らす（そらす／はやらす）
　逸れる（それる／はぐれる／はやれる）
　違う（たがう／ちがう）
　尊ぶ（たっとぶ／とうとぶ）
　貴ぶ（たっとぶ／とうとぶ）
　違える（たがえる／ちがえる）
　吐く（つく／はく）
　留める（とめる／とどめる）
　留まる（とまる／とどまる）
　叩く（たたく／はたく）
　弾く（はじく／ひく）
　瞬く（またたく／まばたく）

Mb · 2018/07/16(月) 13:25:35.64

せっかくだから、最後までやっとこうか。
　(文)悪し（あし／わろし）
　良い・善い・好い（いい／よい）
　鈍い（にぶい／のろい）
　辛い（からい／つらい）
　難い（かたい／にくい）
　臭い（くさい／におい）
　尊い（たっとい／とうとい）
　貴い（たっとい／とうとい）
　難しい（むずかしい／むつかしい）
　(文)良し（よし／よろし）

（まだ続く）

Mb · 2018/07/16(月) 13:26:51.56

　(文)悪し（あし／わろし）
　良い・善い・好い（いい／よい）
　鈍い（にぶい／のろい）
　辛い（からい／つらい）
　難い（かたい／にくい）
　臭い（くさい／におい）
　尊い（たっとい／とうとい）
　貴い（たっとい／とうとい）
　難しい（むずかしい／むつかしい）
　(文)良し（よし／よろし）

抜けてる例があったら知らせてくれ。

Mb · 2018/07/16(月) 13:29:11.05

で、質問があったらカモーン！　歓迎するぜぇ！

Mb · 2018/07/16(月) 13:49:08.35

>>517
> その「教え方(ほんとなら)」に驚いてるんじゃなくて
中学校の国語教科書なら神保町の三省堂書店で
売ってるから確かめてみたらどうだ。

Mb · 2018/07/16(月) 15:36:36.28

ところで、
「ところで」を漢字で表記する場合、
「処で」「所で」「處で」のどれが正しいのか、
知っているヒトがいるんだったら教えてほしい。
本当に。

**デフォルトの名無しさん** · 2018/07/16(月) 16:15:34.93

>>523
確執は？

Mb · 2018/07/16(月) 16:59:58.75

>>531
それは別板の話題だと思うが …
「固執」「執事」「偏執狂」との絡みで解決してくれい。

**デフォルトの名無しさん** · 2018/07/16(月) 17:13:46.84

なんでこの人ID真っ赤なの？

Mb · 2018/07/16(月) 17:22:46.07

>>533
べつにおれの知ったこっちゃないんだが、
あっちゃこっちゃの板でヒトに嫌われるようなコトを
ホザいてたからだろう。

Mb · 2018/07/16(月) 17:30:44.70

>>533
なんか知らんが、数学板とかプログラマ板とか、
あっちゃこっちゃで粘着してくる香具師がいるんだよ。
どうしたもんかなぁ …

**デフォルトの名無しさん** · 2018/07/16(月) 18:49:32.10

国文法の細かい話題に参加する気はないが
人間が文法を間違えたときにどう処理するかは
自然言語処理で昔から問題になってる

Mb · 2018/07/16(月) 21:00:28.41

>>536
> 昔から問題になってる
っつーのはよく解る。
清少納言が「べきにもあらず」とか
書いてるけど、文法的には「べからず」が
正しいと思う。

「慣用形」として認めるのはアリだと思うが、
しょっちゅう使うから「慣用」なんであって、
そこを網羅するのがコンピュータの出番だと
思うんだがどうだろう。

つーか、記述文法の精度が低すぎるのが
本来の問題なんだが、

おまいら記述文法を舐めてねぇか？

という連中が自然言語処理業界に多すぎるのが
問題だと思うが。

**デフォルトの名無しさん** · 2018/07/16(月) 21:05:53.77

憤慨ポイントがよくわからない

自分のアプリで処理できないから怒ってるのか？

Mb · 2018/07/16(月) 21:14:19.70

>>536
“じつは”というか、“ぶっちゃけ”というか、
もう四半世紀（要するに二十五年以上）前から、
そこいらにあるパソコンの（形態素解析レベルの）チェック
能力は、人間を軽く超えているんだよ。
ただ、構文解析に関しては、国語学とか自然言語処理とか
数学とかコンピュータサイエンスとか認知心理学とか、
そのあたりの合意がとれてないわけよ。
だから、そのあたりを整理する必要があるわけなんだけど、
苫米地英人とかが引っ掻き回しやがってバカヤロウ、
みたいな話があるんだわ。

自然言語処理スレッド その４

自然言語処理スレッド　その４