自然言語処理スレッド その4

■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
垢版 |
2014/06/03(火) 05:40:00.54ID:yefNLumx
前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
2017/06/04(日) 09:01:30.87ID:cEslnT5b
まだ記号処理メインに考えることしかできないのか
2017/06/04(日) 11:13:02.02ID:tyP9sJMq
いろんなアプローチがあって然るべき
462デフォルトの名無しさん
垢版 |
2017/07/04(火) 03:55:25.73ID:NogRrZwu
 機械翻訳事業を手掛けるみらい翻訳が、深層学習技術を用いたニューラル機械翻訳エンジンを発表した。
現在、同社のサイトでデモが体験可能になっている。
 これは同社と国立研究開発法人情報通信研究機構(NICT)との共同研究によるもので、
深層学習技術の導入により、従来の統計的機械翻訳に比べて翻訳精度が大幅に向上していることが特徴。
対象となるのは日英双方向の翻訳で、なかでも和文英訳においては「TOEIC900点程度
のスコアを持つビジネスマンと同等以上の作文能力があることを確認」できたとアピールしている。
これらを搭載した企業向け翻訳アプリケーションサービスを本年11月から提供するとしているが、現在、
同社のサイトで「お試し翻訳」と称する無料版が利用できるようになっているほか、
共同開発を行ったNICTでは、Android/iOS向け音声翻訳アプリ「VoiceTra(ボイストラ)」
において同日付でこの技術を組み込んでいる。気になる人はまずは、こちらを試してみるとよさそうだ。

お試し翻訳(みらい翻訳)
https://www.miraitranslate.com/index.php#txt-t
TOEIC900点以上の英作文能力を持つ 深層学習による機械翻訳エンジンをリリース(みらい翻訳)
https://miraitranslate.com/news/313
ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現(NICT)
http://www.nict.go.jp/press/2017/06/28-1.html
http://internet.watch.impress.co.jp/docs/yajiuma/1067830.html
463デフォルトの名無しさん
垢版 |
2017/07/04(火) 04:20:24.35ID:8q3gEZqY
【大発見】おいwww3の倍数じゃない奇数を思い浮かべて2乗してから1引いてみろwwww絶対に24で割りきれるぞwwwww
2017/07/08(土) 21:24:46.98ID:qllAg7Nq
これは、「記号の接地問題」 が 解決 されたこと を 意味しており、
エージェント は、行動 と 結びついた 内発的な記号表現 として、
人間の言葉 である 英語 の 短文 を 学習していきます。

http://qiita.com/HirofumiYashima/items/9637d0a24fd661097c92
2017/07/08(土) 21:25:35.80ID:qllAg7Nq
DeepMindが自然言語理解の2難題を解決した

http://mabonki0725.hatenablog.com/entry/2017/07/08/132740
2017/07/08(土) 21:26:30.44ID:qllAg7Nq
https://www.youtube.com/embed/wJjdu1bPJ04?rel=0
2017/09/16(土) 21:36:54.93ID:qxgCBEdY
誰かmt summitに行く?
468デフォルトの名無しさん
垢版 |
2017/09/17(日) 21:31:26.60ID:kSa7kRax
ねえ?
2017/09/20(水) 13:30:26.68ID:ViTtt7T2
いないのかよ
470デフォルトの名無しさん
垢版 |
2018/03/09(金) 22:58:34.64ID:GTHolLBp
これ翻訳できる?
なんでみんな笑っているかわからん
Topic modelの授業の冒頭
I'm from Princeton in New Jersey where it's four o'clock in the morning.
(笑)
教えてくれ
471デフォルトの名無しさん
垢版 |
2018/03/10(土) 01:12:32.33ID:uUYTpCvs
>>470
たいへん。壺魔人がトイレから出てこない。
改札通れないんだと思う。

って言ってる。
472デフォルトの名無しさん
垢版 |
2018/03/10(土) 01:49:36.91ID:xzUBTHi1
↑全然おもろない
阿保丸出し
2018/03/10(土) 03:40:10.38ID:32LTkPVU
キマリの寝言だからな
474デフォルトの名無しさん
垢版 |
2018/03/15(木) 17:51:17.69ID:8tnce99v
新井紀子教授はすごくなかった
『新井紀子教授は研究者としてすごい』とタイトルにありますが、
皮肉で書いたわけではなく、本当にすごいと思っていました。
宣伝を大きくして予算を確保するということができる研究者は多くありません。
私も研究の世界にいたのでわかるのですが、いろいろと疑問のあるプロジェクトというのはよくあることで、
新井紀子教授の場合は宣伝が上手いゆえに、悪目立ちして損をしている部分はあると思います。
そして、そもそも個人攻撃は私の意図したところではありません。
https://mywarstory.tokyo/our-enemy/
475デフォルトの名無しさん
垢版 |
2018/03/15(木) 18:11:41.15ID:8tnce99v
新井紀子教授のAIやコンピュータに関する知識は素人に毛が生えた程度
新井紀子教授の『AI vs. 教科書が読めない子どもたち』という本が大変売れているようです。
私も本を購入し精読させていただきました。
一言で感想を言うと、新井紀子教授のAI技術に関する知識はせいぜいAI関連ニュースに詳しい人レベルであり、
そのベースであるコンピュータに関する知識もほぼ素人だということがわかりました。
https://mywarstory.tokyo/inconvenient-truth/
476デフォルトの名無しさん
垢版 |
2018/03/15(木) 21:50:00.22ID:8tnce99v
新井紀子教授はUniversity of Illinois Urbana-Champaignから1985年に数学の学士を授与された後、
博士課程に5年間在籍しているのにもかかわらず、1990年に修士号だけ授与されて退学しているようなので、
数学はあまり得意でないのかもしれません。
しかしそれにもかかわらずこれだけ世間をにぎわせていることは、能力よりも宣伝力の方が世間
に対するインパクトが大きいことを示していると思います。
https://mywarstory.tokyo/being-employed-is-easy/
2018/03/17(土) 15:18:31.03ID:MTX3HFRh
https://gigazine.net/news/20180315-microsoft-ai-chinese-translation/
MicrosoftのAI翻訳は中→英ニュース翻訳を人間の翻訳者と同じ精度でこなせるレベルに到達
478デフォルトの名無しさん
垢版 |
2018/03/19(月) 10:56:01.35ID:N8hV/6aX
初歩の整数論プログラミング
https://www.saoyagi2.net/integer/

整数問題を解答するプログラムも造っておきたい。
479デフォルトの名無しさん
垢版 |
2018/03/19(月) 11:00:55.47ID:N8hV/6aX
整数の操作と整数論に関連した関数
http://reference.wolfram.com/language/tutorial/IntegerAndNumberTheoreticalFunctions.html.ja
480デフォルトの名無しさん
垢版 |
2018/03/19(月) 13:27:48.98ID:pEbY2e08
>>476
途中までしか読んでいないけど、「現在の社会は人間のために作られていて、機械にとって優しくない。これはAI差別でなかろうか」という視点はどうでしょうか。
481デフォルトの名無しさん
垢版 |
2018/03/21(水) 20:30:25.43ID:QInlrutD
チンボがシコシコする!
482デフォルトの名無しさん
垢版 |
2018/03/22(木) 01:02:52.70ID:Z1JBGYGJ
チンボがシコシコする!
483デフォルトの名無しさん
垢版 |
2018/03/22(木) 04:56:52.06ID:HWN7MKDU
チンボがシコシコする!
484デフォルトの名無しさん
垢版 |
2018/03/23(金) 21:35:06.73ID:BM3HBGyY
自然科学、特に変化の速い人工知能関連の分野で日本語で最新の情報を得ようとしても限界があるので、
自分で英語の論文を読む以外のいい方法はないと思います。(無料です。)
こちらから気になるワードで検索してみてください。
自然科学の基礎研究に関して議論するのに適した場所は知りませんが、まずはQuoraかredditあたりで同じ質問をしてみてはいかがでしょうか?
Quoraはとても親切な人が多いので、丁寧に教えてもらえると思います。
https://mywarstory.tokyo/qa40/
485デフォルトの名無しさん
垢版 |
2018/03/24(土) 22:53:15.70ID:6mZ6T11K
(第1章 はじめに 2頁)
たとえば、CycはFredという名前の男が朝にひげをそるという話が理解できなかった。
Cycの推論エンジンは、この話の中に矛盾を見つけた。Cycは人間には電気の部品がないことは知っているが、
Fredが電気カミソリを持っていたので、エンティティ「Fredがひげそり中(FredWhileShaving)」
には電気の部品が含まれていると考えた。したがって、CycはFredがひげをそっている間、
Fredはそれでも人間なのかと尋ねた。

『深層学習』
著者:
Ian Goodfellow, イアングッドフェロー,
Yoshua Bengio, ヨシュアベンジオ,
Aaron Courville, アーロンカービル
2018/03/24(土) 22:54:29.46ID:CNBTHP/m
この人、素人面して海外でph.d取ってるじゃん
487デフォルトの名無しさん
垢版 |
2018/03/24(土) 22:55:30.16ID:6mZ6T11K
ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか?

チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。

オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。

違うか?

「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!
2018/03/25(日) 01:03:31.88ID:26j2IyXZ
「舌がピリピリする」みたいな
身体の受動的感覚なら文法的に可

「顔がニコニコする」みたいに
動作主体が人間なら不可
489デフォルトの名無しさん
垢版 |
2018/03/25(日) 13:25:32.26ID:WaYZZq21
https://mywarstory.tokyo/qa40/
490デフォルトの名無しさん
垢版 |
2018/03/25(日) 14:43:19.66ID:iTHR6DDw
自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては?
https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7
491デフォルトの名無しさん
垢版 |
2018/03/25(日) 16:31:05.25ID:qleen6XJ
>>490
そこのリンク先
URL直接貼れんけど
コメントわろた
2018/03/25(日) 22:51:24.22ID:26j2IyXZ
>>490
何がしたいのか不明確だが
UIを自然言語にするだけなら昔からある
コマンド入力型ADVゲームとかな
493デフォルトの名無しさん
垢版 |
2018/03/26(月) 01:29:09.56ID:FVXYqf1L
>>492
>コマンド入力型ADVゲームとかな

コマンドではなくて、50字以上100文字以下の、主語と述語と目的語と修飾語を含む自然言語文で。
2018/03/26(月) 03:16:49.02ID:1pM3oPKs
この質問されてるyu.とかいう人はそもそも何者なんだよ
twitterのプロフにPh.dと書くだけなら誰にでもできる
2018/03/26(月) 03:34:41.60ID:tuciBVy7
>>493
ない、作れ
2018/03/26(月) 06:35:12.71ID:QR480mqW
コンピューターのための自然言語理解シミュレ
ーターというのは可能ですか?

例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。
497デフォルトの名無しさん
垢版 |
2018/03/26(月) 20:51:09.10ID:tuciBVy7
残念だが人間と完全に同等のレベルで
自然言語を理解するのは現時点では不可能
人工無能を改良して上手く使っていくしかない
498デフォルトの名無しさん
垢版 |
2018/03/28(水) 06:05:44.86ID:KZCr/n70
        ||
        ||
      ∧||∧   
     ( / ⌒ヽ
      | |   |
      ∪ / ノ
       | ||
       ∪∪

      -━━-
2018/04/03(火) 08:25:58.10ID:a4DGjJqz
誰かSudachi使った人いる?
500デフォルトの名無しさん
垢版 |
2018/04/11(水) 14:17:19.53ID:XeDgccB8
チンボがシコシコする!
2018/05/12(土) 10:59:50.86ID:pDgCeBjY
共同ツール 1
https://seleck.cc/685

https://trello.com/
ボードのメニュー → Power-Upsから拡張可能 Slack DropBoxなど
Trello Chrome拡張機能 elegant
ttp://www.kikakulabo.com/service-eft/
trelloのオープンソースあり

共同ツール 2
https://www.google.com/intl/ja_jp/sheets/about/

共同ツール 3
https://slack.com/intl/ja-jp
https://www.dropbox.com/ja/
https://bitbucket.org/
https://ja.atlassian.com/software/sourcetree
https://sketchapp.com/extensions/plugins/
ttp://photoshopvip.net/103903

ttps://goodpatch.com/blog/sketch-plugins/
502デフォルトの名無しさん
垢版 |
2018/05/23(水) 19:52:19.56ID:Au5e7VGg
僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』

2OND8
2018/05/24(木) 11:01:13.03ID:cPlRxlDn
2OND8
504デフォルトの名無しさん
垢版 |
2018/06/26(火) 00:19:49.53ID:suPxm0NB
冒険者の広場では提案広場・あしあと伝言板にて言論規制がしかれている。
提案広場では主にスクエニに対して不利になるような発言
WiiUで発売してすぐ、ウィンドウズ版では出さないといっておきながら
発売を発表、それにより広場は荒れたものの、超速で削除。
両手剣スレイプニールのチート問題、これもチート行為は絶対にないと
いいきってからの問題発覚、これも荒れて超速削除。
他全年齢対象のためちょっとでも卑猥と感じる内容は削除
ネタバレと書かなければ、ネタバレと思われるものは削除
これについては運営側がネタバレと加筆すればいいだけの話だと思うけど。
あしあと伝言板は悪口と思われる内容の言葉が含まれていれば
自動で削除される。
この装備イカす→カス
ちょっとバカンスに行ってきます→バカ
パチンコばっかりいってた→チンコ
どう考えても冤罪削除。しかも累積すると冒険者の広場利用停止。
横暴。
ちなみに冤罪削除を訴えた発言も削除される。
異議申し立ても悪だというらしい。
サポートセンターに問い合わせたところ、調べてもくれなかった。
https://ameblo.jp/cinnamon-rilakkuma/entry-12317442377.html
505デフォルトの名無しさん
垢版 |
2018/07/04(水) 22:07:34.62ID:gFgZc5FG
5UX
2018/07/05(木) 16:32:39.56ID:AeL6VB/V
5UX
2018/07/09(月) 09:01:50.15ID:3agxr0Ec
誰か今日の研究会行く?
508Mb
垢版 |
2018/07/16(月) 06:02:54.03ID:RFTF6J3p
省略のある文を構文解析するときに、
あらかじめ「省略がある」と解っている場合は
いいんだが、文法が間違ってて「ないはずの省略が
あることになってしまっている」場合は
ややこしい話になりそうに思う。
「すごく面白い」は「省略なし」で「すごく」が
「面白い」にかかるんだが、「すごい面白い」だと、
構文解析木自体が変わってきてしまう。
それとも、「解析木自体が違う」と認識して、
もっと上位の意味解析とかで処理するほうが
いいのかね?
509Mb
垢版 |
2018/07/16(月) 06:18:39.78ID:RFTF6J3p
逆に、誤用とか慣用として、辞書レベルで処理しちゃったほうが
実用上は便利なのかね?
「そうすべきだ」なんていうのは、構造としては、
「そうするべきことだ」のはずなんだが、
「××する」みたいな附属語的な用法や、「漢字一字+s」
の形の五段活用動詞の連体形の変化形とは違って、単独の
「する」の連体形が「す」として使われる例はあんまりない
(文語じゃねぇんだから)。
で、「べき」は連体形だから、助動詞「だ/です/である」に
接続する場合は、本来は間に体言が入らないとおかしい。
でなかったら、「べし」と命令形にしちゃうのが文法的には
正だろう。
こういうのは、処理の観点からいうと、どう扱ったらいいのかね?
2018/07/16(月) 07:59:54.86ID:UiZWsBg0
好きにすれば?
511Mb
垢版 |
2018/07/16(月) 08:41:11.73ID:RFTF6J3p
>>510
それは、「おれは好きにするからユーザは文句言うな」
なのか、「ユーザが好きに処理できるように、アプリに
自由度を持たせろ」なのか。
512Mb
垢版 |
2018/07/16(月) 08:48:33.94ID:RFTF6J3p
そもそも、「人間のチェックには漏れがある」から
「コンピュータにチェックさせる」のが本筋なのに、
「コンピュータの解析精度が低いから、人間が
処理結果をチェックしないといけない」というのが
本末転倒だ。
標準表記外音は『常用漢字表』(昭和56内閣告示)によれば、
「時」には「と」の音はないため、「時計」を「とけい」と読むと
表記外になるとか、「日」には「に」の音はないため、「日本」を
「にほん」と読むと表記外となるとか、そんなの人間がチェックしたら
見落とすに決まってるだろ。
「じゃあ、他にはそういう例があるのか?」とかいったデータくらい、
ちゃんと用意してどっかに公開しておけというのだ。
513Mb
垢版 |
2018/07/16(月) 11:05:42.72ID:RFTF6J3p
だいたい、中学校で
「活用するのが『用言』で、活用しないのが『体言』」とか
教えてるくせに、
天(あめ→あま)
天日嗣(あまつひつぎ)・天津日嗣(あまつひつぎ)・天照大神(あまてらすおおみかみ)・天の川(あまのがわ)・天水(あまみず)
雨(あめ→あま)
雨足(あまあし)・雨脚(あまあし)・雨蛙(あまがえる)・雨傘(あまがさ)
・雨具(あまぐ)・雨乞い(あまごい)・雨水(あまみず)・雨漏り(あまもり)
雨(あめ→さめ)
秋雨(あきさめ)・霧雨(きりさめ)・小雨(こさめ)・細雨(ささめ)
・春雨(はるさめ)・氷雨(ひさめ)・村雨(むらさめ)
とかいうのはどう説明したらいいんだよ。
「日本語処理の技術者は、中学校レベルの文法知識も持っていない」って、
中学校で教えるのかよ。
で、高校受験や大学受験で、「本当のこと」を主張したら減点されて
不合格のリスクを負うのか?
それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。
514デフォルトの名無しさん
垢版 |
2018/07/16(月) 11:21:56.62ID:Tl1DHPio
>「活用するのが『用言』で、活用しないのが『体言』」とか
>教えてるくせに、

ええぇぇぇっ
515Mb
垢版 |
2018/07/16(月) 11:36:38.15ID:RFTF6J3p
>>514
> ええぇぇぇっ
いや、ここは驚くとこじゃねぇだろう。
中学二年で習う「文法」だと、
まず「自立語」と「附属語」の区別があって、
自立語のうち「その役割によって形を変える語」を
「用言」といい、「形を変えない語」を「体言」というと、
しっかり教科書に書いてある。
だもんだから、教師はそれを信じてテストの問題を作り、
それに「教師が正しいと思った解答」を書かなかった
児童・生徒は成績評価が低くなる。
で、「それはおかしいんじゃないですか?」とかいって
文句をつける保護者は、「モンスター・ペアレント」として
扱われる。

めでてぇな。
516デフォルトの名無しさん
垢版 |
2018/07/16(月) 11:36:41.25ID:1RDPQ2ba
最近少し興味を持った初心者なのですが、
2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で処理されるのですか?

例えば、

>それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。

おまいら自然言語処理をやっている人間は、それっておかしいとは思わんのか。

あなた方の様に自然言語の処理を行う人達は、「それはおかしい」と思わないのですか?
517デフォルトの名無しさん
垢版 |
2018/07/16(月) 11:54:52.76ID:KKQqxuup
>>515
その「教え方(ほんとなら)」に驚いてるんじゃなくて

>>513 の認識に驚いてる
2018/07/16(月) 12:10:49.45ID:LulkQD8r
しょせんは人が決めた分類なんで従うしかない

って書こうとしたけど
漢字って単語のさらに一部分で雨水はいつだってあまみずだから
雨水を単語として分類するとき体言にするのはべつに間違ってないような

https://kotobank.jp/word/%E4%BD%93%E8%A8%80-91058
定義もっとこまかかった最初の前提からちがう
519Mb
垢版 |
2018/07/16(月) 12:54:56.73ID:RFTF6J3p
>>518
> 漢字って単語のさらに一部分で雨水はいつだって「あまみず」だから
 開く(あく/ひらく)
 開ける(あける/ひらける)
 温める(あたためる/あっためる/ぬくめる)
 暖める(あたためる/あっためる)
 温まる(あたたまる/ぬくまる)
 言う・謂う・云う(いう/ゆう)
 怒る(いかる/おこる)
 行く・逝く・往く(いく/ゆく)
 射殺した(いころした/しゃさつした)
 抱く(いだく/だく)
 行った(いった/おこなった)
 出し((文)いでし/(現)だし/(文)でし)
 居る(いる/×おる)
 入る(いる/はいる)・入れない(いれない/はいれない)
 得る(うる/える)
(以下、規制に引っかかるので省略)
「雨水溝」は、「うすいこう」なのよ。
520Mb
垢版 |
2018/07/16(月) 13:03:08.07ID:RFTF6J3p
>>516
> 2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で
> 処理されるのですか?
いや、普通に処理してるけど?
「文法格の一意性」とか「非交差則」とかで説明できるんだけど。
ただ、「処理の結果が気にくわない!」って言ってる、自然言語処理
分野のヒトが邪魔してるだけだし。文語文法とかの研究者は、
「使えるツールがあれば欲しい」っていう要望があるんだけど。
そのあたりは早稲田大学の文理学部の筧先生とかに嘆願してね。
521Mb
垢版 |
2018/07/16(月) 13:08:49.98ID:RFTF6J3p
>>518
「の」とか「ん」で表される、いわゆる「準体助詞」は
主語にならないから体言じゃないんだな?
522Mb
垢版 |
2018/07/16(月) 13:12:52.10ID:RFTF6J3p
>>516
そのあたりは運用上の意味論がある。
わりと有名な例だが、
「てめぇは馬鹿か?」は通るが、
「あなたは知恵遅れではありませんか?」と
言ったら、血の雨が降る。
523Mb
垢版 |
2018/07/16(月) 13:16:06.01ID:RFTF6J3p
慣用・誤用、あるいはいわゆる“百姓読み”

口腔外科
「こうくうげか」ではなく「こうこうげか」。
清拭
「せいしき」ではなく「せいしょく」。
独壇場
正しくは「独擅場」と表記して、「どくせんじょう」。
疾病
「しつびょう」ではなく「しっぺい」。
偏執狂
「へんしつきょう」ではなく「へんしゅうきょう」。
情緒
慣用は「じょうちょ」。正式には「じょうしょ」。
膏肓
「病、膏肓に入る」は「やまいこうもうにいる」ではなく「やまいこうこうにいる」。
捏造
慣用は「ねつぞう」。正式には「でつぞう」。「捏ち上げる」は「でっちあげる」。
524Mb
垢版 |
2018/07/16(月) 13:17:32.40ID:RFTF6J3p
>>523
あ、ごめん。うっかり送信しちゃった。
525Mb
垢版 |
2018/07/16(月) 13:22:00.06ID:RFTF6J3p
>>519
続き。
 脅かす(おどかす/おびやかす)
 下り(おり/くだり)
 降り(おり/ふり)
 解す(かいす/ほぐす)
 通った(かよった/とおった)
 来る(きたる/くる)
 汚す(けがす/よごす)
 汚れる(けがれる/よごれる)
 煙る(けぶる/けむる)
 扱く(こく/しごく)
 栄える(さかえる/はえる)
 誘う(さそう/いざなう)
 認める(したためる/みとめる)
 狭まる(せばまる/はさまる)
 狭める(せばめる/はさめる)
 初めて(そめて/はじめて)
 逸らす(そらす/はやらす)
 逸れる(それる/はぐれる/はやれる)
 違う(たがう/ちがう)
 尊ぶ(たっとぶ/とうとぶ)
 貴ぶ(たっとぶ/とうとぶ)
 違える(たがえる/ちがえる)
 吐く(つく/はく)
 留める(とめる/とどめる)
 留まる(とまる/とどまる)
 叩く(たたく/はたく)
 弾く(はじく/ひく)
 瞬く(またたく/まばたく)
526Mb
垢版 |
2018/07/16(月) 13:25:35.64ID:RFTF6J3p
せっかくだから、最後までやっとこうか。
 (文)悪し(あし/わろし)
 良い・善い・好い(いい/よい)
 鈍い(にぶい/のろい)
 辛い(からい/つらい)
 難い(かたい/にくい)
 臭い(くさい/におい)
 尊い(たっとい/とうとい)
 貴い(たっとい/とうとい)
 難しい(むずかしい/むつかしい)
 (文)良し(よし/よろし)

(まだ続く)
527Mb
垢版 |
2018/07/16(月) 13:26:51.56ID:RFTF6J3p
 (文)悪し(あし/わろし)
 良い・善い・好い(いい/よい)
 鈍い(にぶい/のろい)
 辛い(からい/つらい)
 難い(かたい/にくい)
 臭い(くさい/におい)
 尊い(たっとい/とうとい)
 貴い(たっとい/とうとい)
 難しい(むずかしい/むつかしい)
 (文)良し(よし/よろし)

抜けてる例があったら知らせてくれ。
528Mb
垢版 |
2018/07/16(月) 13:29:11.05ID:RFTF6J3p
で、質問があったらカモーン! 歓迎するぜぇ!
529Mb
垢版 |
2018/07/16(月) 13:49:08.35ID:RFTF6J3p
>>517
> その「教え方(ほんとなら)」に驚いてるんじゃなくて
中学校の国語教科書なら神保町の三省堂書店で
売ってるから確かめてみたらどうだ。
530Mb
垢版 |
2018/07/16(月) 15:36:36.28ID:RFTF6J3p
ところで、
「ところで」を漢字で表記する場合、
「処で」「所で」「處で」のどれが正しいのか、
知っているヒトがいるんだったら教えてほしい。
本当に。
531デフォルトの名無しさん
垢版 |
2018/07/16(月) 16:15:34.93ID:Od4s/iux
>>523
確執は?
532Mb
垢版 |
2018/07/16(月) 16:59:58.75ID:RFTF6J3p
>>531
それは別板の話題だと思うが …
「固執」「執事」「偏執狂」との絡みで解決してくれい。
2018/07/16(月) 17:13:46.84ID:FxG3mwKE
なんでこの人ID真っ赤なの?
534Mb
垢版 |
2018/07/16(月) 17:22:46.07ID:RFTF6J3p
>>533
べつにおれの知ったこっちゃないんだが、
あっちゃこっちゃの板でヒトに嫌われるようなコトを
ホザいてたからだろう。
535Mb
垢版 |
2018/07/16(月) 17:30:44.70ID:RFTF6J3p
>>533
なんか知らんが、数学板とかプログラマ板とか、
あっちゃこっちゃで粘着してくる香具師がいるんだよ。
どうしたもんかなぁ …
2018/07/16(月) 18:49:32.10ID:Weu21Vcy
国文法の細かい話題に参加する気はないが
人間が文法を間違えたときにどう処理するかは
自然言語処理で昔から問題になってる
537Mb
垢版 |
2018/07/16(月) 21:00:28.41ID:RFTF6J3p
>>536
> 昔から問題になってる
っつーのはよく解る。
清少納言が「べきにもあらず」とか
書いてるけど、文法的には「べからず」が
正しいと思う。

「慣用形」として認めるのはアリだと思うが、
しょっちゅう使うから「慣用」なんであって、
そこを網羅するのがコンピュータの出番だと
思うんだがどうだろう。

つーか、記述文法の精度が低すぎるのが
本来の問題なんだが、

おまいら記述文法を舐めてねぇか?

という連中が自然言語処理業界に多すぎるのが
問題だと思うが。
2018/07/16(月) 21:05:53.77ID:LulkQD8r
憤慨ポイントがよくわからない

自分のアプリで処理できないから怒ってるのか?
539Mb
垢版 |
2018/07/16(月) 21:14:19.70ID:RFTF6J3p
>>536
“じつは”というか、“ぶっちゃけ”というか、
もう四半世紀(要するに二十五年以上)前から、
そこいらにあるパソコンの(形態素解析レベルの)チェック
能力は、人間を軽く超えているんだよ。
ただ、構文解析に関しては、国語学とか自然言語処理とか
数学とかコンピュータサイエンスとか認知心理学とか、
そのあたりの合意がとれてないわけよ。
だから、そのあたりを整理する必要があるわけなんだけど、
苫米地 英人とかが引っ掻き回しやがってバカヤロウ、
みたいな話があるんだわ。
540Mb
垢版 |
2018/07/16(月) 21:24:18.35ID:RFTF6J3p
>>538
そもそも先人の業績をないがしろにしてるところが
気にくわんのだよ。
処理はできるんだが、その結果が「気に食わん」という奴が
いるわけだ。
「文法格の一意性」とか「非交差則」とか言うと、
学会で「こいつ GC とか信じてやがる pgr」とか云われるんだよ。
541Mb
垢版 |
2018/07/16(月) 21:28:39.50ID:RFTF6J3p
>>540
× GC
〇 CG
汎文法(common grammer)な。
「文を構成するのは述語である」とか、
「述語に対する役割が、文法格である」とかいった、
「言語には、基本的な構成要素がある」っていう
構造主義的な立場だ。
2018/07/16(月) 21:48:34.53ID:LulkQD8r
文法よりまずおまえの頭を整理したほうがいいきがする
結局なにゆーてんかわからん
543Mb
垢版 |
2018/07/16(月) 22:09:23.58ID:RFTF6J3p
>>542
とりあえず、トポロジーとかカタストロフィ理論とかから
勉強してきてくれるとありがたいんだが。
一から説明してると面倒臭いんだわ。

「私はラーメンを餃子を喰う」とは言わんだろ?
「私はラーメンと餃子を喰う」んだわ。
「喰う」という動詞に対して、文法格を
持つ対象は一意なんだよ。だから、「ラーメンと餃子」というふうに、
集合体になってるわけ。これが、「文法格の一意性」。
2018/07/16(月) 22:12:55.13ID:LulkQD8r
2行目で頭がフットーした
絶対おれの知識不足じゃなくてお前の話し方に問題がある
545Mb
垢版 |
2018/07/16(月) 22:12:55.55ID:RFTF6J3p
>>542
でもって、昔(文語文法)は形容詞は述語になってたんだが、
いまの文法(いわゆる学校文法)では、形容詞は述語に
ならんのよ。だから、

「象は鼻が長い」

は、「述語がないのに主語が二つもあるのはおかしい!」という
批判が出てるわけ。

おわかりか?
2018/07/16(月) 22:28:36.42ID:LulkQD8r
文法の細かいことはほとんどわからんが

ようはその文法格とかをメインに考えてきたおまいらの方針が
AIとかの漠然とした解析方法に押されて消えちゃいそうで
危機感を感じて発狂してるということなのか?
2018/07/16(月) 22:55:46.12ID:LulkQD8r
批判ってつまり
今の文法格の考え方じゃ対処できてないじゃんって
おまいさんが突っ込まれたってことだよね

誰かが日本語の文法批判してるみたいじゃねーかまぎらわしい


それともなにか
本当に教育に干渉して日本語の文法に変更を加えようとしてるのか
548Mb
垢版 |
2018/07/17(火) 09:14:36.43ID:iAzNVHws
>>547
> 誰かが日本語の文法批判してるみたいじゃねーか
> まぎらわしい
国語学者が中学校の現代国語で教えられている
「いわゆる学校文法」を批判してるんだよ。
「学校文法 批判」でググると五十万件以上
ヒットするから読んでみるといい。
特に、文語文法を教えてる先生は、言葉が通じなくて
頭を抱えてる。
549Mb
垢版 |
2018/07/17(火) 09:25:46.63ID:iAzNVHws
>>546
つーか、自然言語処理自体が AI の一分野なんだよ。
だけど、事前言語処理をやっている人間の多くは
學校文法の延長でしか日本語の文法を捉えていないので、
日本語処理の技術の進歩が停滞しとるのよ。
550Mb
垢版 |
2018/07/17(火) 09:28:18.11ID:iAzNVHws
>>547
これなんか、よくまとまってる。
ttps://ci.nii.ac.jp/els/contentscinii_20180717092612.pdf?id=ART0001102905
551Mb
垢版 |
2018/07/17(火) 09:34:38.84ID:iAzNVHws
なお、本居春庭が悪いとか、橋本進吉が悪いとかいう話ではない
(大野晋先生は橋本進吉先生の弟子)。
中学校の文法教育が、文法嫌いを六十年以上拡大再生産
しているのが悪い、っちゅー話。
2018/07/17(火) 14:03:22.52ID:ejUOYbm+
いまどきAIの分野でない自然言語処理なんてあるの?
553Mb
垢版 |
2018/07/17(火) 14:40:42.81ID:iAzNVHws
>>552
ある。「かな漢字変換」とか「ローマ字かな変換」とかな。
「programwo」は、本来なら「プログラム(program)を」と
変換してほしいところだが、「pろgらmを」と変換される。
これを「AI の限界」とか言ってる奴も多いが、
技術的にはすでに解決されてる。
554Mb
垢版 |
2018/07/17(火) 14:50:17.21ID:iAzNVHws
>>552
かな漢字変換システムの形容詞の辞書登録で、
「i」とか「e」とかで終わる形容詞を登録してみ?
「i」終わりは「みみっちい」「ばっちい(ばばっちい)」
くらいしか存在しないので、登録時のチェックで注意喚起
してくれるのが正しいありかただ。
「e」末尾は、「かそけき」「さやけき」「むくつけき」「猛き」
あたりが該当するが、現代語の連体形が存在しないので、
「かそけい」「さやけい」「むくつけい」「猛い」が
変換候補として出てきたときに腹が立つかどうか、という
話になる。
555Mb
垢版 |
2018/07/17(火) 14:55:42.16ID:iAzNVHws
でもって、自然言語処理というのは、一般的に
「形態素解析ができて、それを構文解析したときに、
正しい(ちゅーか、実用的な)解析木(ちゅーか、
情報処理するときに扱いやすいデータ構造)に落ちるか
どうか」が勝負なんだよ。
だけど、「そんな解析木は認めない!」ていって
頑張っている奴が業界を押さえていると、日本語処理
っていうもの自体が成り立たなくなるわけだ。
だから、「まず、記述文法から交通整理しよう」っちゅー
話をしとるわけよ。
556Mb
垢版 |
2018/07/17(火) 15:08:30.84ID:iAzNVHws
「日本人は髪が黒い」という表現は、「黒い」が「髪」を連体修飾
してて、「髪」がとりたてによって強調されているから、「黒い」
の前に出てきて、とりたて詞「が」が用いられる、って言っただけで、
学会で吊るし上げを喰らうんだぞ?
で、まともな反論が返ってくるならともかく、
「くぁwせdrftgyふじこふじこふじこ!」
みたいなコトになるんだぞ?
「いや、ちゃんと動いてるシステムがあるんですが」とか
言っても、「あーあーあーあーあー聞こえない聞こえない聞こえなーい」
みたいな反応しか返ってこないんだぞ?
だけど、普通の研究者は逆らえないんだ。そういう連中は、大っぴらには
言えんけど大きな企業で国の予算を貰っていて、その一部をスポンサーとして
研究機関に流してるところから来た、背広着てネクタイ締めて学会に来てる
ような連中だからだ。
「日本語処理が実用化されたりなんかしたら、研究費が出なくなって
自分らが干上がる」というのを知っている連中が、日本語処理業界に
巣食ってるんだよ。
2018/07/17(火) 15:53:21.98ID:EeLIetXI
>>556
どこの学会よ?
情処やJSAIはもちろんNLP学会でもそんなの見たことないが
558デフォルトの名無しさん
垢版 |
2018/07/17(火) 16:56:24.01ID:GZ88p15f
原子力学会かよ
559Mb
垢版 |
2018/07/17(火) 17:08:28.25ID:iAzNVHws
>>557 >>558
自然言語処理に関係してる学会なんて、
だいたい想像つくだろうに。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況