前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/
このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。
探検
自然言語処理スレッド その4
■ このスレッドは過去ログ倉庫に格納されています
1デフォルトの名無しさん
2014/06/03(火) 05:40:00.54ID:yefNLumx460デフォルトの名無しさん
2017/06/04(日) 09:01:30.87ID:cEslnT5b まだ記号処理メインに考えることしかできないのか
461デフォルトの名無しさん
2017/06/04(日) 11:13:02.02ID:tyP9sJMq いろんなアプローチがあって然るべき
462デフォルトの名無しさん
2017/07/04(火) 03:55:25.73ID:NogRrZwu 機械翻訳事業を手掛けるみらい翻訳が、深層学習技術を用いたニューラル機械翻訳エンジンを発表した。
現在、同社のサイトでデモが体験可能になっている。
これは同社と国立研究開発法人情報通信研究機構(NICT)との共同研究によるもので、
深層学習技術の導入により、従来の統計的機械翻訳に比べて翻訳精度が大幅に向上していることが特徴。
対象となるのは日英双方向の翻訳で、なかでも和文英訳においては「TOEIC900点程度
のスコアを持つビジネスマンと同等以上の作文能力があることを確認」できたとアピールしている。
これらを搭載した企業向け翻訳アプリケーションサービスを本年11月から提供するとしているが、現在、
同社のサイトで「お試し翻訳」と称する無料版が利用できるようになっているほか、
共同開発を行ったNICTでは、Android/iOS向け音声翻訳アプリ「VoiceTra(ボイストラ)」
において同日付でこの技術を組み込んでいる。気になる人はまずは、こちらを試してみるとよさそうだ。
お試し翻訳(みらい翻訳)
https://www.miraitranslate.com/index.php#txt-t
TOEIC900点以上の英作文能力を持つ 深層学習による機械翻訳エンジンをリリース(みらい翻訳)
https://miraitranslate.com/news/313
ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現(NICT)
http://www.nict.go.jp/press/2017/06/28-1.html
http://internet.watch.impress.co.jp/docs/yajiuma/1067830.html
現在、同社のサイトでデモが体験可能になっている。
これは同社と国立研究開発法人情報通信研究機構(NICT)との共同研究によるもので、
深層学習技術の導入により、従来の統計的機械翻訳に比べて翻訳精度が大幅に向上していることが特徴。
対象となるのは日英双方向の翻訳で、なかでも和文英訳においては「TOEIC900点程度
のスコアを持つビジネスマンと同等以上の作文能力があることを確認」できたとアピールしている。
これらを搭載した企業向け翻訳アプリケーションサービスを本年11月から提供するとしているが、現在、
同社のサイトで「お試し翻訳」と称する無料版が利用できるようになっているほか、
共同開発を行ったNICTでは、Android/iOS向け音声翻訳アプリ「VoiceTra(ボイストラ)」
において同日付でこの技術を組み込んでいる。気になる人はまずは、こちらを試してみるとよさそうだ。
お試し翻訳(みらい翻訳)
https://www.miraitranslate.com/index.php#txt-t
TOEIC900点以上の英作文能力を持つ 深層学習による機械翻訳エンジンをリリース(みらい翻訳)
https://miraitranslate.com/news/313
ニューラル機械翻訳で音声翻訳アプリVoiceTraが更なる高精度化を実現(NICT)
http://www.nict.go.jp/press/2017/06/28-1.html
http://internet.watch.impress.co.jp/docs/yajiuma/1067830.html
463デフォルトの名無しさん
2017/07/04(火) 04:20:24.35ID:8q3gEZqY 【大発見】おいwww3の倍数じゃない奇数を思い浮かべて2乗してから1引いてみろwwww絶対に24で割りきれるぞwwwww
464デフォルトの名無しさん
2017/07/08(土) 21:24:46.98ID:qllAg7Nq これは、「記号の接地問題」 が 解決 されたこと を 意味しており、
エージェント は、行動 と 結びついた 内発的な記号表現 として、
人間の言葉 である 英語 の 短文 を 学習していきます。
http://qiita.com/HirofumiYashima/items/9637d0a24fd661097c92
エージェント は、行動 と 結びついた 内発的な記号表現 として、
人間の言葉 である 英語 の 短文 を 学習していきます。
http://qiita.com/HirofumiYashima/items/9637d0a24fd661097c92
465デフォルトの名無しさん
2017/07/08(土) 21:25:35.80ID:qllAg7Nq466デフォルトの名無しさん
2017/07/08(土) 21:26:30.44ID:qllAg7Nq467デフォルトの名無しさん
2017/09/16(土) 21:36:54.93ID:qxgCBEdY 誰かmt summitに行く?
468デフォルトの名無しさん
2017/09/17(日) 21:31:26.60ID:kSa7kRax ねえ?
469デフォルトの名無しさん
2017/09/20(水) 13:30:26.68ID:ViTtt7T2 いないのかよ
470デフォルトの名無しさん
2018/03/09(金) 22:58:34.64ID:GTHolLBp これ翻訳できる?
なんでみんな笑っているかわからん
Topic modelの授業の冒頭
I'm from Princeton in New Jersey where it's four o'clock in the morning.
(笑)
教えてくれ
なんでみんな笑っているかわからん
Topic modelの授業の冒頭
I'm from Princeton in New Jersey where it's four o'clock in the morning.
(笑)
教えてくれ
471デフォルトの名無しさん
2018/03/10(土) 01:12:32.33ID:uUYTpCvs472デフォルトの名無しさん
2018/03/10(土) 01:49:36.91ID:xzUBTHi1 ↑全然おもろない
阿保丸出し
阿保丸出し
473デフォルトの名無しさん
2018/03/10(土) 03:40:10.38ID:32LTkPVU キマリの寝言だからな
474デフォルトの名無しさん
2018/03/15(木) 17:51:17.69ID:8tnce99v 新井紀子教授はすごくなかった
『新井紀子教授は研究者としてすごい』とタイトルにありますが、
皮肉で書いたわけではなく、本当にすごいと思っていました。
宣伝を大きくして予算を確保するということができる研究者は多くありません。
私も研究の世界にいたのでわかるのですが、いろいろと疑問のあるプロジェクトというのはよくあることで、
新井紀子教授の場合は宣伝が上手いゆえに、悪目立ちして損をしている部分はあると思います。
そして、そもそも個人攻撃は私の意図したところではありません。
https://mywarstory.tokyo/our-enemy/
『新井紀子教授は研究者としてすごい』とタイトルにありますが、
皮肉で書いたわけではなく、本当にすごいと思っていました。
宣伝を大きくして予算を確保するということができる研究者は多くありません。
私も研究の世界にいたのでわかるのですが、いろいろと疑問のあるプロジェクトというのはよくあることで、
新井紀子教授の場合は宣伝が上手いゆえに、悪目立ちして損をしている部分はあると思います。
そして、そもそも個人攻撃は私の意図したところではありません。
https://mywarstory.tokyo/our-enemy/
475デフォルトの名無しさん
2018/03/15(木) 18:11:41.15ID:8tnce99v 新井紀子教授のAIやコンピュータに関する知識は素人に毛が生えた程度
新井紀子教授の『AI vs. 教科書が読めない子どもたち』という本が大変売れているようです。
私も本を購入し精読させていただきました。
一言で感想を言うと、新井紀子教授のAI技術に関する知識はせいぜいAI関連ニュースに詳しい人レベルであり、
そのベースであるコンピュータに関する知識もほぼ素人だということがわかりました。
https://mywarstory.tokyo/inconvenient-truth/
新井紀子教授の『AI vs. 教科書が読めない子どもたち』という本が大変売れているようです。
私も本を購入し精読させていただきました。
一言で感想を言うと、新井紀子教授のAI技術に関する知識はせいぜいAI関連ニュースに詳しい人レベルであり、
そのベースであるコンピュータに関する知識もほぼ素人だということがわかりました。
https://mywarstory.tokyo/inconvenient-truth/
476デフォルトの名無しさん
2018/03/15(木) 21:50:00.22ID:8tnce99v 新井紀子教授はUniversity of Illinois Urbana-Champaignから1985年に数学の学士を授与された後、
博士課程に5年間在籍しているのにもかかわらず、1990年に修士号だけ授与されて退学しているようなので、
数学はあまり得意でないのかもしれません。
しかしそれにもかかわらずこれだけ世間をにぎわせていることは、能力よりも宣伝力の方が世間
に対するインパクトが大きいことを示していると思います。
https://mywarstory.tokyo/being-employed-is-easy/
博士課程に5年間在籍しているのにもかかわらず、1990年に修士号だけ授与されて退学しているようなので、
数学はあまり得意でないのかもしれません。
しかしそれにもかかわらずこれだけ世間をにぎわせていることは、能力よりも宣伝力の方が世間
に対するインパクトが大きいことを示していると思います。
https://mywarstory.tokyo/being-employed-is-easy/
477デフォルトの名無しさん
2018/03/17(土) 15:18:31.03ID:MTX3HFRh https://gigazine.net/news/20180315-microsoft-ai-chinese-translation/
MicrosoftのAI翻訳は中→英ニュース翻訳を人間の翻訳者と同じ精度でこなせるレベルに到達
MicrosoftのAI翻訳は中→英ニュース翻訳を人間の翻訳者と同じ精度でこなせるレベルに到達
478デフォルトの名無しさん
2018/03/19(月) 10:56:01.35ID:N8hV/6aX479デフォルトの名無しさん
2018/03/19(月) 11:00:55.47ID:N8hV/6aX480デフォルトの名無しさん
2018/03/19(月) 13:27:48.98ID:pEbY2e08 >>476
途中までしか読んでいないけど、「現在の社会は人間のために作られていて、機械にとって優しくない。これはAI差別でなかろうか」という視点はどうでしょうか。
途中までしか読んでいないけど、「現在の社会は人間のために作られていて、機械にとって優しくない。これはAI差別でなかろうか」という視点はどうでしょうか。
481デフォルトの名無しさん
2018/03/21(水) 20:30:25.43ID:QInlrutD チンボがシコシコする!
482デフォルトの名無しさん
2018/03/22(木) 01:02:52.70ID:Z1JBGYGJ チンボがシコシコする!
483デフォルトの名無しさん
2018/03/22(木) 04:56:52.06ID:HWN7MKDU チンボがシコシコする!
484デフォルトの名無しさん
2018/03/23(金) 21:35:06.73ID:BM3HBGyY 自然科学、特に変化の速い人工知能関連の分野で日本語で最新の情報を得ようとしても限界があるので、
自分で英語の論文を読む以外のいい方法はないと思います。(無料です。)
こちらから気になるワードで検索してみてください。
自然科学の基礎研究に関して議論するのに適した場所は知りませんが、まずはQuoraかredditあたりで同じ質問をしてみてはいかがでしょうか?
Quoraはとても親切な人が多いので、丁寧に教えてもらえると思います。
https://mywarstory.tokyo/qa40/
自分で英語の論文を読む以外のいい方法はないと思います。(無料です。)
こちらから気になるワードで検索してみてください。
自然科学の基礎研究に関して議論するのに適した場所は知りませんが、まずはQuoraかredditあたりで同じ質問をしてみてはいかがでしょうか?
Quoraはとても親切な人が多いので、丁寧に教えてもらえると思います。
https://mywarstory.tokyo/qa40/
485デフォルトの名無しさん
2018/03/24(土) 22:53:15.70ID:6mZ6T11K (第1章 はじめに 2頁)
たとえば、CycはFredという名前の男が朝にひげをそるという話が理解できなかった。
Cycの推論エンジンは、この話の中に矛盾を見つけた。Cycは人間には電気の部品がないことは知っているが、
Fredが電気カミソリを持っていたので、エンティティ「Fredがひげそり中(FredWhileShaving)」
には電気の部品が含まれていると考えた。したがって、CycはFredがひげをそっている間、
Fredはそれでも人間なのかと尋ねた。
『深層学習』
著者:
Ian Goodfellow, イアングッドフェロー,
Yoshua Bengio, ヨシュアベンジオ,
Aaron Courville, アーロンカービル
たとえば、CycはFredという名前の男が朝にひげをそるという話が理解できなかった。
Cycの推論エンジンは、この話の中に矛盾を見つけた。Cycは人間には電気の部品がないことは知っているが、
Fredが電気カミソリを持っていたので、エンティティ「Fredがひげそり中(FredWhileShaving)」
には電気の部品が含まれていると考えた。したがって、CycはFredがひげをそっている間、
Fredはそれでも人間なのかと尋ねた。
『深層学習』
著者:
Ian Goodfellow, イアングッドフェロー,
Yoshua Bengio, ヨシュアベンジオ,
Aaron Courville, アーロンカービル
486デフォルトの名無しさん
2018/03/24(土) 22:54:29.46ID:CNBTHP/m この人、素人面して海外でph.d取ってるじゃん
487デフォルトの名無しさん
2018/03/24(土) 22:55:30.16ID:6mZ6T11K ところで「チンボがシコシコする」という日本語表現は、文法的に正しいのか?
チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。
オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。
違うか?
「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!
チンボ「を」シコシコするのではなくて、チンボ「が」シコシコする。この場合、「チンボ」は主語となる。
オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンボ)が繋がっている場合と、
全体(俺)と部分(チンボ)が別々になっている場合とが考えられる。けれども「チンボ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。
違うか?
「頭がズキズキする」は良いが、「チンボがシコシコする」はダメな理由を、50字以内で述べろ!
488デフォルトの名無しさん
2018/03/25(日) 01:03:31.88ID:26j2IyXZ 「舌がピリピリする」みたいな
身体の受動的感覚なら文法的に可
「顔がニコニコする」みたいに
動作主体が人間なら不可
身体の受動的感覚なら文法的に可
「顔がニコニコする」みたいに
動作主体が人間なら不可
489デフォルトの名無しさん
2018/03/25(日) 13:25:32.26ID:WaYZZq21490デフォルトの名無しさん
2018/03/25(日) 14:43:19.66ID:iTHR6DDw 自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては?
https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7
https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7
491デフォルトの名無しさん
2018/03/25(日) 16:31:05.25ID:qleen6XJ492デフォルトの名無しさん
2018/03/25(日) 22:51:24.22ID:26j2IyXZ493デフォルトの名無しさん
2018/03/26(月) 01:29:09.56ID:FVXYqf1L494デフォルトの名無しさん
2018/03/26(月) 03:16:49.02ID:1pM3oPKs この質問されてるyu.とかいう人はそもそも何者なんだよ
twitterのプロフにPh.dと書くだけなら誰にでもできる
twitterのプロフにPh.dと書くだけなら誰にでもできる
495デフォルトの名無しさん
2018/03/26(月) 03:34:41.60ID:tuciBVy7 >>493
ない、作れ
ない、作れ
496デフォルトの名無しさん
2018/03/26(月) 06:35:12.71ID:QR480mqW コンピューターのための自然言語理解シミュレ
ーターというのは可能ですか?
例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。
ーターというのは可能ですか?
例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。
497デフォルトの名無しさん
2018/03/26(月) 20:51:09.10ID:tuciBVy7 残念だが人間と完全に同等のレベルで
自然言語を理解するのは現時点では不可能
人工無能を改良して上手く使っていくしかない
自然言語を理解するのは現時点では不可能
人工無能を改良して上手く使っていくしかない
498デフォルトの名無しさん
2018/03/28(水) 06:05:44.86ID:KZCr/n70 ||
||
∧||∧
( / ⌒ヽ
| | |
∪ / ノ
| ||
∪∪
-━━-
||
∧||∧
( / ⌒ヽ
| | |
∪ / ノ
| ||
∪∪
-━━-
499デフォルトの名無しさん
2018/04/03(火) 08:25:58.10ID:a4DGjJqz 誰かSudachi使った人いる?
500デフォルトの名無しさん
2018/04/11(水) 14:17:19.53ID:XeDgccB8 チンボがシコシコする!
501デフォルトの名無しさん
2018/05/12(土) 10:59:50.86ID:pDgCeBjY 共同ツール 1
https://seleck.cc/685
https://trello.com/
ボードのメニュー → Power-Upsから拡張可能 Slack DropBoxなど
Trello Chrome拡張機能 elegant
ttp://www.kikakulabo.com/service-eft/
trelloのオープンソースあり
共同ツール 2
https://www.google.com/intl/ja_jp/sheets/about/
共同ツール 3
https://slack.com/intl/ja-jp
https://www.dropbox.com/ja/
https://bitbucket.org/
https://ja.atlassian.com/software/sourcetree
https://sketchapp.com/extensions/plugins/
ttp://photoshopvip.net/103903
ttps://goodpatch.com/blog/sketch-plugins/
https://seleck.cc/685
https://trello.com/
ボードのメニュー → Power-Upsから拡張可能 Slack DropBoxなど
Trello Chrome拡張機能 elegant
ttp://www.kikakulabo.com/service-eft/
trelloのオープンソースあり
共同ツール 2
https://www.google.com/intl/ja_jp/sheets/about/
共同ツール 3
https://slack.com/intl/ja-jp
https://www.dropbox.com/ja/
https://bitbucket.org/
https://ja.atlassian.com/software/sourcetree
https://sketchapp.com/extensions/plugins/
ttp://photoshopvip.net/103903
ttps://goodpatch.com/blog/sketch-plugins/
502デフォルトの名無しさん
2018/05/23(水) 19:52:19.56ID:Au5e7VGg 僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
2OND8
役に立つかもしれません
グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』
2OND8
503デフォルトの名無しさん
2018/05/24(木) 11:01:13.03ID:cPlRxlDn 2OND8
504デフォルトの名無しさん
2018/06/26(火) 00:19:49.53ID:suPxm0NB 冒険者の広場では提案広場・あしあと伝言板にて言論規制がしかれている。
提案広場では主にスクエニに対して不利になるような発言
WiiUで発売してすぐ、ウィンドウズ版では出さないといっておきながら
発売を発表、それにより広場は荒れたものの、超速で削除。
両手剣スレイプニールのチート問題、これもチート行為は絶対にないと
いいきってからの問題発覚、これも荒れて超速削除。
他全年齢対象のためちょっとでも卑猥と感じる内容は削除
ネタバレと書かなければ、ネタバレと思われるものは削除
これについては運営側がネタバレと加筆すればいいだけの話だと思うけど。
あしあと伝言板は悪口と思われる内容の言葉が含まれていれば
自動で削除される。
この装備イカす→カス
ちょっとバカンスに行ってきます→バカ
パチンコばっかりいってた→チンコ
どう考えても冤罪削除。しかも累積すると冒険者の広場利用停止。
横暴。
ちなみに冤罪削除を訴えた発言も削除される。
異議申し立ても悪だというらしい。
サポートセンターに問い合わせたところ、調べてもくれなかった。
https://ameblo.jp/cinnamon-rilakkuma/entry-12317442377.html
提案広場では主にスクエニに対して不利になるような発言
WiiUで発売してすぐ、ウィンドウズ版では出さないといっておきながら
発売を発表、それにより広場は荒れたものの、超速で削除。
両手剣スレイプニールのチート問題、これもチート行為は絶対にないと
いいきってからの問題発覚、これも荒れて超速削除。
他全年齢対象のためちょっとでも卑猥と感じる内容は削除
ネタバレと書かなければ、ネタバレと思われるものは削除
これについては運営側がネタバレと加筆すればいいだけの話だと思うけど。
あしあと伝言板は悪口と思われる内容の言葉が含まれていれば
自動で削除される。
この装備イカす→カス
ちょっとバカンスに行ってきます→バカ
パチンコばっかりいってた→チンコ
どう考えても冤罪削除。しかも累積すると冒険者の広場利用停止。
横暴。
ちなみに冤罪削除を訴えた発言も削除される。
異議申し立ても悪だというらしい。
サポートセンターに問い合わせたところ、調べてもくれなかった。
https://ameblo.jp/cinnamon-rilakkuma/entry-12317442377.html
505デフォルトの名無しさん
2018/07/04(水) 22:07:34.62ID:gFgZc5FG 5UX
506デフォルトの名無しさん
2018/07/05(木) 16:32:39.56ID:AeL6VB/V 5UX
507デフォルトの名無しさん
2018/07/09(月) 09:01:50.15ID:3agxr0Ec 誰か今日の研究会行く?
508Mb
2018/07/16(月) 06:02:54.03ID:RFTF6J3p 省略のある文を構文解析するときに、
あらかじめ「省略がある」と解っている場合は
いいんだが、文法が間違ってて「ないはずの省略が
あることになってしまっている」場合は
ややこしい話になりそうに思う。
「すごく面白い」は「省略なし」で「すごく」が
「面白い」にかかるんだが、「すごい面白い」だと、
構文解析木自体が変わってきてしまう。
それとも、「解析木自体が違う」と認識して、
もっと上位の意味解析とかで処理するほうが
いいのかね?
あらかじめ「省略がある」と解っている場合は
いいんだが、文法が間違ってて「ないはずの省略が
あることになってしまっている」場合は
ややこしい話になりそうに思う。
「すごく面白い」は「省略なし」で「すごく」が
「面白い」にかかるんだが、「すごい面白い」だと、
構文解析木自体が変わってきてしまう。
それとも、「解析木自体が違う」と認識して、
もっと上位の意味解析とかで処理するほうが
いいのかね?
509Mb
2018/07/16(月) 06:18:39.78ID:RFTF6J3p 逆に、誤用とか慣用として、辞書レベルで処理しちゃったほうが
実用上は便利なのかね?
「そうすべきだ」なんていうのは、構造としては、
「そうするべきことだ」のはずなんだが、
「××する」みたいな附属語的な用法や、「漢字一字+s」
の形の五段活用動詞の連体形の変化形とは違って、単独の
「する」の連体形が「す」として使われる例はあんまりない
(文語じゃねぇんだから)。
で、「べき」は連体形だから、助動詞「だ/です/である」に
接続する場合は、本来は間に体言が入らないとおかしい。
でなかったら、「べし」と命令形にしちゃうのが文法的には
正だろう。
こういうのは、処理の観点からいうと、どう扱ったらいいのかね?
実用上は便利なのかね?
「そうすべきだ」なんていうのは、構造としては、
「そうするべきことだ」のはずなんだが、
「××する」みたいな附属語的な用法や、「漢字一字+s」
の形の五段活用動詞の連体形の変化形とは違って、単独の
「する」の連体形が「す」として使われる例はあんまりない
(文語じゃねぇんだから)。
で、「べき」は連体形だから、助動詞「だ/です/である」に
接続する場合は、本来は間に体言が入らないとおかしい。
でなかったら、「べし」と命令形にしちゃうのが文法的には
正だろう。
こういうのは、処理の観点からいうと、どう扱ったらいいのかね?
510デフォルトの名無しさん
2018/07/16(月) 07:59:54.86ID:UiZWsBg0 好きにすれば?
511Mb
2018/07/16(月) 08:41:11.73ID:RFTF6J3p512Mb
2018/07/16(月) 08:48:33.94ID:RFTF6J3p そもそも、「人間のチェックには漏れがある」から
「コンピュータにチェックさせる」のが本筋なのに、
「コンピュータの解析精度が低いから、人間が
処理結果をチェックしないといけない」というのが
本末転倒だ。
標準表記外音は『常用漢字表』(昭和56内閣告示)によれば、
「時」には「と」の音はないため、「時計」を「とけい」と読むと
表記外になるとか、「日」には「に」の音はないため、「日本」を
「にほん」と読むと表記外となるとか、そんなの人間がチェックしたら
見落とすに決まってるだろ。
「じゃあ、他にはそういう例があるのか?」とかいったデータくらい、
ちゃんと用意してどっかに公開しておけというのだ。
「コンピュータにチェックさせる」のが本筋なのに、
「コンピュータの解析精度が低いから、人間が
処理結果をチェックしないといけない」というのが
本末転倒だ。
標準表記外音は『常用漢字表』(昭和56内閣告示)によれば、
「時」には「と」の音はないため、「時計」を「とけい」と読むと
表記外になるとか、「日」には「に」の音はないため、「日本」を
「にほん」と読むと表記外となるとか、そんなの人間がチェックしたら
見落とすに決まってるだろ。
「じゃあ、他にはそういう例があるのか?」とかいったデータくらい、
ちゃんと用意してどっかに公開しておけというのだ。
513Mb
2018/07/16(月) 11:05:42.72ID:RFTF6J3p だいたい、中学校で
「活用するのが『用言』で、活用しないのが『体言』」とか
教えてるくせに、
天(あめ→あま)
天日嗣(あまつひつぎ)・天津日嗣(あまつひつぎ)・天照大神(あまてらすおおみかみ)・天の川(あまのがわ)・天水(あまみず)
雨(あめ→あま)
雨足(あまあし)・雨脚(あまあし)・雨蛙(あまがえる)・雨傘(あまがさ)
・雨具(あまぐ)・雨乞い(あまごい)・雨水(あまみず)・雨漏り(あまもり)
雨(あめ→さめ)
秋雨(あきさめ)・霧雨(きりさめ)・小雨(こさめ)・細雨(ささめ)
・春雨(はるさめ)・氷雨(ひさめ)・村雨(むらさめ)
とかいうのはどう説明したらいいんだよ。
「日本語処理の技術者は、中学校レベルの文法知識も持っていない」って、
中学校で教えるのかよ。
で、高校受験や大学受験で、「本当のこと」を主張したら減点されて
不合格のリスクを負うのか?
それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。
「活用するのが『用言』で、活用しないのが『体言』」とか
教えてるくせに、
天(あめ→あま)
天日嗣(あまつひつぎ)・天津日嗣(あまつひつぎ)・天照大神(あまてらすおおみかみ)・天の川(あまのがわ)・天水(あまみず)
雨(あめ→あま)
雨足(あまあし)・雨脚(あまあし)・雨蛙(あまがえる)・雨傘(あまがさ)
・雨具(あまぐ)・雨乞い(あまごい)・雨水(あまみず)・雨漏り(あまもり)
雨(あめ→さめ)
秋雨(あきさめ)・霧雨(きりさめ)・小雨(こさめ)・細雨(ささめ)
・春雨(はるさめ)・氷雨(ひさめ)・村雨(むらさめ)
とかいうのはどう説明したらいいんだよ。
「日本語処理の技術者は、中学校レベルの文法知識も持っていない」って、
中学校で教えるのかよ。
で、高校受験や大学受験で、「本当のこと」を主張したら減点されて
不合格のリスクを負うのか?
それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。
514デフォルトの名無しさん
2018/07/16(月) 11:21:56.62ID:Tl1DHPio >「活用するのが『用言』で、活用しないのが『体言』」とか
>教えてるくせに、
ええぇぇぇっ
>教えてるくせに、
ええぇぇぇっ
515Mb
2018/07/16(月) 11:36:38.15ID:RFTF6J3p >>514
> ええぇぇぇっ
いや、ここは驚くとこじゃねぇだろう。
中学二年で習う「文法」だと、
まず「自立語」と「附属語」の区別があって、
自立語のうち「その役割によって形を変える語」を
「用言」といい、「形を変えない語」を「体言」というと、
しっかり教科書に書いてある。
だもんだから、教師はそれを信じてテストの問題を作り、
それに「教師が正しいと思った解答」を書かなかった
児童・生徒は成績評価が低くなる。
で、「それはおかしいんじゃないですか?」とかいって
文句をつける保護者は、「モンスター・ペアレント」として
扱われる。
めでてぇな。
> ええぇぇぇっ
いや、ここは驚くとこじゃねぇだろう。
中学二年で習う「文法」だと、
まず「自立語」と「附属語」の区別があって、
自立語のうち「その役割によって形を変える語」を
「用言」といい、「形を変えない語」を「体言」というと、
しっかり教科書に書いてある。
だもんだから、教師はそれを信じてテストの問題を作り、
それに「教師が正しいと思った解答」を書かなかった
児童・生徒は成績評価が低くなる。
で、「それはおかしいんじゃないですか?」とかいって
文句をつける保護者は、「モンスター・ペアレント」として
扱われる。
めでてぇな。
516デフォルトの名無しさん
2018/07/16(月) 11:36:41.25ID:1RDPQ2ba 最近少し興味を持った初心者なのですが、
2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で処理されるのですか?
例えば、
>それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。
おまいら自然言語処理をやっている人間は、それっておかしいとは思わんのか。
あなた方の様に自然言語の処理を行う人達は、「それはおかしい」と思わないのですか?
2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で処理されるのですか?
例えば、
>それっておかしいとは、おまいら自然言語処理をやっている人間は思わんのか。
おまいら自然言語処理をやっている人間は、それっておかしいとは思わんのか。
あなた方の様に自然言語の処理を行う人達は、「それはおかしい」と思わないのですか?
518デフォルトの名無しさん
2018/07/16(月) 12:10:49.45ID:LulkQD8r しょせんは人が決めた分類なんで従うしかない
って書こうとしたけど
漢字って単語のさらに一部分で雨水はいつだってあまみずだから
雨水を単語として分類するとき体言にするのはべつに間違ってないような
https://kotobank.jp/word/%E4%BD%93%E8%A8%80-91058
定義もっとこまかかった最初の前提からちがう
って書こうとしたけど
漢字って単語のさらに一部分で雨水はいつだってあまみずだから
雨水を単語として分類するとき体言にするのはべつに間違ってないような
https://kotobank.jp/word/%E4%BD%93%E8%A8%80-91058
定義もっとこまかかった最初の前提からちがう
519Mb
2018/07/16(月) 12:54:56.73ID:RFTF6J3p >>518
> 漢字って単語のさらに一部分で雨水はいつだって「あまみず」だから
開く(あく/ひらく)
開ける(あける/ひらける)
温める(あたためる/あっためる/ぬくめる)
暖める(あたためる/あっためる)
温まる(あたたまる/ぬくまる)
言う・謂う・云う(いう/ゆう)
怒る(いかる/おこる)
行く・逝く・往く(いく/ゆく)
射殺した(いころした/しゃさつした)
抱く(いだく/だく)
行った(いった/おこなった)
出し((文)いでし/(現)だし/(文)でし)
居る(いる/×おる)
入る(いる/はいる)・入れない(いれない/はいれない)
得る(うる/える)
(以下、規制に引っかかるので省略)
「雨水溝」は、「うすいこう」なのよ。
> 漢字って単語のさらに一部分で雨水はいつだって「あまみず」だから
開く(あく/ひらく)
開ける(あける/ひらける)
温める(あたためる/あっためる/ぬくめる)
暖める(あたためる/あっためる)
温まる(あたたまる/ぬくまる)
言う・謂う・云う(いう/ゆう)
怒る(いかる/おこる)
行く・逝く・往く(いく/ゆく)
射殺した(いころした/しゃさつした)
抱く(いだく/だく)
行った(いった/おこなった)
出し((文)いでし/(現)だし/(文)でし)
居る(いる/×おる)
入る(いる/はいる)・入れない(いれない/はいれない)
得る(うる/える)
(以下、規制に引っかかるので省略)
「雨水溝」は、「うすいこう」なのよ。
520Mb
2018/07/16(月) 13:03:08.07ID:RFTF6J3p >>516
> 2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で
> 処理されるのですか?
いや、普通に処理してるけど?
「文法格の一意性」とか「非交差則」とかで説明できるんだけど。
ただ、「処理の結果が気にくわない!」って言ってる、自然言語処理
分野のヒトが邪魔してるだけだし。文語文法とかの研究者は、
「使えるツールがあれば欲しい」っていう要望があるんだけど。
そのあたりは早稲田大学の文理学部の筧先生とかに嘆願してね。
> 2ch用語やギャル語、話し言葉や文法的な違いはどのような手順で
> 処理されるのですか?
いや、普通に処理してるけど?
「文法格の一意性」とか「非交差則」とかで説明できるんだけど。
ただ、「処理の結果が気にくわない!」って言ってる、自然言語処理
分野のヒトが邪魔してるだけだし。文語文法とかの研究者は、
「使えるツールがあれば欲しい」っていう要望があるんだけど。
そのあたりは早稲田大学の文理学部の筧先生とかに嘆願してね。
521Mb
2018/07/16(月) 13:08:49.98ID:RFTF6J3p522Mb
2018/07/16(月) 13:12:52.10ID:RFTF6J3p523Mb
2018/07/16(月) 13:16:06.01ID:RFTF6J3p 慣用・誤用、あるいはいわゆる“百姓読み”
口腔外科
「こうくうげか」ではなく「こうこうげか」。
清拭
「せいしき」ではなく「せいしょく」。
独壇場
正しくは「独擅場」と表記して、「どくせんじょう」。
疾病
「しつびょう」ではなく「しっぺい」。
偏執狂
「へんしつきょう」ではなく「へんしゅうきょう」。
情緒
慣用は「じょうちょ」。正式には「じょうしょ」。
膏肓
「病、膏肓に入る」は「やまいこうもうにいる」ではなく「やまいこうこうにいる」。
捏造
慣用は「ねつぞう」。正式には「でつぞう」。「捏ち上げる」は「でっちあげる」。
口腔外科
「こうくうげか」ではなく「こうこうげか」。
清拭
「せいしき」ではなく「せいしょく」。
独壇場
正しくは「独擅場」と表記して、「どくせんじょう」。
疾病
「しつびょう」ではなく「しっぺい」。
偏執狂
「へんしつきょう」ではなく「へんしゅうきょう」。
情緒
慣用は「じょうちょ」。正式には「じょうしょ」。
膏肓
「病、膏肓に入る」は「やまいこうもうにいる」ではなく「やまいこうこうにいる」。
捏造
慣用は「ねつぞう」。正式には「でつぞう」。「捏ち上げる」は「でっちあげる」。
525Mb
2018/07/16(月) 13:22:00.06ID:RFTF6J3p >>519
続き。
脅かす(おどかす/おびやかす)
下り(おり/くだり)
降り(おり/ふり)
解す(かいす/ほぐす)
通った(かよった/とおった)
来る(きたる/くる)
汚す(けがす/よごす)
汚れる(けがれる/よごれる)
煙る(けぶる/けむる)
扱く(こく/しごく)
栄える(さかえる/はえる)
誘う(さそう/いざなう)
認める(したためる/みとめる)
狭まる(せばまる/はさまる)
狭める(せばめる/はさめる)
初めて(そめて/はじめて)
逸らす(そらす/はやらす)
逸れる(それる/はぐれる/はやれる)
違う(たがう/ちがう)
尊ぶ(たっとぶ/とうとぶ)
貴ぶ(たっとぶ/とうとぶ)
違える(たがえる/ちがえる)
吐く(つく/はく)
留める(とめる/とどめる)
留まる(とまる/とどまる)
叩く(たたく/はたく)
弾く(はじく/ひく)
瞬く(またたく/まばたく)
続き。
脅かす(おどかす/おびやかす)
下り(おり/くだり)
降り(おり/ふり)
解す(かいす/ほぐす)
通った(かよった/とおった)
来る(きたる/くる)
汚す(けがす/よごす)
汚れる(けがれる/よごれる)
煙る(けぶる/けむる)
扱く(こく/しごく)
栄える(さかえる/はえる)
誘う(さそう/いざなう)
認める(したためる/みとめる)
狭まる(せばまる/はさまる)
狭める(せばめる/はさめる)
初めて(そめて/はじめて)
逸らす(そらす/はやらす)
逸れる(それる/はぐれる/はやれる)
違う(たがう/ちがう)
尊ぶ(たっとぶ/とうとぶ)
貴ぶ(たっとぶ/とうとぶ)
違える(たがえる/ちがえる)
吐く(つく/はく)
留める(とめる/とどめる)
留まる(とまる/とどまる)
叩く(たたく/はたく)
弾く(はじく/ひく)
瞬く(またたく/まばたく)
526Mb
2018/07/16(月) 13:25:35.64ID:RFTF6J3p せっかくだから、最後までやっとこうか。
(文)悪し(あし/わろし)
良い・善い・好い(いい/よい)
鈍い(にぶい/のろい)
辛い(からい/つらい)
難い(かたい/にくい)
臭い(くさい/におい)
尊い(たっとい/とうとい)
貴い(たっとい/とうとい)
難しい(むずかしい/むつかしい)
(文)良し(よし/よろし)
(まだ続く)
(文)悪し(あし/わろし)
良い・善い・好い(いい/よい)
鈍い(にぶい/のろい)
辛い(からい/つらい)
難い(かたい/にくい)
臭い(くさい/におい)
尊い(たっとい/とうとい)
貴い(たっとい/とうとい)
難しい(むずかしい/むつかしい)
(文)良し(よし/よろし)
(まだ続く)
527Mb
2018/07/16(月) 13:26:51.56ID:RFTF6J3p (文)悪し(あし/わろし)
良い・善い・好い(いい/よい)
鈍い(にぶい/のろい)
辛い(からい/つらい)
難い(かたい/にくい)
臭い(くさい/におい)
尊い(たっとい/とうとい)
貴い(たっとい/とうとい)
難しい(むずかしい/むつかしい)
(文)良し(よし/よろし)
抜けてる例があったら知らせてくれ。
良い・善い・好い(いい/よい)
鈍い(にぶい/のろい)
辛い(からい/つらい)
難い(かたい/にくい)
臭い(くさい/におい)
尊い(たっとい/とうとい)
貴い(たっとい/とうとい)
難しい(むずかしい/むつかしい)
(文)良し(よし/よろし)
抜けてる例があったら知らせてくれ。
528Mb
2018/07/16(月) 13:29:11.05ID:RFTF6J3p で、質問があったらカモーン! 歓迎するぜぇ!
529Mb
2018/07/16(月) 13:49:08.35ID:RFTF6J3p530Mb
2018/07/16(月) 15:36:36.28ID:RFTF6J3p ところで、
「ところで」を漢字で表記する場合、
「処で」「所で」「處で」のどれが正しいのか、
知っているヒトがいるんだったら教えてほしい。
本当に。
「ところで」を漢字で表記する場合、
「処で」「所で」「處で」のどれが正しいのか、
知っているヒトがいるんだったら教えてほしい。
本当に。
531デフォルトの名無しさん
2018/07/16(月) 16:15:34.93ID:Od4s/iux >>523
確執は?
確執は?
533デフォルトの名無しさん
2018/07/16(月) 17:13:46.84ID:FxG3mwKE なんでこの人ID真っ赤なの?
534Mb
2018/07/16(月) 17:22:46.07ID:RFTF6J3p535Mb
2018/07/16(月) 17:30:44.70ID:RFTF6J3p536デフォルトの名無しさん
2018/07/16(月) 18:49:32.10ID:Weu21Vcy 国文法の細かい話題に参加する気はないが
人間が文法を間違えたときにどう処理するかは
自然言語処理で昔から問題になってる
人間が文法を間違えたときにどう処理するかは
自然言語処理で昔から問題になってる
537Mb
2018/07/16(月) 21:00:28.41ID:RFTF6J3p >>536
> 昔から問題になってる
っつーのはよく解る。
清少納言が「べきにもあらず」とか
書いてるけど、文法的には「べからず」が
正しいと思う。
「慣用形」として認めるのはアリだと思うが、
しょっちゅう使うから「慣用」なんであって、
そこを網羅するのがコンピュータの出番だと
思うんだがどうだろう。
つーか、記述文法の精度が低すぎるのが
本来の問題なんだが、
おまいら記述文法を舐めてねぇか?
という連中が自然言語処理業界に多すぎるのが
問題だと思うが。
> 昔から問題になってる
っつーのはよく解る。
清少納言が「べきにもあらず」とか
書いてるけど、文法的には「べからず」が
正しいと思う。
「慣用形」として認めるのはアリだと思うが、
しょっちゅう使うから「慣用」なんであって、
そこを網羅するのがコンピュータの出番だと
思うんだがどうだろう。
つーか、記述文法の精度が低すぎるのが
本来の問題なんだが、
おまいら記述文法を舐めてねぇか?
という連中が自然言語処理業界に多すぎるのが
問題だと思うが。
538デフォルトの名無しさん
2018/07/16(月) 21:05:53.77ID:LulkQD8r 憤慨ポイントがよくわからない
自分のアプリで処理できないから怒ってるのか?
自分のアプリで処理できないから怒ってるのか?
539Mb
2018/07/16(月) 21:14:19.70ID:RFTF6J3p >>536
“じつは”というか、“ぶっちゃけ”というか、
もう四半世紀(要するに二十五年以上)前から、
そこいらにあるパソコンの(形態素解析レベルの)チェック
能力は、人間を軽く超えているんだよ。
ただ、構文解析に関しては、国語学とか自然言語処理とか
数学とかコンピュータサイエンスとか認知心理学とか、
そのあたりの合意がとれてないわけよ。
だから、そのあたりを整理する必要があるわけなんだけど、
苫米地 英人とかが引っ掻き回しやがってバカヤロウ、
みたいな話があるんだわ。
“じつは”というか、“ぶっちゃけ”というか、
もう四半世紀(要するに二十五年以上)前から、
そこいらにあるパソコンの(形態素解析レベルの)チェック
能力は、人間を軽く超えているんだよ。
ただ、構文解析に関しては、国語学とか自然言語処理とか
数学とかコンピュータサイエンスとか認知心理学とか、
そのあたりの合意がとれてないわけよ。
だから、そのあたりを整理する必要があるわけなんだけど、
苫米地 英人とかが引っ掻き回しやがってバカヤロウ、
みたいな話があるんだわ。
540Mb
2018/07/16(月) 21:24:18.35ID:RFTF6J3p >>538
そもそも先人の業績をないがしろにしてるところが
気にくわんのだよ。
処理はできるんだが、その結果が「気に食わん」という奴が
いるわけだ。
「文法格の一意性」とか「非交差則」とか言うと、
学会で「こいつ GC とか信じてやがる pgr」とか云われるんだよ。
そもそも先人の業績をないがしろにしてるところが
気にくわんのだよ。
処理はできるんだが、その結果が「気に食わん」という奴が
いるわけだ。
「文法格の一意性」とか「非交差則」とか言うと、
学会で「こいつ GC とか信じてやがる pgr」とか云われるんだよ。
541Mb
2018/07/16(月) 21:28:39.50ID:RFTF6J3p >>540
× GC
〇 CG
汎文法(common grammer)な。
「文を構成するのは述語である」とか、
「述語に対する役割が、文法格である」とかいった、
「言語には、基本的な構成要素がある」っていう
構造主義的な立場だ。
× GC
〇 CG
汎文法(common grammer)な。
「文を構成するのは述語である」とか、
「述語に対する役割が、文法格である」とかいった、
「言語には、基本的な構成要素がある」っていう
構造主義的な立場だ。
542デフォルトの名無しさん
2018/07/16(月) 21:48:34.53ID:LulkQD8r 文法よりまずおまえの頭を整理したほうがいいきがする
結局なにゆーてんかわからん
結局なにゆーてんかわからん
543Mb
2018/07/16(月) 22:09:23.58ID:RFTF6J3p >>542
とりあえず、トポロジーとかカタストロフィ理論とかから
勉強してきてくれるとありがたいんだが。
一から説明してると面倒臭いんだわ。
「私はラーメンを餃子を喰う」とは言わんだろ?
「私はラーメンと餃子を喰う」んだわ。
「喰う」という動詞に対して、文法格を
持つ対象は一意なんだよ。だから、「ラーメンと餃子」というふうに、
集合体になってるわけ。これが、「文法格の一意性」。
とりあえず、トポロジーとかカタストロフィ理論とかから
勉強してきてくれるとありがたいんだが。
一から説明してると面倒臭いんだわ。
「私はラーメンを餃子を喰う」とは言わんだろ?
「私はラーメンと餃子を喰う」んだわ。
「喰う」という動詞に対して、文法格を
持つ対象は一意なんだよ。だから、「ラーメンと餃子」というふうに、
集合体になってるわけ。これが、「文法格の一意性」。
544デフォルトの名無しさん
2018/07/16(月) 22:12:55.13ID:LulkQD8r 2行目で頭がフットーした
絶対おれの知識不足じゃなくてお前の話し方に問題がある
絶対おれの知識不足じゃなくてお前の話し方に問題がある
545Mb
2018/07/16(月) 22:12:55.55ID:RFTF6J3p >>542
でもって、昔(文語文法)は形容詞は述語になってたんだが、
いまの文法(いわゆる学校文法)では、形容詞は述語に
ならんのよ。だから、
「象は鼻が長い」
は、「述語がないのに主語が二つもあるのはおかしい!」という
批判が出てるわけ。
おわかりか?
でもって、昔(文語文法)は形容詞は述語になってたんだが、
いまの文法(いわゆる学校文法)では、形容詞は述語に
ならんのよ。だから、
「象は鼻が長い」
は、「述語がないのに主語が二つもあるのはおかしい!」という
批判が出てるわけ。
おわかりか?
546デフォルトの名無しさん
2018/07/16(月) 22:28:36.42ID:LulkQD8r 文法の細かいことはほとんどわからんが
ようはその文法格とかをメインに考えてきたおまいらの方針が
AIとかの漠然とした解析方法に押されて消えちゃいそうで
危機感を感じて発狂してるということなのか?
ようはその文法格とかをメインに考えてきたおまいらの方針が
AIとかの漠然とした解析方法に押されて消えちゃいそうで
危機感を感じて発狂してるということなのか?
547デフォルトの名無しさん
2018/07/16(月) 22:55:46.12ID:LulkQD8r 批判ってつまり
今の文法格の考え方じゃ対処できてないじゃんって
おまいさんが突っ込まれたってことだよね
誰かが日本語の文法批判してるみたいじゃねーかまぎらわしい
それともなにか
本当に教育に干渉して日本語の文法に変更を加えようとしてるのか
今の文法格の考え方じゃ対処できてないじゃんって
おまいさんが突っ込まれたってことだよね
誰かが日本語の文法批判してるみたいじゃねーかまぎらわしい
それともなにか
本当に教育に干渉して日本語の文法に変更を加えようとしてるのか
548Mb
2018/07/17(火) 09:14:36.43ID:iAzNVHws >>547
> 誰かが日本語の文法批判してるみたいじゃねーか
> まぎらわしい
国語学者が中学校の現代国語で教えられている
「いわゆる学校文法」を批判してるんだよ。
「学校文法 批判」でググると五十万件以上
ヒットするから読んでみるといい。
特に、文語文法を教えてる先生は、言葉が通じなくて
頭を抱えてる。
> 誰かが日本語の文法批判してるみたいじゃねーか
> まぎらわしい
国語学者が中学校の現代国語で教えられている
「いわゆる学校文法」を批判してるんだよ。
「学校文法 批判」でググると五十万件以上
ヒットするから読んでみるといい。
特に、文語文法を教えてる先生は、言葉が通じなくて
頭を抱えてる。
549Mb
2018/07/17(火) 09:25:46.63ID:iAzNVHws >>546
つーか、自然言語処理自体が AI の一分野なんだよ。
だけど、事前言語処理をやっている人間の多くは
學校文法の延長でしか日本語の文法を捉えていないので、
日本語処理の技術の進歩が停滞しとるのよ。
つーか、自然言語処理自体が AI の一分野なんだよ。
だけど、事前言語処理をやっている人間の多くは
學校文法の延長でしか日本語の文法を捉えていないので、
日本語処理の技術の進歩が停滞しとるのよ。
550Mb
2018/07/17(火) 09:28:18.11ID:iAzNVHws551Mb
2018/07/17(火) 09:34:38.84ID:iAzNVHws なお、本居春庭が悪いとか、橋本進吉が悪いとかいう話ではない
(大野晋先生は橋本進吉先生の弟子)。
中学校の文法教育が、文法嫌いを六十年以上拡大再生産
しているのが悪い、っちゅー話。
(大野晋先生は橋本進吉先生の弟子)。
中学校の文法教育が、文法嫌いを六十年以上拡大再生産
しているのが悪い、っちゅー話。
552デフォルトの名無しさん
2018/07/17(火) 14:03:22.52ID:ejUOYbm+ いまどきAIの分野でない自然言語処理なんてあるの?
553Mb
2018/07/17(火) 14:40:42.81ID:iAzNVHws >>552
ある。「かな漢字変換」とか「ローマ字かな変換」とかな。
「programwo」は、本来なら「プログラム(program)を」と
変換してほしいところだが、「pろgらmを」と変換される。
これを「AI の限界」とか言ってる奴も多いが、
技術的にはすでに解決されてる。
ある。「かな漢字変換」とか「ローマ字かな変換」とかな。
「programwo」は、本来なら「プログラム(program)を」と
変換してほしいところだが、「pろgらmを」と変換される。
これを「AI の限界」とか言ってる奴も多いが、
技術的にはすでに解決されてる。
554Mb
2018/07/17(火) 14:50:17.21ID:iAzNVHws >>552
かな漢字変換システムの形容詞の辞書登録で、
「i」とか「e」とかで終わる形容詞を登録してみ?
「i」終わりは「みみっちい」「ばっちい(ばばっちい)」
くらいしか存在しないので、登録時のチェックで注意喚起
してくれるのが正しいありかただ。
「e」末尾は、「かそけき」「さやけき」「むくつけき」「猛き」
あたりが該当するが、現代語の連体形が存在しないので、
「かそけい」「さやけい」「むくつけい」「猛い」が
変換候補として出てきたときに腹が立つかどうか、という
話になる。
かな漢字変換システムの形容詞の辞書登録で、
「i」とか「e」とかで終わる形容詞を登録してみ?
「i」終わりは「みみっちい」「ばっちい(ばばっちい)」
くらいしか存在しないので、登録時のチェックで注意喚起
してくれるのが正しいありかただ。
「e」末尾は、「かそけき」「さやけき」「むくつけき」「猛き」
あたりが該当するが、現代語の連体形が存在しないので、
「かそけい」「さやけい」「むくつけい」「猛い」が
変換候補として出てきたときに腹が立つかどうか、という
話になる。
555Mb
2018/07/17(火) 14:55:42.16ID:iAzNVHws でもって、自然言語処理というのは、一般的に
「形態素解析ができて、それを構文解析したときに、
正しい(ちゅーか、実用的な)解析木(ちゅーか、
情報処理するときに扱いやすいデータ構造)に落ちるか
どうか」が勝負なんだよ。
だけど、「そんな解析木は認めない!」ていって
頑張っている奴が業界を押さえていると、日本語処理
っていうもの自体が成り立たなくなるわけだ。
だから、「まず、記述文法から交通整理しよう」っちゅー
話をしとるわけよ。
「形態素解析ができて、それを構文解析したときに、
正しい(ちゅーか、実用的な)解析木(ちゅーか、
情報処理するときに扱いやすいデータ構造)に落ちるか
どうか」が勝負なんだよ。
だけど、「そんな解析木は認めない!」ていって
頑張っている奴が業界を押さえていると、日本語処理
っていうもの自体が成り立たなくなるわけだ。
だから、「まず、記述文法から交通整理しよう」っちゅー
話をしとるわけよ。
556Mb
2018/07/17(火) 15:08:30.84ID:iAzNVHws 「日本人は髪が黒い」という表現は、「黒い」が「髪」を連体修飾
してて、「髪」がとりたてによって強調されているから、「黒い」
の前に出てきて、とりたて詞「が」が用いられる、って言っただけで、
学会で吊るし上げを喰らうんだぞ?
で、まともな反論が返ってくるならともかく、
「くぁwせdrftgyふじこふじこふじこ!」
みたいなコトになるんだぞ?
「いや、ちゃんと動いてるシステムがあるんですが」とか
言っても、「あーあーあーあーあー聞こえない聞こえない聞こえなーい」
みたいな反応しか返ってこないんだぞ?
だけど、普通の研究者は逆らえないんだ。そういう連中は、大っぴらには
言えんけど大きな企業で国の予算を貰っていて、その一部をスポンサーとして
研究機関に流してるところから来た、背広着てネクタイ締めて学会に来てる
ような連中だからだ。
「日本語処理が実用化されたりなんかしたら、研究費が出なくなって
自分らが干上がる」というのを知っている連中が、日本語処理業界に
巣食ってるんだよ。
してて、「髪」がとりたてによって強調されているから、「黒い」
の前に出てきて、とりたて詞「が」が用いられる、って言っただけで、
学会で吊るし上げを喰らうんだぞ?
で、まともな反論が返ってくるならともかく、
「くぁwせdrftgyふじこふじこふじこ!」
みたいなコトになるんだぞ?
「いや、ちゃんと動いてるシステムがあるんですが」とか
言っても、「あーあーあーあーあー聞こえない聞こえない聞こえなーい」
みたいな反応しか返ってこないんだぞ?
だけど、普通の研究者は逆らえないんだ。そういう連中は、大っぴらには
言えんけど大きな企業で国の予算を貰っていて、その一部をスポンサーとして
研究機関に流してるところから来た、背広着てネクタイ締めて学会に来てる
ような連中だからだ。
「日本語処理が実用化されたりなんかしたら、研究費が出なくなって
自分らが干上がる」というのを知っている連中が、日本語処理業界に
巣食ってるんだよ。
557デフォルトの名無しさん
2018/07/17(火) 15:53:21.98ID:EeLIetXI558デフォルトの名無しさん
2018/07/17(火) 16:56:24.01ID:GZ88p15f 原子力学会かよ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 習政権、高市首相への態度硬化 台湾有事発言で連日非難 中国 ★11 [ぐれ★]
- 橋下徹氏 外務省幹部の訪中受け「口だけ番長」へ痛烈指摘 「喧嘩は日本の完敗…なんとかっこ悪い日本か」 [冬月記者★]
- 【外国人問題】小野田紀美担当相「不法就労や不法滞在は許さない」 [シャチ★]
- 【野球】井端監督 大谷翔平、山本由伸らのWBCへの参加 「1日も早く返事ほしい」「待っててといっても、国内組が遅くなってしまう」★3 [冬月記者★]
- 経団連会長、日中は建設的対話を 経済3団体が高市首相と初会談も日中関係は話題に登らず… [BFU★]
- 中国「高市が頭を下げて謝罪しない限り、絶対に許さない」 [329329848]
- 🏡
- 今季最強寒気襲来!!!!
- 【高市早苗】習近平激怒か [115996789]
- 今猛烈に食べたいもの挙げてけwwwwwwww
- 橋下徹「口だけ番長の日本が中国に喧嘩負け。なんとカッコ悪い日本か!」高市にバチーン!✴ [153490809]
