自然言語処理スレッド その5

■ このスレッドは過去ログ倉庫に格納されています
1Mr.Moto
垢版 |
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
652デフォルトの名無しさん
垢版 |
2019/12/24(火) 06:39:25.85ID:8asYM3Qv
neural machine translationを試してるけど
ユーザー辞書を指定する方法が分からない

誰か教えて
653デフォルトの名無しさん
垢版 |
2019/12/29(日) 22:17:53.47ID:cEP7YGjF
https://i.imgur.com/HLo7Kzi.jpg

10年ぶりにプログラミングしようかなって!
654デフォルトの名無しさん
垢版 |
2019/12/30(月) 11:24:56.40ID:WAqdspci
怨霊注意
グロ中尉
655デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:08:45.88ID:TuYxoCDY
オブジェクトのクラスは概念であり、インスタンスは現物である。

チンポはチンポでも人それぞれいろいろなチンポがある、それはクラスとしてのチンポ。
しかしながら自分のチンポは一つしかない、それがインスタンスなのである。
656デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:17:53.11ID:l5J0jQZo
チンポはチンコとかチンボとか男根とかペニスとかいろんな表現ができる。しかしながら概念は静的だ。

static フィールド
そもそも static は 「静的」 を意味します。「動的ではない」ということで、そのフィールドは
いくらインスタンスをたくさん生成したとしても、クラスにたった1つです。
657デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:20:08.32ID:l5J0jQZo
チンボをチンコと呼ぶかチンボと呼ぶか、それはstatic変数だ。
658デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:32:04.65ID:01CWZx5d
ちんぽこ
ぽこちん
https://www.youtube.com/watch?v=SNi02VIROpw
659デフォルトの名無しさん
垢版 |
2020/01/16(木) 20:59:30.32ID:aB/eHrOt
bertの次が出てこないと話にならない
660デフォルトの名無しさん
垢版 |
2020/01/17(金) 08:11:28.21ID:EGQaS6kk
bert系の結果が良いのはベンチマークテストのleakとか言われてなかった?
661デフォルトの名無しさん
垢版 |
2020/01/22(水) 23:22:28.23ID:XnuZbeSJ
提出日:平成26年1月31日
平成25年度 卒業論文
ZARD坂井泉水の歌詞における表現特性
大阪教育大学 教育学部 学校教育教員養成課程 
国語教育専攻 小学校コース
国語表現ゼミナール 102127 平山 剛
指導教官 野浪 正隆先生
http://www.osaka-kyoiku.ac.jp/~kokugo/nonami/2013soturon/hirayama/hirayama_sotugyouronbun.html
662デフォルトの名無しさん
垢版 |
2020/01/23(木) 11:33:35.86ID:VWfJLmDE
SARDとZARDの類似性も調べて欲しい
663デフォルトの名無しさん
垢版 |
2020/01/23(木) 12:12:06.45ID:iziTjVhn
なにこれ私怨かなんかで晒されてるの?
664デフォルトの名無しさん
垢版 |
2020/01/27(月) 21:13:48.96ID:BMHIWM+6
ZARD「心を開いて」
https://youtu.be/8n1T9sXaCHI
665デフォルトの名無しさん
垢版 |
2020/01/28(火) 14:53:45.02ID:zB2lv0ET
ZARDメドレー
https://youtu.be/FqQ1gZ46byk
666デフォルトの名無しさん
垢版 |
2020/01/28(火) 19:00:50.86ID:zB2lv0ET
875 名無し三等兵 sage 2020/01/28(火) 15:08:21.81 ID:KjyBzP+6
>>873
チンポが脳から独立して生きてる珍獣だつおさんは平日昼間で大多数の社会人は勤労時間帯中なのに暇なんすね
珍獣というかチン獣は人間の世界に場違いだからそのままニートでネットの掃き溜めに居続けるほうが社会全体に有益でしょう
667デフォルトの名無しさん
垢版 |
2020/01/29(水) 21:37:54.21ID:1M5pf25d
ZARD 歌曲全集
https://youtu.be/N7tw_5t7R0c
668デフォルトの名無しさん
垢版 |
2020/01/30(木) 13:59:21.13ID:sB8XzCcn
https://www.youtube.com/watch?v=o13WEDJMkQA
669デフォルトの名無しさん
垢版 |
2020/02/01(土) 10:06:12.78ID:QPNiPyb+
すごい分子 世界は六角形でできている
https://moro-chemistry.org/archives/1934
670デフォルトの名無しさん
垢版 |
2020/02/01(土) 14:58:52.02ID:6nKSRHn2
2009年にIUPAC(国際純正・応用化学連合)により新元素と認定され、著名な天文学者コペルニクス
(1473-1543)にちなんで、2010年の彼の誕生日の2月9日に、コペルニシウムと命名された。
https://staff.aist.go.jp/koji-abe/Table/Cn/Cn.htm
2020/02/01(土) 22:50:31.19ID:jeWtPg7X
>>669
フラーレンとフタロシアニンとあとひとつがわからない。
672デフォルトの名無しさん
垢版 |
2020/02/02(日) 18:13:51.63ID:iCgKJVx9
コランニュレン
https://upload.wikimedia.org/wikipedia/commons/thumb/2/23/Corannulene.svg/150px-Corannulene.svg.png
スマネン
https://upload.wikimedia.org/wikipedia/commons/thumb/d/d3/Sumanene.svg/156px-Sumanene.svg.png

すまんね
673デフォルトの名無しさん
垢版 |
2020/02/02(日) 18:18:10.49ID:iCgKJVx9
コロネン
https://upload.wikimedia.org/wikipedia/commons/thumb/0/03/Coronene_200.svg/155px-Coronene_200.svg.png

なんか新種のウィルスみたいだな
https://resou.osaka-u.ac.jp/ja/research/2019/20191029_1
2020/02/02(日) 20:12:54.76ID:7fCekQbo
>>672
どうりで知らないはずだ。
自分が研究してた頃はなかった。
675デフォルトの名無しさん
垢版 |
2020/02/03(月) 11:43:32.52ID:62FLJlST
そうなん?
フラーレンの合成過程で必要な物じゃないの?
676デフォルトの名無しさん
垢版 |
2020/02/03(月) 16:18:11.83ID:wqtqOYOc
世間の人びとは、植松被告の差別的、選民的な思想に対して異議を申し立てた。健常者であろうと、
障碍者であろうと、ひとりの人間として人権があり、平等であると。意思疎通ができなければ人間ではないとか、
生産性がなければ人間ではないなどといった主張に対して、真っ向から反対の声を挙げたのだ。
だが社会は年々、そのような「障碍者差別」に反対する言葉とは裏腹に、「能力で劣る健常者」
に対しても冷酷な視線を注ぐようになってはいないだろうか。
https://gendai.ismedia.jp/articles/-/69782?page=3
677デフォルトの名無しさん
垢版 |
2020/02/03(月) 16:26:03.28ID:f1K0iBoe
新型coronのニュースで良く判ったろ
上級は特別扱いなんだよ
下級はイッテ!ヨシ!!
678デフォルトの名無しさん
垢版 |
2020/02/09(日) 00:13:51.75ID:P8MtjS4X
>>213
>自然言語処理は、自然科学とまったく異なるただの 形 而 上 学 だからな

化学の元素なるものは空想である、物理的エネルギーなどというのも空想である。
だいたい、客観的事実存在という観念なるものが大いなる空想である。
今日の実験や科学はけっして空想を排斥することはできないのである。
679デフォルトの名無しさん
垢版 |
2020/02/10(月) 19:27:26.57ID:Z4R8ocaG
人間が言葉の意味を理解していて
AIが言葉の意味を理解していない
という議論が流布されているけど、
それはどうやって証明されたんだろうか?

その証明について詳述している著作や論文があったらどなたか教えて。
680デフォルトの名無しさん
垢版 |
2020/02/10(月) 20:01:02.49ID:MHetMmUD
雰囲気で語ってるよな
681デフォルトの名無しさん
垢版 |
2020/02/11(火) 11:37:30.34ID:KtXysiBK
>人間が言葉の意味を理解して

そもそもこっちに疑問符が付く
682デフォルトの名無しさん
垢版 |
2020/02/11(火) 12:04:44.02ID:asd489VV
そもそも人間が理解してる、ってのも測りようがない
一人ひとり理解の仕方だって違うだろうし(たぶん)。。。
683デフォルトの名無しさん
垢版 |
2020/02/11(火) 13:02:49.03ID:mbSsosDJ
言葉の理解は辞書の意味の定義どおりで、
性格に結びつく人間には正しく使えないかもしれない
2020/02/11(火) 13:22:12.97ID:D5vn67vC
人の言ったこと、書いてあることを理解しない and/or 理解できないで
自分の思っている通りに受けっとってしまう人が多数いるからな
しかも指摘してもわからないことが多い
2020/02/11(火) 13:29:57.81ID:Mlfi6+d3
言語的な理解って結局、概念なり物品なりに基本的な言葉を割り当てて
あとは言葉と言葉の相対的なネットワークが構築されればいいってことなのかな。
2020/02/11(火) 17:43:23.04ID:asd489VV
タスクが遂行できたらOKじゃね?
2020/02/11(火) 23:11:03.29ID:ZkFVJhTJ
今度はタスクの質が問題になるぞ
「掃除しておいて」
こういうのが一番難しい
2020/02/12(水) 07:29:54.42ID:FHbXvwvv
でもやりたいことがはっきりする
689デフォルトの名無しさん
垢版 |
2020/02/14(金) 11:51:25.19ID:pkeAaxyM
動画リンク
https://youtu.be/7DbdPKWhrpY
ファイル名
令和のコペルニクス.mp4

六角アミダって有りそうで無いので自作しました。
690デフォルトの名無しさん
垢版 |
2020/02/14(金) 17:04:56.13ID:FjrJhAkM
407 132人目の素数さん 2020/02/14(金) 15:52:05.06 ID:qY/rwOYr
>>406
ソースコードはこちら。

https://yahoo.jp/box/S5vIlZ
691デフォルトの名無しさん
垢版 |
2020/02/14(金) 21:37:29.28ID:hoZhAWFO
 志村さんの、極めて真っ当で健全な問題意識は、受験に特化したおかしな出題傾向のみならず
「数学オリンピック」という制度にも警鐘を鳴らしている。彼自身の表現を引いてみよう。
 「数学オリンピックについて言えば、それで良い成績を得た人が実質的に得るものはほとんどない。
単なる競争であって、ちょっと小・中・高校生の将棋や囲碁の大会と似ているところがある」
https://news.nicovideo.jp/watch/nw5274901
692デフォルトの名無しさん
垢版 |
2020/02/16(日) 15:59:07.11ID:L3e66jA9
日本の機械翻訳の精度が低いのは
コーパスの質が低いせいかもしれない

ゴミみたいなコーパス作ってるだろ

特許庁とか
2020/02/16(日) 21:44:50.27ID:Tgn1WNaT
コーパスとしては新聞が一番量が多いと思うが
694デフォルトの名無しさん
垢版 |
2020/02/16(日) 22:03:49.00ID:yeLsTr0V
特許庁が作ればコーパスに登録される文書は同じものはないから機械翻訳に使えないだろう
新聞は心理誘導があるとすれば同じ事象について異なる解釈が出て機械翻訳に使えないだろう
コーパスに辞書を組み合わせたら超えられる壁の気がするけど
695デフォルトの名無しさん
垢版 |
2020/02/17(月) 07:11:48.33ID:RLrbKBrs
辞書使うとかいまさら?
規則ベースの機械翻訳で痛い目見ただろ
696デフォルトの名無しさん
垢版 |
2020/02/17(月) 12:31:29.69ID:VoCP99um
>>693
新聞の対訳コーパスなんて存在しないだろ
時事通信とか共同通信あたりがやるべきだと思うけどやる気はないだろうな
697デフォルトの名無しさん
垢版 |
2020/02/17(月) 14:50:08.80ID:viDmsbfJ
対訳コーパスやら統計的機械翻訳ではなくて、

>>30
>データベースを使うのでなく、実際に見えるままの姿を3Dモデルで作成するのです。

これからは立体シミュレーションモデルが大切!
698デフォルトの名無しさん
垢版 |
2020/02/17(月) 16:55:34.30ID:9bDjGnEg
699デフォルトの名無しさん
垢版 |
2020/02/17(月) 17:48:49.31ID:1PEjcRDu
大きく考えたら文字だけがかなり2Dに近く、
文字、特に漢字は3Dのオブジェクトを筆で
描きやすい2Dに近づけただけと考えるのも
間違いじゃない気はする
700デフォルトの名無しさん
垢版 |
2020/02/18(火) 08:43:46.58ID:+BdvtIfr
間違い
701デフォルトの名無しさん
垢版 |
2020/02/18(火) 15:21:55.71ID:0vlejUVx
    _w           、...   ョ  ┌┐     ィ     ′  
    ̄+     ヘe、   j「.  .¬气¬''..~''~    ,.ルw、.ーu、す     
  ^^"~~l|~~^'''       ォ′   .,. l| ┐      .√ j|  _~+,.、. 
 .   .,/.      ょ_/    、j「 {  `¬..   〃 .、l|    、  
 ..  ~^.               ~  `          ~^      
 .  ;.                 ョ         __      
 .  j|       ~ラ¬¬+     |.        ̄.   ̄..    
 .  オ                 |..   ォ        ,、  
    k、 ,j〃.   L_.  _ェ    ~'――'~.   ^^^^^^ ̄´    
      ̄′       ̄ ̄                        
702デフォルトの名無しさん
垢版 |
2020/02/18(火) 21:10:16.92ID:bEosBGZY
612 名無しさん@ゴーゴーゴーゴー! (ワッチョイ cee3-ahI9 [111.96.63.25]) 2020/02/18(火) 21:01:55.66 ID:11sXuSUJ0
うるせえ!
ちんちんの数だけ考え方があるんだ!ちんちんに自我があるなんて決めつけるな!
703デフォルトの名無しさん
垢版 |
2020/02/20(木) 07:03:11.67ID:UWJz2CYx
対訳辞書を使うのってヒューリスティックじゃない?
704デフォルトの名無しさん
垢版 |
2020/02/23(日) 12:48:22.34ID:LZmNq29A
言語処理学会2020中止か
705デフォルトの名無しさん
垢版 |
2020/02/29(土) 07:46:42.88ID:lnYPfloX
smt氏って割とボンクラね(笑)
706デフォルトの名無しさん
垢版 |
2020/03/04(水) 12:48:09.42ID:jiU4bccG
507 デフォルトの名無しさん 2019/03/31(日) 06:32:14.87 ID:1lxn2Mvc
基本の文章から「は」と「が」を入れ替えると、主語にくる人物以外を排除する意味合いが含まれるようになります。
1.を例に見てみましょう。入れ替える前の文章ではただ単純に鈴木さんがボクサーであることのみを伝えています。
その一方で、「は」と「が」を入れ替えた後の文章では、複数の人物が存在するグループの中で
ボクサーは鈴木さんだけである、ということを伝えています。
http://www.tairapromote.com/2017/04/10/ha_and_ga_proper_use/

チンポ「は」シコシコする
チンポ「が」シコシコする

509 デフォルトの名無しさん 2019/03/31(日) 12:05:59.85 ID:OHGl5++G
>>507
> 基本の文章から「は」と「が」を入れ替えると、主語にくる人物以外を排除する

すると『俺』と『チンポ』は【二人称】となり、『対話』へと結びつくわけだな。

俺が、というのは俺ただ1人、チンポがというのはチンポただ1つ!

510 デフォルトの名無しさん [sage] 2019/03/31(日) 12:33:39.67 ID:1lxn2Mvc
>>346
>だったら、どんな “私” とだったら、対話したいと思う?

『対話』つーのは常に『二人称』だからな。

誤>チンポはシコシコ
正>チンポがシコシコ
2020/03/04(水) 18:47:52.44ID:KmgMips4
>>685
それに近いんじゃないかな
究極の検索エンジンだよ、マッチすれば理解したとみなす
2020/03/06(金) 05:46:14.50ID:Z17kfdKR
>>402
>C/C++はネットワーク通信とかハードウェアの物理的制約を凌ぐ機能には優れているが
>自然言語処理で一般的な多義語の訳しわけとかシミュレーションとかには向いてない
>例えば機械翻訳には時間がかかっても問題ない

>>404
>「開発効率を上げるために、結果ややこしくなっている」という C++
>Java に一票


このスレのログ追ってたんだが
キチガイが延々雑談してるかと思ったら
まともな開発の話がやっと出てきたか

C++とJavaならJavaの方がマシだな
C++は言語仕様があまりに複雑過ぎる

だが2020年になった
今どきの自然言語処理には
Pythonが一般的だろうか?

ちなみにオレはRuby使ってる
2020/03/06(金) 05:53:57.81ID:Z17kfdKR
>>423
>>437
ログ追っててまともな開発の話が出てきて少し安心した
が、2018年か……過疎だし正気度が低いスレだな!?


>コーパスを揃えるだけでも苦労
そうなんだよね

開発してない奴が雑談でイキってる中で
まともな話が出てきた

データ収集だけでも手間掛かるしコスパ悪いから
自然言語処理ってディープラーニングとか
他の花形AIに比べると
ちょっと人気ない所だよな
2020/03/06(金) 05:55:40.92ID:Z17kfdKR
>>439
アイディアはたくさんあるが
実現可能な範囲で想像できるかどうかが
かなり重要な能力だから教えない!
2020/03/06(金) 06:01:01.94ID:Z17kfdKR
>>472
人工知能はAIが自律的に判断することなので
両者は少なくともイコールではない

現実のシミュレーションや自律性という点で
発想に共通性がまったくない訳ではないが……
2020/03/06(金) 06:15:10.30ID:Z17kfdKR
>>489
雑な比喩だが要約としてはそんなにおかしくないぞ?
少なくともこのスレのキチガイより百倍マシ!
2020/03/06(金) 06:24:01.52ID:Z17kfdKR
>>544
>JavaやRubyなどの所謂
>『オブジェクト指向プログラミング言語』は
>データベース検索ツールにしかならない!

はあ……? なぜ??
実務でCRUDアプリが大半なのはそうだろうが
それしか作れない言語という訳ではないだろ!
2020/03/06(金) 06:28:12.15ID:Z17kfdKR
>>551
>自然言語処理技術の目指す未来
>コンピュータと会話によって会話が成り立ち

そうだな
ロボットやAIと会話が成立するってのが
(一般人にも)一番分かりやすい成功基準だろうね?

ただ個人的には会話システムだけに固執すると
自然言語処理の全体像が見えなくなると思う

たとえばセマンティックWEBみたいなものも
まだまだ伸びしろはあると思ってる
715デフォルトの名無しさん
垢版 |
2020/03/06(金) 06:31:16.54ID:Z17kfdKR
>>553
>プーチン大統領
>「AIの分野を独占した者は世界を支配する」と述べた

へえそれ面白い発言だね!

なんか「チンポがシコシコ」とか
キチガイがブツブツ独り言言ってるのが多くて
スレ読むのも時間の浪費に思えてたけど
その一言だけでも開発のやる気が出てくるな!
2020/03/06(金) 06:39:31.50ID:Z17kfdKR
>>634
半年前のレスだから今さらだが
どんな分野でも新しく学ぶなら
基礎から始めるのが一番早いよ!

急がば回れ
2020/03/06(金) 06:45:42.68ID:Z17kfdKR
>>678
的外れな主張に的外れな反論だな……

自然言語処理は大きく見れば
コンピュータと同じ情報工学とかの分類だろ?

インターネットとか便利だから
工学は科学とやや別だが存在意義はあるだろ!
それも否定するなら2ちゃんに書き込むなよ?
2020/03/06(金) 06:46:45.11ID:Z17kfdKR
>>679
「チューリングテスト」とか調べてみるといいよ?
でも普通に考えて人工無能とは対話が成立しないだろ?
2020/03/06(金) 06:48:56.29ID:Z17kfdKR
>>679-688
>タスクが遂行できたらOK
それな

言語理解できてるかどうかは
命令実行できるかがひとつの基準

ただまあ中国の部屋とかあって
それが全てかというと怪しいけど
2020/03/06(金) 06:56:49.19ID:Z17kfdKR
>>719
×中国の部屋
○中国語の部屋
2020/03/06(金) 06:59:04.97ID:Z17kfdKR
このスレのログ全部読んだが
8割方は無駄なレスだな!?

マイナージャンルなんだから
ちゃんと意味のあるレスしてくれ
722デフォルトの名無しさん
垢版 |
2020/03/06(金) 09:47:31.77ID:C1NEJCD5
「情報工学」などといかにも形式ばった分類の仕方は当てはまらないと思うぞ?

>>717
>自然言語処理は大きく見れば
>コンピュータと同じ情報工学とかの分類だろ?

0.   外国語、特に英語、の教え方
「読み書きは出来るが会話ができない」というのは間違い。「読み書き」も出来ない
Decorative artとは、絵画、彫刻、建築を除いた家具、食器、絨毯、藍掛け、花瓶、タイル、
ドアのノッカーなど美術品と見做せるものの総称
表裏は日本語だと「おもて」と「うら」だが、漢文では「外側」の「内側」であり、「裏」は「なか」である。
コインの場合、英語ではhead & tailで、誰かの頭部の像がある方が日本語の「おもて」だが、tailが「うら」とは奇妙
http://hiroomikes20120501.blogspot.com/2014/12/20141212.html

 志村さんの、極めて真っ当で健全な問題意識は、受験に特化したおかしな出題傾向のみならず
「数学オリンピック」という制度にも警鐘を鳴らしている。彼自身の表現を引いてみよう。
 「数学オリンピックについて言えば、それで良い成績を得た人が実質的に得るものはほとんどない。
単なる競争であって、ちょっと小・中・高校生の将棋や囲碁の大会と似ているところがある」
https://news.nicovideo.jp/watch/nw5274901
723デフォルトの名無しさん
垢版 |
2020/03/06(金) 10:22:07.67ID:sKEI9Mym
やっとまともな人キター😆
724デフォルトの名無しさん
垢版 |
2020/03/06(金) 10:24:45.48ID:C1NEJCD5
>>717
>的外れな主張に的外れな反論だな……

「単原子分子理想気体」なんて、高校物理の教科書にしか存在しないぞ?
2020/03/06(金) 14:58:12.75ID:7RRa/W6z
おまえら自然言語処理って何を想定して話してるん?

1)形態素解析
2)構文解析
3)意味解析
4)文脈解析

1)と2)は昔からあった技術だし、新奇性はあんまりないな
昔はLISPがデフォルトだったのがpythonが出てきて風が吹いた?

3)と4)とりわけ4)はニューラルネットの成功で昨今花形分野になってるが
726デフォルトの名無しさん
垢版 |
2020/03/06(金) 15:09:48.66ID:sKEI9Mym
全部

end-to-endでできるのが綺麗
素敵
2020/03/06(金) 15:12:58.31ID:7RRa/W6z
>>726
だから話がかみ合わないんじゃね?

総論語るだけなら中味が薄くなるのは仕方がないわ
728デフォルトの名無しさん
垢版 |
2020/03/06(金) 16:06:20.07ID:sKEI9Mym
やりたいのは機械翻訳なんだけど
729708
垢版 |
2020/03/06(金) 18:14:05.74ID:Z17kfdKR
>>723
まともな話題したいから
コテハンになるよ

このスレ過疎で荒れてるけど
自然言語処理の話できるとこ
少ないから困るんで話題振る
730ことのは
垢版 |
2020/03/06(金) 18:17:16.96ID:Z17kfdKR
>>725
>自然言語処理って何を想定して話してる
応用分野で語る方が分かりやすいと思う

機械翻訳がやりたいのか
自動要約がやりたいのか

クイズに答えるAI作りたいのか
とかたとえばそういう利用目的
731ことのは
垢版 |
2020/03/06(金) 18:20:37.52ID:Z17kfdKR
>>725
>LISPがデフォルト
Prologは面白いと思う
マイナーだけど今でも

>pythonが出てきて
一番普及してる言語ってだけで
Pythonだから新しく
何かできるってのはあまりないな
もちろんライブラリは別の話
732ことのは
垢版 |
2020/03/06(金) 18:20:53.57ID:Z17kfdKR
>>725
>ニューラルネットの成功
人力で辞書作るの大変だから
機械学習でやろうって流れだね

ただそれで完全自動化できて
文法とか意味とか一切不要になる
とまでは個人的に思わないけど
733ことのは
垢版 |
2020/03/06(金) 18:24:57.45ID:Z17kfdKR
>>726
>end-to-end

日本語と英語だけを機械学習に投げれば
日英の機械翻訳ができるようになるとか

そういうのが理想ではあるけど
まだ完全な実現はしてないはず
734ことのは
垢版 |
2020/03/06(金) 18:26:30.58ID:Z17kfdKR
>>728
>機械翻訳
個人開発してる人あまりいないね?
何万語も辞書作るのは大変だから

だから機械学習に期待するんだろうけど
今度はグーグル翻訳に勝つのが大変だし
2020/03/07(土) 09:29:39.56ID:RxuNI4Xs
データの気持ち、コーパスの気持ち、翻訳するときの頭の使い方を
ニューラルネットワークの構造に落とし込めたらいいな、と思う
2020/03/07(土) 10:20:20.91ID:7h4/v12R
じじくさい
737デフォルトの名無しさん
垢版 |
2020/03/07(土) 17:34:56.58ID:RZgTMQsN
Pythonはバランスが良い
C#は過小評価されてる
Rubyは過大評価されてる
VBやPHPは話にならない
COBOLやFORTRANはオワコン
2020/03/07(土) 17:59:21.47ID:f259p7qQ
放送大学で自然言語処理の講義
739デフォルトの名無しさん
垢版 |
2020/03/07(土) 18:14:12.57ID:RZgTMQsN
mecabと秋山さんのやつかな
2020/03/07(土) 21:31:13.53ID:rbjTQwyv
少し違うがタロットカード解釈みたいなもんか。
良い占いの結果を期待しだすとキリがない。
741ことのは
垢版 |
2020/03/08(日) 00:29:38.45ID:q3PBpoad
たとえばIBMのワトソンでも
Prologが使われていたよね

機械学習の発展が昔と一番違う所だけど
他が全部不要になるまでではないと思う
742ことのは
垢版 |
2020/03/08(日) 00:41:24.43ID:q3PBpoad
機械翻訳は昔のルールベースがあって
次に統計的フレーズベースがあって
今のニューラルネットと段階がある

フレーズベースとニューラルでも大違いだが
ニューラルは段違いに計算資源を使うので
その辺も個人や零細だと参入障壁になる

そんなの知ってるとか思うかもしれないけど
今の自然言語処理の状況を整理してる段階ね
743ことのは
垢版 |
2020/03/08(日) 01:03:13.55ID:q3PBpoad
だから計算量のこともあるし
あと集客力とかもあるから
グーグルと真っ向勝負するのは厳しい

ただそれでもやり方はあると思うんだ
ライオンが食べた後の骨についた肉に
ハイエナがかじりつくようなやり方だけど

たとえば海外のサイトで有用な情報があって
そのサイトの翻訳に特化したアプリを作って
(公開するのは翻訳権の問題があるけど)
個人的に何かの商売に生かすとかね

そういう風に正面突破できなくても迂回したら
成立するアプリとかサービスとかあるはず
744ことのは
垢版 |
2020/03/08(日) 01:07:40.15ID:q3PBpoad
グーグルのディープラーニングで
AIブームが来て自然言語処理も
周辺だけど波が来てるはず

この世界的ビッグウェーブに乗るしかない
逃したらまたAI冬の時代みたいになるかも
というかすでにピーク過ぎてる恐れもある

なのにこのスレは年中
「チンポでシコシコ」とか
ブツブツ言ってるだけで
世の中の流れに乗れてない

けどそれだと人生損する恐れがあるので
みんなでブレインストーミングというか
ちょっとずつ情報を持ち寄って
見通しを立てる位はできる場にしたい

と思ってコテハンになった訳だけど
もう少し話題を出していくね
745ことのは
垢版 |
2020/03/08(日) 01:14:04.80ID:q3PBpoad
たとえばスマートスピーカーの普及と
それに伴う音声認識や自然言語処理の需要はある
ってのはこの分野に関わってれば自然と分かるはず

だけどそこからもうひとひねりして
たとえば最近ブームになったRPAと
結びつけられるアプリやサービスはできないかとか

まあRPAもピーク過ぎた感もあるけど
付加価値があれば生き残れるかもしれない
746ことのは
垢版 |
2020/03/08(日) 01:18:54.01ID:q3PBpoad
もちろんRPAはたとえばの話で
他にも色々あるだろう
思いついたら書いていくけど

たぶんグーグルとかIT大資本と
正面から勝負するのは厳しい
まずサーバとかのインフラが違うから
もちろん技術の理解の深さとか全部違うけど

開発リソースが限られている中で
最終的にビジネス的に成功するには
既存の要素の組み合わせで
差別化していくしか生き残る道はないと思う
2020/03/08(日) 02:51:55.21ID:UdQenuRT
日本は国家プロジェクトとしてGoogleに対抗するくらいの本気度みせてほしいね
1950年頃はコンピュータ産業を育成するために産業編成までやって通産省が主導した歴史がある

中国は国を挙げてリソースを投入するから、後発といえども侮れない
2020/03/08(日) 05:25:44.76ID:Ll0mxARo
>>747
livedoorとかは?
749デフォルトの名無しさん
垢版 |
2020/03/08(日) 10:06:53.38ID:Q9GXCt8T
それ失敗した奴じゃん。。。

今は翻訳バンクやってるけど
コーパスに容易にアクセスできない代物だし
750デフォルトの名無しさん
垢版 |
2020/03/08(日) 14:01:27.38ID:Y2NtS7Rm
●●省が主導すると碌なことにならない
751デフォルトの名無しさん
垢版 |
2020/03/08(日) 15:17:22.02ID:Q9GXCt8T
今更富士通がawsに対抗するクラウドを出すそうで(笑)

官公庁の仕事をとれるだろうけど
サービスの質悪いだろうなあ
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況