自然言語処理スレッド その5

■ このスレッドは過去ログ倉庫に格納されています
1Mr.Moto
垢版 |
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
574デフォルトの名無しさん
垢版 |
2019/07/14(日) 11:27:28.60ID:EX3wZZBU
mecab+neologdって実務では使いづらいね
タレント名やアニメタイトルが入っていて
おかしなことになる
2019/07/14(日) 13:50:38.34ID:1EGPgUpm
>>574
まさにそういう単語を一つのトークンとして取り出すためのNEologdじゃないか
どういう「実務」を想定してんの?
2019/07/14(日) 15:00:35.78ID:EX3wZZBU
通常の文章の一部がタレント名やアニメタイトルになってしまうことがあった
2019/07/14(日) 15:26:35.23ID:1EGPgUpm
ipadicと併用して使い分けるか、あるいはSudachiを使って分割単位制御を使うか……
578デフォルトの名無しさん
垢版 |
2019/07/15(月) 16:54:56.09ID:kbm10fX5
sudachiって時々聞くんだよね
使い勝手いいのかしらん?
579デフォルトの名無しさん
垢版 |
2019/07/17(水) 12:36:20.69ID:h8qdwBiV
NLP若手の会、若手とは何歳まで?
580デフォルトの名無しさん
垢版 |
2019/07/18(木) 12:43:38.00ID:aIkRcGCI
誰に聞けばいいんだろう?
581デフォルトの名無しさん
垢版 |
2019/07/25(木) 19:36:16.14ID:F6WRMsjA
35歳まで

xlnetてスゴいけど
美しくないよね
2019/07/26(金) 00:01:53.29ID:91bxr7LM
自然言語処理の世界って機械学習そんな実務では使わない?
583デフォルトの名無しさん
垢版 |
2019/07/26(金) 04:52:04.26ID:I3P9XToM
使うがな
2019/07/28(日) 20:43:36.95ID:PX72JLbq
自然言語処理って理論的にどうしてもすっきりしないからなんか泥臭い作業をしてなんとなく精度出していく感じの印象がある
585デフォルトの名無しさん
垢版 |
2019/07/29(月) 19:20:38.78ID:/GKFZC7o
例えば?
2019/07/29(月) 19:53:39.01ID:N/ZYJMuY
寿司は美味しい
とか英語に無い形容詞で終わる文を巧く整理できない
等たくさんありそう
2019/07/29(月) 20:15:03.97ID:/LIDXS64
なに言ってるのか分からない
588デフォルトの名無しさん
垢版 |
2019/07/29(月) 20:24:10.33ID:N/ZYJMuY
学校文法でない文章は解析の精度を上げる為に泥臭い作業を必要とする
学校文法でない文章がデータ中に無視できない数で存在する

こんな感じのこと
2019/07/29(月) 21:37:42.34ID:CSar0obt
https://i.imgur.com/WocYu5X.jpg
590デフォルトの名無しさん
垢版 |
2019/07/29(月) 21:39:09.13ID:/LIDXS64
学校文法で解析するのって古くない?
20年くらい前の手法じゃない?
2019/07/29(月) 21:44:29.72ID:9qefrO4X
日本語のNLPって、大学は期待でき無さそうだけど、企業はどこが進んでる?

米IT企業は日本語は放置中だから日本人がやるしかない
592デフォルトの名無しさん
垢版 |
2019/07/29(月) 21:52:35.80ID:N/ZYJMuY
word2vec開発や一旦文を画像にして解析するシステムの開発を指導したのは私ですけど
すっかり頭が働かなくなりました
いやー参った
2019/07/29(月) 22:08:46.82ID:/LIDXS64
>>591
大学に近いあたりのあやしいベンチャーしかないんじゃない?

企業はどこかなあ
楽天、クックパッド、LINEあたり?
2019/07/30(火) 00:58:27.10ID:ZDjzCSg/
>>589
グロ
595デフォルトの名無しさん
垢版 |
2019/07/30(火) 12:48:17.32ID:Pzm3CBJH
knpってもう更新しないのかな
ニューラルのやつを待っているんだけど。。。
596デフォルトの名無しさん
垢版 |
2019/07/30(火) 17:39:25.76ID:1pmpZMvd
個人だとPFNの海野さんは講談社から本二冊出してて、あとはSELFあたりかな
IMEや電話などの会社も取り組んで入るけど深層学習はあまり貢献してないと思う
2019/07/30(火) 21:00:51.99ID:Pzm3CBJH
SELFってなあに?
598デフォルトの名無しさん
垢版 |
2019/07/31(水) 15:04:05.84ID:957FHCtt
会社?
2019/08/04(日) 10:43:36.86ID:8eqp+0G+
これからもmecabでいいのか?
600デフォルトの名無しさん
垢版 |
2019/08/10(土) 12:21:36.89ID:Oiwm/fTO
>>591
>日本語のNLPって、大学は期待でき無さそうだけど、企業はどこが進んでる?

FUJITSU Human Centric AI Zinrai(ジンライ) - 富士通のAI(人工知能)
https://www.fujitsu.com/jp/solutions/business-technology/ai/ai-zinrai/
2019/08/10(土) 17:08:05.70ID:jOgNlW/N
ていうか地雷だな
2019/08/10(土) 17:19:44.24ID:QVt2JQ/u
POCKETALKってソースネクストから出てるけど、作ったのは外資だっけ?
603デフォルトの名無しさん
垢版 |
2019/08/11(日) 08:48:03.40ID:l9i27vsY
 伝説や民謡や民話は、事実そのままの歴史と見なすわけにはいかない。事実のとらえかたがあいまいであり、
未発達の民族のいかにも考えそうな観念のつらなりだからです。事実そのままの歴史をつくりあげる民族は、
自分の状態と自分のめざすところを自覚した民族です。目の前に見えている現実のほうが、
過去の現実よりも確固たる土台をなすのであって、過去の現実を土壌とする伝説やつくり話は、
みずからを民族として明確に自覚するにいたった民族にとっては、もはや歴史の名にあたいしないのです。
<歴史哲学講義(上) ヘーゲル著 長谷川宏訳 岩波文庫>(序論)
604デフォルトの名無しさん
垢版 |
2019/08/11(日) 10:54:27.24ID:yJMQ8cuL
ぽけとーくはどこだったかなあ
中華系じゃなかった?
605デフォルトの名無しさん
垢版 |
2019/08/19(月) 20:33:40.55ID:lyoyHZhH
身の回りにいる人ならば、少しずつ少しずついい方向に変えていくことは

できるかもしれないけれど、ネットの場合匿名性もあり、都合の悪いことがあると

簡単に別人になり替わることができる。そのため心を通じ合わせることは

学校の友達を作ることより難しいともいえる。うわべだけの付き合いならば

簡単にできそうだけどね。


言葉づかいの乱れ。面と向かって会話するよりもネット上は

年齢差を感じにくいので、つい敬語を忘れがちになる。

チャットの場合は親しみをだすためにあえて敬語禁止にする場合もあるけどね。

それゆえに、罵倒中傷が多い、人を傷つけることになんとも思わなくなっている。

今親は子供の躾を放棄してるから、礼儀をしらない子供は多い。大人にもいるけどね。


https://ameblo.jp/cinnamon-rilakkuma/entry-10437043379.html
606デフォルトの名無しさん
垢版 |
2019/08/19(月) 20:43:48.75ID:lyoyHZhH
自分のマイページに独り言を書いて
それがなぜか削除される事件が発生。
明らかな不当削除にも関わらず
ミスを認めたくない運営は
謝罪どころか、適正な判断と開き直る始末。

そもそも自分のページに独り言を書いて
それが消されるなんてことは
他じゃ聞いたことがない。
よほど問題のある発言でもない限りは。

削除するのは通報があったから。
つまり通報さえしてしまえば
運営は簡単に削除してしまう。

問題のありそうな書き込みはいくらでもあるので
気に入らない人の伝言板を通報すれば
書き込みの削除どころか
冒険者の広場の利用停止にまで追い込むことも可能。

https://ameblo.jp/cinnamon-rilakkuma/entry-11850323786.html
607デフォルトの名無しさん
垢版 |
2019/08/22(木) 05:46:26.65ID:6UjUk0I/
マジで素人ですまん
NEologdに登録されてる名詞の一覧とかって閲覧できる?
具体的には「●から始まる単語はこれら」「●で終わる単語はこれら」というのを総ざらいしたいんだけど

Mecabの導入方法すら今調べてるレベルなんだが詳しい人たのんます
608デフォルトの名無しさん
垢版 |
2019/08/22(木) 08:10:20.67ID:4/CbGbFx
できる
609デフォルトの名無しさん
垢版 |
2019/08/22(木) 08:52:10.86ID:6UjUk0I/
言葉足らずな俺が悪かったからやり方教えてくれると本当に助かる
610デフォルトの名無しさん
垢版 |
2019/08/22(木) 09:52:07.50ID:xQsiKIbM
ここはマじゃなくてム板だからな
そういう意見は慎め
2019/08/22(木) 20:33:46.41ID:fgbADTlz
ゴメンね
612デフォルトの名無しさん
垢版 |
2019/08/22(木) 22:26:46.86ID:6UjUk0I/
自己解決したわ すまんかった
613デフォルトの名無しさん
垢版 |
2019/08/23(金) 12:00:47.94ID:N+uruwTV
自分勝手かよ。。。
614デフォルトの名無しさん
垢版 |
2019/08/25(日) 16:42:53.90ID:0SLJ3mAi
自由という概念は極めて曖昧なもので、人によって解釈も異なるので
完全な自由というのは存在しません...
がそれに近づけば近づく程、孤独になり最終的に一人で活動する方
がいいという結論に行き着いてしまう
一人で活動するのは苦労しかありませんけど、自由だからこそ出来る
手段でどの大所帯チームに対しても肩を並べる、
或いは凌駕するくらいの知名度を得る、という事ももしかしたら
出来るかもしれないから、多人数とはまた違う夢がありますよね。
極端な話このゲームで最終的に一番名を挙げるチームは、
ひょっとしたら個人なのかもしれません

https://hiroba.dqx.jp/sc/diary/42497499998/view/5912529/
615デフォルトの名無しさん
垢版 |
2019/08/25(日) 16:55:22.50ID:IF0Kk2PY
プログラム板なのでプログラムの話をしてください。
616デフォルトの名無しさん
垢版 |
2019/08/25(日) 17:09:37.96ID:0SLJ3mAi
>>615
『自由』とは何ぞや?
617デフォルトの名無しさん
垢版 |
2019/08/25(日) 20:36:48.58ID:0SLJ3mAi
>>600

富士通ご自慢のAIシステム『Zinrai』で、『グリーン姐さん』を入れてみた!!

https://i.imgur.com/1DPA7eg.jpg
618デフォルトの名無しさん
垢版 |
2019/08/26(月) 10:09:38.62ID:+xX8EJVV
https://i.imgur.com/QoaNHNp.jpg
619デフォルトの名無しさん
垢版 |
2019/08/29(木) 10:25:36.15ID:EDmBnjAZ
>>617 >>618
腐乱死体が自然史博物館だとか、ベルリン陥落が塔と巨大建築物とは、
実にバカバカしいAIと言わざるをえない。
620デフォルトの名無しさん
垢版 |
2019/08/29(木) 11:56:18.41ID:KWwKq6sT
そう?
理解できる結果だと思うけど

ミイラは自然史博物館によくあるし
621デフォルトの名無しさん
垢版 |
2019/08/29(木) 15:09:25.09ID:cvu01lA2
>>620
>ミイラは自然史博物館によくあるし

ああ、これは参った。しかしながら、

>>618
これは断じて『塔と巨大建築物』ではない!
2019/08/29(木) 19:24:18.61ID:Z/E7U0AT
右の建物が塔の崩壊に見えたんでしよ
奥の建物の崩壊かもしれないけど
623デフォルトの名無しさん
垢版 |
2019/08/30(金) 02:49:59.63ID:lY9mjXse
商用のAIを、軍事学とかに当てはめるとはねー。
624デフォルトの名無しさん
垢版 |
2019/09/15(日) 20:03:47.25ID:ZE/j/eyC
667デフォルトの名無しさん2019/09/15(日) 19:16:36.09ID:Ms2MnLBB
文法的には正しいだろ
意味的にはおかしいが
俺あるいは手がちんぽをシコシコするのであって、ちんぽがシコシコするわけではない

ちんぽ.シコシコしろ()
ではなく
手.シコシコしろ(俺のちんぽ)
とするのが意味的に正しい

集約云々は前者でモデリングするべき
即ち俺とちんぽが繋がってる
ちんぽが自立して動き回ったりしない
主人が死ねばちんぽも死ぬ、即ちライフサイクルが一致する
そういった集約は特にコンポジションと呼ばれる
625デフォルトの名無しさん
垢版 |
2019/09/30(月) 16:38:49.27ID:RcGMqML5
日本人の研究って筋が悪いのが多いよね
2019/09/30(月) 16:58:06.79ID:xCuAg0tG
例えば?
627デフォルトの名無しさん
垢版 |
2019/09/30(月) 18:52:48.56ID:RcGMqML5
bert使っただけとか
628デフォルトの名無しさん
垢版 |
2019/09/30(月) 18:55:37.62ID:RcGMqML5
具体的には黒羽し、小町、鶴岡あたり
629デフォルトの名無しさん
垢版 |
2019/10/01(火) 18:40:02.68ID:gKinUVIw
aclはなんて呼べばいいの?
あくる?

naacl、emnlpは?

colingはこーりん or こりんでしょ?
2019/10/01(火) 19:18:35.83ID:qLDcNMJC
>>1
言語を論理式に変換して真偽判定する
議論に負けないレスバトルのチートソフトがあるけど

それとは違うの?

弁護士とかに使われるとヤバいやつ
631デフォルトの名無しさん
垢版 |
2019/10/02(水) 15:31:14.41ID:yOejSKNY
東大のNLP研究は過大評価だと思う
632デフォルトの名無しさん
垢版 |
2019/10/08(火) 08:08:34.40ID:UgJ3rIB6
教師無し機械翻訳は結局、教師ありだよね

ああいう言い方は良くないと思う

入口が教師無しなだけで実際は疑似教師信号を作っているだけじゃん
633デフォルトの名無しさん
垢版 |
2019/10/17(木) 17:15:27.62ID:bUM+FVLx
nltkのpos taggerていろいろ用意されてるけど
どれが一番精度が高いの?
2019/10/17(木) 22:01:54.54ID:hJwdBePc
初心者コメですまぬ
機械学習の解析には慣れてるんですが自然言語処理は初心者です
そちらの業界に転職したいので、形態素解析の勉強からはじめるつもりですが悪手ですか?
635デフォルトの名無しさん
垢版 |
2019/10/18(金) 08:04:05.49ID:cxX7A3K/
いいんじゃない?
基礎だし
636デフォルトの名無しさん
垢版 |
2019/10/21(月) 07:55:03.26ID:2zFZa7pr
反応なしかよ
2019/10/21(月) 18:37:53.34ID:Q8j8rgkI
>>635
ありがとう。mecabで形態素解析やって感触つかんでから理論しらべてみるわ

>>636
いや、すぐにレスしたら連投気味かなーと
638デフォルトの名無しさん
垢版 |
2019/10/21(月) 20:31:23.46ID:VyV3rzny
いいのいいの
過疎スレだし
639デフォルトの名無しさん
垢版 |
2019/10/30(水) 16:48:28.22ID:OxfqAVss
transformerのlayerとheadの役割が分からない
それぞれ何を担当しているの?
640デフォルトの名無しさん
垢版 |
2019/11/08(金) 18:17:20.82ID:HpQs1W/g
だれか教えてよん
2019/11/08(金) 22:10:57.81ID:6Ojkk3W+
今読んで理解したところでは、 layer は nn の一つの層
head は並列化して処理する方法のようだ
642デフォルトの名無しさん
垢版 |
2019/11/09(土) 21:40:59.73ID:R+fonfJU
headは文中の語と語の関係を処理している、ということ?
643デフォルトの名無しさん
垢版 |
2019/11/14(木) 22:43:20.74ID:McU02fw5
チンポがシコシコして、チンポがシコシコしすぎて死んじまった!

https://i.imgur.com/q8jHVYq.jpg
https://i.imgur.com/d59Jp0m.jpg
2019/11/15(金) 06:51:22.47ID:y4RyaYdh
transformerでlayerを増やせば
より長距離の関係を学習するの?
645デフォルトの名無しさん
垢版 |
2019/11/22(金) 12:21:28.04ID:308IU3xk
【AI】2019年大学入試センター試験英語筆記科目においてAIが185点を獲得![11/18]
https://egg.5ch.net/test/read.cgi/scienceplus/1574141564/
646デフォルトの名無しさん
垢版 |
2019/11/23(土) 10:21:10.34ID:OZRPdgAX
新井某とか松尾某とか日本AI界の癌だから潰れろ
647デフォルトの名無しさん
垢版 |
2019/12/01(日) 11:57:27.71ID:VXOBY+pM
24 名無しさん@ゴーゴーゴーゴー! (JP 0H82-LX7o [153.145.207.163]) 2019/11/23(土) 16:54:55.03 ID:l9637O/lH
https://i.imgur.com/1VuRIrP.jpg
648デフォルトの名無しさん
垢版 |
2019/12/01(日) 23:27:16.76ID:n9fjYPLa
『DQウォーク』で『DQ4』女勇者の装備を後ろから見ると…【電撃DQW日記#179】
https://dengekionline.com/articles/18874/
2019/12/02(月) 15:12:01.87ID:hClkt5X7
マーニャの方がエロい
650デフォルトの名無しさん
垢版 |
2019/12/03(火) 20:19:36.94ID:iL4nL4i7
785 名無し三等兵 sage 2019/12/03(火) 08:03:27.78 ID:sujZBpWD
>>762
>「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!

チンポにチンポ自身を扱く機能が備わっていないので自動詞は不適切だから(34文字)

胸(心臓)には鼓動する機能があるため自動詞の適用対象だが
チンポには勃起する機能はあっても自身を扱く機能はないので「チンポ『が』勃起する」は成立しても「チンポ『が』シコシコする」は成立しない
夢精した状況を「チンポ『が』シコシコした」と称したければ「チンポがエロい夢を見させ夢精した」=「脳ではなくチンポが思考を司りエロい夢を見させて夢精させた」という状況で可となる

脳でなくチンポで物を考える生物についてなら「チンポ『が』シコシコする」は成り立つ
如何にもだつお的じゃないか
651デフォルトの名無しさん
垢版 |
2019/12/04(水) 07:39:37.94ID:VwKIbrCi
bpeができて
分かち書きのための形態素解析の存在価値が大分薄れてしまった
652デフォルトの名無しさん
垢版 |
2019/12/24(火) 06:39:25.85ID:8asYM3Qv
neural machine translationを試してるけど
ユーザー辞書を指定する方法が分からない

誰か教えて
653デフォルトの名無しさん
垢版 |
2019/12/29(日) 22:17:53.47ID:cEP7YGjF
https://i.imgur.com/HLo7Kzi.jpg

10年ぶりにプログラミングしようかなって!
654デフォルトの名無しさん
垢版 |
2019/12/30(月) 11:24:56.40ID:WAqdspci
怨霊注意
グロ中尉
655デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:08:45.88ID:TuYxoCDY
オブジェクトのクラスは概念であり、インスタンスは現物である。

チンポはチンポでも人それぞれいろいろなチンポがある、それはクラスとしてのチンポ。
しかしながら自分のチンポは一つしかない、それがインスタンスなのである。
656デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:17:53.11ID:l5J0jQZo
チンポはチンコとかチンボとか男根とかペニスとかいろんな表現ができる。しかしながら概念は静的だ。

static フィールド
そもそも static は 「静的」 を意味します。「動的ではない」ということで、そのフィールドは
いくらインスタンスをたくさん生成したとしても、クラスにたった1つです。
657デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:20:08.32ID:l5J0jQZo
チンボをチンコと呼ぶかチンボと呼ぶか、それはstatic変数だ。
658デフォルトの名無しさん
垢版 |
2020/01/16(木) 15:32:04.65ID:01CWZx5d
ちんぽこ
ぽこちん
https://www.youtube.com/watch?v=SNi02VIROpw
659デフォルトの名無しさん
垢版 |
2020/01/16(木) 20:59:30.32ID:aB/eHrOt
bertの次が出てこないと話にならない
660デフォルトの名無しさん
垢版 |
2020/01/17(金) 08:11:28.21ID:EGQaS6kk
bert系の結果が良いのはベンチマークテストのleakとか言われてなかった?
661デフォルトの名無しさん
垢版 |
2020/01/22(水) 23:22:28.23ID:XnuZbeSJ
提出日:平成26年1月31日
平成25年度 卒業論文
ZARD坂井泉水の歌詞における表現特性
大阪教育大学 教育学部 学校教育教員養成課程 
国語教育専攻 小学校コース
国語表現ゼミナール 102127 平山 剛
指導教官 野浪 正隆先生
http://www.osaka-kyoiku.ac.jp/~kokugo/nonami/2013soturon/hirayama/hirayama_sotugyouronbun.html
662デフォルトの名無しさん
垢版 |
2020/01/23(木) 11:33:35.86ID:VWfJLmDE
SARDとZARDの類似性も調べて欲しい
663デフォルトの名無しさん
垢版 |
2020/01/23(木) 12:12:06.45ID:iziTjVhn
なにこれ私怨かなんかで晒されてるの?
664デフォルトの名無しさん
垢版 |
2020/01/27(月) 21:13:48.96ID:BMHIWM+6
ZARD「心を開いて」
https://youtu.be/8n1T9sXaCHI
665デフォルトの名無しさん
垢版 |
2020/01/28(火) 14:53:45.02ID:zB2lv0ET
ZARDメドレー
https://youtu.be/FqQ1gZ46byk
666デフォルトの名無しさん
垢版 |
2020/01/28(火) 19:00:50.86ID:zB2lv0ET
875 名無し三等兵 sage 2020/01/28(火) 15:08:21.81 ID:KjyBzP+6
>>873
チンポが脳から独立して生きてる珍獣だつおさんは平日昼間で大多数の社会人は勤労時間帯中なのに暇なんすね
珍獣というかチン獣は人間の世界に場違いだからそのままニートでネットの掃き溜めに居続けるほうが社会全体に有益でしょう
667デフォルトの名無しさん
垢版 |
2020/01/29(水) 21:37:54.21ID:1M5pf25d
ZARD 歌曲全集
https://youtu.be/N7tw_5t7R0c
668デフォルトの名無しさん
垢版 |
2020/01/30(木) 13:59:21.13ID:sB8XzCcn
https://www.youtube.com/watch?v=o13WEDJMkQA
669デフォルトの名無しさん
垢版 |
2020/02/01(土) 10:06:12.78ID:QPNiPyb+
すごい分子 世界は六角形でできている
https://moro-chemistry.org/archives/1934
670デフォルトの名無しさん
垢版 |
2020/02/01(土) 14:58:52.02ID:6nKSRHn2
2009年にIUPAC(国際純正・応用化学連合)により新元素と認定され、著名な天文学者コペルニクス
(1473-1543)にちなんで、2010年の彼の誕生日の2月9日に、コペルニシウムと命名された。
https://staff.aist.go.jp/koji-abe/Table/Cn/Cn.htm
2020/02/01(土) 22:50:31.19ID:jeWtPg7X
>>669
フラーレンとフタロシアニンとあとひとつがわからない。
672デフォルトの名無しさん
垢版 |
2020/02/02(日) 18:13:51.63ID:iCgKJVx9
コランニュレン
https://upload.wikimedia.org/wikipedia/commons/thumb/2/23/Corannulene.svg/150px-Corannulene.svg.png
スマネン
https://upload.wikimedia.org/wikipedia/commons/thumb/d/d3/Sumanene.svg/156px-Sumanene.svg.png

すまんね
673デフォルトの名無しさん
垢版 |
2020/02/02(日) 18:18:10.49ID:iCgKJVx9
コロネン
https://upload.wikimedia.org/wikipedia/commons/thumb/0/03/Coronene_200.svg/155px-Coronene_200.svg.png

なんか新種のウィルスみたいだな
https://resou.osaka-u.ac.jp/ja/research/2019/20191029_1
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。