このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
自然言語処理スレッド その5
レス数が950を超えています。1000を超えると書き込みができなくなります。
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
851デフォルトの名無しさん
2020/03/15(日) 08:26:59.82ID:xDhRa7pP 世界の事実?
>>849
>チンポが独立した生き物としての学習は可能だが世界の事実と異なるため
化学の元素なるものは空想である、物理的エネルギーなどというのも空想である。
だいたい、客観的事実存在という観念なるものが大いなる空想である。
今日の実験や科学はけっして空想を排斥することはできないのである。
>>849
>チンポが独立した生き物としての学習は可能だが世界の事実と異なるため
化学の元素なるものは空想である、物理的エネルギーなどというのも空想である。
だいたい、客観的事実存在という観念なるものが大いなる空想である。
今日の実験や科学はけっして空想を排斥することはできないのである。
852デフォルトの名無しさん
2020/03/15(日) 11:00:04.12ID:80PNSiLp >>845
損みたいに自分の自社株持ってる人がコメントで株価操作出来る人は違法で逮捕されないのはなぜなんだぜ?
損みたいに自分の自社株持ってる人がコメントで株価操作出来る人は違法で逮捕されないのはなぜなんだぜ?
853デフォルトの名無しさん
2020/03/15(日) 11:48:26.52ID:X5C4uG55 株価が大きく動いた後で重大なニュースが発表されるということがよくある
間違いなくインサイダーなんだろうが、逮捕されたという話を聞いたことがない
間違いなくインサイダーなんだろうが、逮捕されたという話を聞いたことがない
854デフォルトの名無しさん
2020/03/15(日) 13:00:47.42ID:+iUdlEB1855デフォルトの名無しさん
2020/03/15(日) 13:21:03.46ID:FJtUQr7v このマウンティング合戦でどうしたいの?
856デフォルトの名無しさん
2020/03/15(日) 22:14:42.53ID:jeoNoYB+ 俺が一番偉い。みんな跪け。
これでトップはすでに決まった。
以降のマウンティングは無意味である。
これでトップはすでに決まった。
以降のマウンティングは無意味である。
857デフォルトの名無しさん
2020/03/16(月) 07:10:30.47ID:xhPu6vsp NICTからBERTのモデルが公開されたね
これはとても良いこと
これはとても良いこと
858デフォルトの名無しさん
2020/03/16(月) 07:20:50.25ID:x9PNMypw マウンティングの相手はbotだった
859デフォルトの名無しさん
2020/03/19(木) 09:38:18.82ID:WwJ6LrXC ロゼッタのBLEUが90あたりだそうで
0.2ポイント上がった(笑)とかでドヤ顔で論文出して喜んでいたのはなんだったんだろう、て思う
0.2ポイント上がった(笑)とかでドヤ顔で論文出して喜んでいたのはなんだったんだろう、て思う
860デフォルトの名無しさん
2020/03/20(金) 10:39:18.21ID:01DcwsDi >>530
>例えば、現実の世界に、円形をした物はたくさん存在するが、いずれも完全な円ではないし円そのものでもない。
例えばですけど、僕の知り合いが中学生のころ、数学で「√3は無理数なのに、1:2:√3の直角三角形は現実に存在する。
実物の三角形の√3の端はどうなっているんだ?」と疑問に思って親に聞いたところ答えられなかったことがあったそうです。
https://news.nicovideo.jp/watch/nw6859935?news_ref=top_topiclist
>例えば、現実の世界に、円形をした物はたくさん存在するが、いずれも完全な円ではないし円そのものでもない。
例えばですけど、僕の知り合いが中学生のころ、数学で「√3は無理数なのに、1:2:√3の直角三角形は現実に存在する。
実物の三角形の√3の端はどうなっているんだ?」と疑問に思って親に聞いたところ答えられなかったことがあったそうです。
https://news.nicovideo.jp/watch/nw6859935?news_ref=top_topiclist
861デフォルトの名無しさん
2020/03/20(金) 10:43:42.62ID:nAHhYb7g 虚数は存在しない(これも嘘だが)とされているが
無理数は実在するからな
無理数は実在するからな
862デフォルトの名無しさん
2020/03/20(金) 11:06:28.44ID:01DcwsDi >>849
>チンポは勃起するが、シコシコするのは人の意識のため
意識するのもチンポの働きなんだが?
<俺>
「 部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。 」
<チンポ>
「 その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。 」
>チンポは勃起するが、シコシコするのは人の意識のため
意識するのもチンポの働きなんだが?
<俺>
「 部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。 」
<チンポ>
「 その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。 」
863デフォルトの名無しさん
2020/03/23(月) 08:01:20.83ID:EBRrgZo4 中澤さん、必死やんw
https://twitter.com/Tzawa/status/1241647447790608384
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/Tzawa/status/1241647447790608384
https://twitter.com/5chan_nel (5ch newer account)
864デフォルトの名無しさん
2020/03/23(月) 15:24:05.32ID:9h5nrsHl まあ確信犯やろなあ
https://i.imgur.com/xZcndZq.jpg
https://i.imgur.com/xZcndZq.jpg
865デフォルトの名無しさん
2020/03/23(月) 15:30:52.77ID:QFUl7nfE つまらんレスすんな
866デフォルトの名無しさん
2020/03/23(月) 15:43:41.09ID:K7Q6+7NK867デフォルトの名無しさん
2020/03/26(木) 19:10:51.36ID:d0aopsHm868デフォルトの名無しさん
2020/03/30(月) 09:51:52.14ID:k79WWqQa Google翻訳ってコーパスどうしているんだろう?
WEBサイトから集めて自動アライン?
WEBサイトから集めて自動アライン?
869デフォルトの名無しさん
2020/03/31(火) 00:48:25.33ID:sE4QkNC9 そんな高度なことはせずに、wiki+αでコスト重視だと思う
870デフォルトの名無しさん
2020/03/31(火) 08:22:25.84ID:FV+T/yCu 足りなくない?
特許明細書とかは?
特許明細書とかは?
871デフォルトの名無しさん
2020/04/05(日) 20:35:26.03ID:PrdRHcmB 942名無し三等兵2020/04/04(土) 08:20:34.27ID:VRY1NLOI
なんでカスミンを揶揄するとチンポ厨が牽制に出てくるんだろう
「正確な記述を心がけています」とかのたまったカスミンが「チンポがシコシコする」の語法的誤りには全く触れないのも変だし
カスミンが直接返答するとプライドに傷付くようなレスにばかりチンポ厨が牽制を入れるのも不自然だし
カスミンとチンポ厨は共依存で嫌われ者同士で援護しあう関係でしょうか
「カスミンはホモ」
なんでカスミンを揶揄するとチンポ厨が牽制に出てくるんだろう
「正確な記述を心がけています」とかのたまったカスミンが「チンポがシコシコする」の語法的誤りには全く触れないのも変だし
カスミンが直接返答するとプライドに傷付くようなレスにばかりチンポ厨が牽制を入れるのも不自然だし
カスミンとチンポ厨は共依存で嫌われ者同士で援護しあう関係でしょうか
「カスミンはホモ」
872デフォルトの名無しさん
2020/04/06(月) 17:36:18.80ID:NiaaJxMA 204 名無し三等兵 sage 2020/04/06(月) 14:56:56.40 ID:K9vi7RPu
本が読書する
ニンジンが料理する
これが妙だと思わない脳の持ち主ってどうよ? と思っていたが、脳がチンポなら仕方ない
ただし人間扱いしてやる理由もない
本が読書する
ニンジンが料理する
これが妙だと思わない脳の持ち主ってどうよ? と思っていたが、脳がチンポなら仕方ない
ただし人間扱いしてやる理由もない
873デフォルトの名無しさん
2020/04/20(月) 17:32:27.72ID:9I4Ip7Z9 狂気ネットワーク
874デフォルトの名無しさん
2020/04/30(木) 11:11:26.63ID:nK0WIpjT 2020-04-27
番外編 98年ブルマJC (エッチなポーズ連続のエロダンスを強制される哀れな娘達)
https://vuluma.hatenablog.com/entry/erodancejcshuchi
↑
チンポがシコシコする、とはこういう意味だ!
番外編 98年ブルマJC (エッチなポーズ連続のエロダンスを強制される哀れな娘達)
https://vuluma.hatenablog.com/entry/erodancejcshuchi
↑
チンポがシコシコする、とはこういう意味だ!
875デフォルトの名無しさん
2020/05/27(水) 09:01:15.03ID:HP83GDUW Trieって使うべき?
876デフォルトの名無しさん
2020/06/11(木) 11:31:35.31ID:UByG3nqa >>859
BLEU自体も微妙な評価尺度なのにね
BLEU自体も微妙な評価尺度なのにね
877デフォルトの名無しさん
2020/06/11(木) 12:20:51.61ID:+wWlTHOo 問題がないわけじゃないけど
指標としてはいいんじゃない?
指標としてはいいんじゃない?
878デフォルトの名無しさん
2020/06/26(金) 05:35:39.03ID:VOVj4JeL パラレルコーパスって
ラベル付きデータって言えるの?
ラベル付きデータって言えるの?
879デフォルトの名無しさん
2020/07/06(月) 20:51:10.99ID:ZWivtJZu MeCabの処理のデモを提供するいくつかのウェブのページで、
「複合名詞」とか「サ変動詞」とか、デフォではないと思われる要素を散見するのですが、
これって自分でカスタムなロジックを入れて作ってる、で正解ですかね?
大雑把に、名詞が連続したら複合名詞にするとか、「名詞+する」をまとめるとか。
それともそういうのも処理できるバージョンがあったりします?
「複合名詞」とか「サ変動詞」とか、デフォではないと思われる要素を散見するのですが、
これって自分でカスタムなロジックを入れて作ってる、で正解ですかね?
大雑把に、名詞が連続したら複合名詞にするとか、「名詞+する」をまとめるとか。
それともそういうのも処理できるバージョンがあったりします?
880デフォルトの名無しさん
2020/07/06(月) 21:06:46.82ID:m8//1Mqt デフォでしょ
881デフォルトの名無しさん
2020/07/07(火) 01:56:21.86ID:BRU3yOrf >>880
そうですか。例えば「形態素解析」を処理すると一般的には|形態|素|解析|か
|形態素|解析|と処理されます(辞書によります)。よね?
これを|形態素解析|と一語に処理してほしい場合にどうしたらいいのかと。
ちなみに mecab-ipadic-NEologd を使ったら|形態素解析|と一語になりましたが
辞書のサイズが1.1GBですか。これがロジックで済むなら大きな辞書を使わずに
同様の処理が可能なのかなと。
そうですか。例えば「形態素解析」を処理すると一般的には|形態|素|解析|か
|形態素|解析|と処理されます(辞書によります)。よね?
これを|形態素解析|と一語に処理してほしい場合にどうしたらいいのかと。
ちなみに mecab-ipadic-NEologd を使ったら|形態素解析|と一語になりましたが
辞書のサイズが1.1GBですか。これがロジックで済むなら大きな辞書を使わずに
同様の処理が可能なのかなと。
882デフォルトの名無しさん
2020/07/07(火) 03:19:09.63ID:gHJLD7dX ロジックですまないから辞書にしてんでしょ
こねくり回した sentcepiece より random を加えた bpe の方が良くて草
こねくり回した sentcepiece より random を加えた bpe の方が良くて草
883デフォルトの名無しさん
2020/07/07(火) 08:32:40.79ID:E7Fo8N7p884デフォルトの名無しさん
2020/07/07(火) 08:44:19.61ID:6CuCzitb そっか、二百億円と書く以外に2百億円と書く場合もありますね。
NEologdでも後者は駄目っぽいです。
NEologdでも後者は駄目っぽいです。
885デフォルトの名無しさん
2020/07/07(火) 08:50:36.93ID:6CuCzitb あとサ変動詞(〇〇する)、も「〇〇」と「する」をまとめたかったり。
〇〇「を」する という言い方もたまにするので微妙。
〇〇「を」する という言い方もたまにするので微妙。
886デフォルトの名無しさん
2020/07/07(火) 16:21:30.75ID:gKTXd2VQ 489 名無し三等兵 sage 2020/07/07(火) 13:32:25.30 ID:VR0moFYQ
やっぱり珍カスの別人格じゃんチンボ脳www
ケツ蹴るぞとか言われたら発狂して(でもチビるほど怖いから)別のキチガイ人格でレスして勝った気になるマジキチガイ、
それが珍カス
やっぱり珍カスの別人格じゃんチンボ脳www
ケツ蹴るぞとか言われたら発狂して(でもチビるほど怖いから)別のキチガイ人格でレスして勝った気になるマジキチガイ、
それが珍カス
887デフォルトの名無しさん
2020/07/07(火) 16:25:31.33ID:092JXqIf どうしたん
字繰りの練習か?
字繰りの練習か?
888デフォルトの名無しさん
2020/07/08(水) 09:54:53.62ID:15dYshT+ MeCabのC++ APIを使ってみようかと思うのですが。taggerでnodeを作って。
品詞はnode->featureの値のカンマ区切りを自分でパースしてゲットするので正解?
nodeに品詞の値の要素があってもいいのではと思ったり。
元のテキスト上のオフセットとノードの関係を知りたい場合、node->surfaceが元の
テキストのポインター? バイトオフセットを計算する必要があると。
UTF-16で使いた場合、MeCabってUTF-16でセットアップできるんですかね。それとも
UTF-8でセットアップして、プログラム上で毎回文字コード変換?
などという疑問が早速あるのですが、皆さんいかがしてますでしょう。
個人的にはJavaのBreakIteratorのような使い勝手が欲しいのですが...
品詞はnode->featureの値のカンマ区切りを自分でパースしてゲットするので正解?
nodeに品詞の値の要素があってもいいのではと思ったり。
元のテキスト上のオフセットとノードの関係を知りたい場合、node->surfaceが元の
テキストのポインター? バイトオフセットを計算する必要があると。
UTF-16で使いた場合、MeCabってUTF-16でセットアップできるんですかね。それとも
UTF-8でセットアップして、プログラム上で毎回文字コード変換?
などという疑問が早速あるのですが、皆さんいかがしてますでしょう。
個人的にはJavaのBreakIteratorのような使い勝手が欲しいのですが...
889デフォルトの名無しさん
2020/07/08(水) 10:00:05.70ID:hADFKHgu890デフォルトの名無しさん
2020/07/08(水) 10:03:49.95ID:hADFKHgu891デフォルトの名無しさん
2020/07/08(水) 10:05:02.57ID:DqItxZMn goやらrustがあるのに?
しかもコマンドラインでやればいいようなことしかしてないくせに?
しかもコマンドラインでやればいいようなことしかしてないくせに?
892デフォルトの名無しさん
2020/07/08(水) 15:46:13.33ID:DqItxZMn javaやpythonのポーティングもあったよね
きうてぃーもあるのに
きうてぃーもあるのに
893888
2020/07/08(水) 16:31:27.31ID:oN5ATRHi 皆さん一般的な使い方のリンクをありがとう。そのレベルは一応大丈夫なつもり。
MeCabのAPI、パース結果と元のテキスト上の位置との関連を見つけにくいような。
パース結果だけを(で)取り扱う、という立ち位置なのか。
JavaのBreakIteratorはイテレータだけでなく元のテキストのオフセットで結果を得る
メソッド等もあり、パース結果と元のテキストとの関連をより処理しやすい。
(>>888の最後に書いたのはそういう意味。言語自体のことではなく。)
うーんもしかして必要に応じて自分で少し作り足したりする必要があるのかな?
MeCabのAPI、パース結果と元のテキスト上の位置との関連を見つけにくいような。
パース結果だけを(で)取り扱う、という立ち位置なのか。
JavaのBreakIteratorはイテレータだけでなく元のテキストのオフセットで結果を得る
メソッド等もあり、パース結果と元のテキストとの関連をより処理しやすい。
(>>888の最後に書いたのはそういう意味。言語自体のことではなく。)
うーんもしかして必要に応じて自分で少し作り足したりする必要があるのかな?
894デフォルトの名無しさん
2020/07/08(水) 16:38:43.55ID:oN5ATRHi ちなみにJava APIはNode.getSurface()がStringを返してくるのでC++ APIとは違い
元のテキスト上のオフセットはわからないのではないか、という。
(まさかStringに対してポインタ演算みたいなことはしないですよね?)
これも、オフセットが必要な使い方はするな、という立ち位置なのかもしれんけど。
元のテキスト上のオフセットはわからないのではないか、という。
(まさかStringに対してポインタ演算みたいなことはしないですよね?)
これも、オフセットが必要な使い方はするな、という立ち位置なのかもしれんけど。
895デフォルトの名無しさん
2020/07/08(水) 17:08:30.52ID:oN5ATRHi Java APIではNode.getLength()が要素のバイト長を返してくるようで(例えばUTF-8とか)。
しかしJavaで文字処理してるときにUTF-8のバイト長を教えられても、って感じはする。
ま、Node.getSurface()がStringだからそのlength()でいいんだろうけど。
Javaだけで使うならMeCab本体のエンコーディングはUTF-16の方がうれしいような。可能?
一方MeCab本体をUTF-8でインストールしてもJava API自体は動いているわけだから文字
エンコーディングのマッチングとか、何かしてるのかな?
しかしJavaで文字処理してるときにUTF-8のバイト長を教えられても、って感じはする。
ま、Node.getSurface()がStringだからそのlength()でいいんだろうけど。
Javaだけで使うならMeCab本体のエンコーディングはUTF-16の方がうれしいような。可能?
一方MeCab本体をUTF-8でインストールしてもJava API自体は動いているわけだから文字
エンコーディングのマッチングとか、何かしてるのかな?
896デフォルトの名無しさん
2020/07/08(水) 20:35:44.70ID:k8Tc16Vc 511 名無し三等兵 sage 2020/07/07(火) 21:24:00.41 ID:e+um6EKL
カスミンが「「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!」に霞ケ浦の回答をするのは何時なりや?
全世界は知らんと欲す
カスミンが「「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!」に霞ケ浦の回答をするのは何時なりや?
全世界は知らんと欲す
897デフォルトの名無しさん
2020/07/09(木) 04:21:03.81ID:Igq+wx0J そんなことしなくても
コマンドラインでできそう(笑)
コマンドラインでできそう(笑)
898デフォルトの名無しさん
2020/07/09(木) 08:09:13.69ID:TKLTGhB7899デフォルトの名無しさん
2020/07/09(木) 09:12:00.22ID:vrNDocOm AIがプロファイリングするとJava使えっていう結論が出た
900デフォルトの名無しさん
2020/07/09(木) 16:23:26.64ID:nvkXrAxh だからコマンドラインでできそうだなあってこと(笑)
901デフォルトの名無しさん
2020/07/09(木) 18:03:29.48ID:TKLTGhB7 もうお前らどうでもいい。
MeCabの、自分にとって使いにくい部分はアダプタを書いてイテレータのクラスに
繋げた。今のところ若干無理矢理感があるがインターフェース自体はおk。
そういえば思い出した。
昔、Mac OS Xのライブラリを眺めていると何故かMeCabがあり、遊んでみたら何故か
辞書がUTF-16だった。
今になって全てわかった気がする。
MeCabの、自分にとって使いにくい部分はアダプタを書いてイテレータのクラスに
繋げた。今のところ若干無理矢理感があるがインターフェース自体はおk。
そういえば思い出した。
昔、Mac OS Xのライブラリを眺めていると何故かMeCabがあり、遊んでみたら何故か
辞書がUTF-16だった。
今になって全てわかった気がする。
902デフォルトの名無しさん
2020/07/09(木) 20:01:48.96ID:nvkXrAxh mecabで何すんの?(笑)
903デフォルトの名無しさん
2020/07/09(木) 21:25:21.99ID:KHuqFwsC 酢で和えるとおいしい
904デフォルトの名無しさん
2020/07/10(金) 10:50:45.15ID:gD4CX8ug テキストの処理で単語を処理単位にした方がいい場合がいろいろある。
ちなみにメヒビとかアオサとか割と好き。
しかしMeCab用の巨大辞書を某デバイスに突っ込むことは容認されるだろうか。
Text To Speechのファイルよりもでかかったらまずいか。
そういえばあれだってトークナイズとかしてるんだろうなあ。
ちなみにメヒビとかアオサとか割と好き。
しかしMeCab用の巨大辞書を某デバイスに突っ込むことは容認されるだろうか。
Text To Speechのファイルよりもでかかったらまずいか。
そういえばあれだってトークナイズとかしてるんだろうなあ。
905デフォルトの名無しさん
2020/07/10(金) 10:55:56.90ID:2/Ccitmb 読み上げ君とかは時々変な読み上げ方するが
MeCab使ってたらもうちょっとマシなんだろうか
MeCab使ってたらもうちょっとマシなんだろうか
906デフォルトの名無しさん
2020/07/10(金) 16:59:23.16ID:4InogVIm とりあえずMeCabの辞書って圧縮とかはかかってないっぽいかも。
squashfs上に置いたりしたら性能がどのくらい落ちるかな。
squashfs上に置いたりしたら性能がどのくらい落ちるかな。
907デフォルトの名無しさん
2020/07/18(土) 08:30:17.82ID:Iwhr9cjK 覚えたてか(笑)
908デフォルトの名無しさん
2020/07/18(土) 12:55:50.29ID:mNXnDrlR MecabはEUCやshift-jisが効率よいんですよ。
909デフォルトの名無しさん
2020/07/18(土) 13:46:55.67ID:csmyIL5D >>908
何の効率ですか? メモリ使用量? 処理速度?
今日び文字処理がUTF-16なAPIが少なくないので、連携して使うとするとMeCab側に
UTF-16のオプションがあると使いやすいのだが。
辞書は、UTF-8だと日本語が1文字3バイト使うのでやはりこちらもUTF-16だと
いいんじゃないかと。圧縮とかしてたら違ってくるけど。
何の効率ですか? メモリ使用量? 処理速度?
今日び文字処理がUTF-16なAPIが少なくないので、連携して使うとするとMeCab側に
UTF-16のオプションがあると使いやすいのだが。
辞書は、UTF-8だと日本語が1文字3バイト使うのでやはりこちらもUTF-16だと
いいんじゃないかと。圧縮とかしてたら違ってくるけど。
910デフォルトの名無しさん
2020/07/18(土) 14:44:43.40ID:Iwhr9cjK UTF 16なんて Java だけじゃない?
911デフォルトの名無しさん
2020/07/18(土) 19:55:51.11ID:OcCP0Pji というかJavaはでかいでしょw
Objective-CやSwiftのNSStringもUTF-16。
この時点で昨今のユーザー用デバイスの上は基本的にUTF-16ということであるw
C++にはchar16_tというUTF-16用のネイティブな型がある。
Objective-CやSwiftのNSStringもUTF-16。
この時点で昨今のユーザー用デバイスの上は基本的にUTF-16ということであるw
C++にはchar16_tというUTF-16用のネイティブな型がある。
912デフォルトの名無しさん
2020/07/18(土) 21:08:42.78ID:mNXnDrlR 仕組みを知らないレベルなら、上からモノを言わないほうが良いのだろうけど。
913デフォルトの名無しさん
2020/07/18(土) 21:32:00.36ID:Iwhr9cjK 古い情報で動いてる 新参だろ
914デフォルトの名無しさん
2020/07/19(日) 10:58:42.94ID:DFSJX5gq わざと煽るとレスが増える
わざと間違えるとレスが増える
味を覚えたら繰り返す
わざと間違えるとレスが増える
味を覚えたら繰り返す
915デフォルトの名無しさん
2020/07/19(日) 20:28:34.01ID:tfox/PaN 人をおちょくることにだけ長けた古参が集う、そんなスレ。
自分からは生産的なことは何一つできない。
ザ・老害。
自分からは生産的なことは何一つできない。
ザ・老害。
916デフォルトの名無しさん
2020/07/25(土) 19:09:18.22ID:gG3SN9py >例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。
当然ながら起きているときも、チンポがシコシコする!
風呂から出て体一杯に水を浴びながら竜哉は、この時始めて英子に対する心を決めた。裸の上半身にタオルをかけ、
離れに上ると彼は障子の外から声を掛けた。
「英子さん」
部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。
その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。
●これが衝撃の「障子破り」シーンだ! (石原慎太郎 『太陽の季節』 (新潮文庫) より)
>その瞬間、竜哉は体中が引き締まるような快感を感じた
チンポがシコシコする≠勃起、つまりそれはただチンポが勃起するのではなくて、
「体中が引き締まるような快感を感じた」ということなのである!!
当然ながら起きているときも、チンポがシコシコする!
風呂から出て体一杯に水を浴びながら竜哉は、この時始めて英子に対する心を決めた。裸の上半身にタオルをかけ、
離れに上ると彼は障子の外から声を掛けた。
「英子さん」
部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。
その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。
●これが衝撃の「障子破り」シーンだ! (石原慎太郎 『太陽の季節』 (新潮文庫) より)
>その瞬間、竜哉は体中が引き締まるような快感を感じた
チンポがシコシコする≠勃起、つまりそれはただチンポが勃起するのではなくて、
「体中が引き締まるような快感を感じた」ということなのである!!
917デフォルトの名無しさん
2020/07/25(土) 20:58:49.42ID:IpZkqo3u こんな過疎スレ、言うほど古参なんか集まってくる?(笑)
918デフォルトの名無しさん
2020/07/26(日) 01:26:45.61ID:3Ai910F/ mecab + ipadic、「10月」 とかの場合に「月」は助数詞として扱われないのな。
年や日は助数詞になるのに。月は数詞扱いじゃ駄目なん?
年や日は助数詞になるのに。月は数詞扱いじゃ駄目なん?
919デフォルトの名無しさん
2020/07/28(火) 00:18:25.11ID:D1wUMbm4 鬼滅の刃に出てくるやつ -> それは十二「鬼」月
でもこれって十二の鬼月(ただこの場合普通は「おにづき」)なのか、
十二鬼の月なのか。助数詞が変わってくる。
でもこれって十二の鬼月(ただこの場合普通は「おにづき」)なのか、
十二鬼の月なのか。助数詞が変わってくる。
920デフォルトの名無しさん
2020/07/31(金) 19:48:50.98ID:0cmnY8cb >>919
鬼月ってのはそういう苗字があるみたいね。確かに作者がどこかで「すべて実在する名前
から取ってる」みたいなことを言ってたか。
しかし、mecab-ipadic-neologd さんだと全て対応済みっぽい。
$ echo 十二鬼月 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
十二 名詞,固有名詞,人名,姓,*,*,十二,ジュウニ,ジューニ
鬼月 名詞,固有名詞,人名,姓,*,*,鬼月,キヅキ,キズキ
EOS
echo 竈門炭治郎 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
竈門炭治郎 名詞,固有名詞,人名,一般,*,*,竈門炭治郎,カマドタンジロウ,カマドタンジロー
EOS
echo 吾峠呼世晴 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
吾峠呼世晴 名詞,固有名詞,人名,一般,*,*,吾峠呼世晴,ゴトウゲコヨハル,ゴトーゲコヨハル
EOS
鬼月ってのはそういう苗字があるみたいね。確かに作者がどこかで「すべて実在する名前
から取ってる」みたいなことを言ってたか。
しかし、mecab-ipadic-neologd さんだと全て対応済みっぽい。
$ echo 十二鬼月 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
十二 名詞,固有名詞,人名,姓,*,*,十二,ジュウニ,ジューニ
鬼月 名詞,固有名詞,人名,姓,*,*,鬼月,キヅキ,キズキ
EOS
echo 竈門炭治郎 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
竈門炭治郎 名詞,固有名詞,人名,一般,*,*,竈門炭治郎,カマドタンジロウ,カマドタンジロー
EOS
echo 吾峠呼世晴 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
吾峠呼世晴 名詞,固有名詞,人名,一般,*,*,吾峠呼世晴,ゴトウゲコヨハル,ゴトーゲコヨハル
EOS
921デフォルトの名無しさん
2020/08/01(土) 22:04:57.45ID:rpF69vZ/ 人の名前はどうにもならないな
新しい名前はどんどん出てくるし
ラノベとかだと現実にあり得ない名前とか
普通に出てくる
新しい名前はどんどん出てくるし
ラノベとかだと現実にあり得ない名前とか
普通に出てくる
922デフォルトの名無しさん
2020/08/02(日) 20:20:25.58ID:63NiyH+f 結局辞書をメンテすれば済む話じゃない?
923デフォルトの名無しさん
2020/08/02(日) 20:55:22.51ID:rl9xr/mh >>845
マスクの着用、手指のアルコール消毒に協力すればいいんだね。分かった!
マスクの着用、手指のアルコール消毒に協力すればいいんだね。分かった!
924デフォルトの名無しさん
2020/08/04(火) 22:14:21.47ID:uMd91kkd トランスフォーマーの Self Attention ってニューラルネットワークなの?
925デフォルトの名無しさん
2020/08/06(木) 16:07:21.15ID:UxgwWB45 >>921
ニューラルネットとかを使って文脈で「この位置に来るのは人名(少なくとも名詞)」
みたいのを精度高く判断できればいいんじゃないかと思ったり。
文脈がない(短い)場合は駄目なわけだけど。
あと、人間が文章を読んでいるときは「これ人の名前っぽい」って思う要素があるよね。
必ずしも文脈(だけ)じゃなくて字面も影響してるかなこれは。
ニューラルネットとかを使って文脈で「この位置に来るのは人名(少なくとも名詞)」
みたいのを精度高く判断できればいいんじゃないかと思ったり。
文脈がない(短い)場合は駄目なわけだけど。
あと、人間が文章を読んでいるときは「これ人の名前っぽい」って思う要素があるよね。
必ずしも文脈(だけ)じゃなくて字面も影響してるかなこれは。
926デフォルトの名無しさん
2020/08/06(木) 16:17:31.91ID:IAzz78X7 先達も同じ発想だった
927デフォルトの名無しさん
2020/08/06(木) 16:31:45.13ID:NudvYbs2928デフォルトの名無しさん
2020/08/07(金) 00:51:58.42ID:DGuyAjIv >>926
ですよねw でも、ニューラルネットの学習規模をもっとでかくするとか...
で、巨大な辞書を利用することになるのかw
とりあえず、気に入らない分かち結果だけ自前のコードで修正して使うことにしました。
ですよねw でも、ニューラルネットの学習規模をもっとでかくするとか...
で、巨大な辞書を利用することになるのかw
とりあえず、気に入らない分かち結果だけ自前のコードで修正して使うことにしました。
929デフォルトの名無しさん
2020/08/11(火) 20:01:52.86ID:aCyqldbU 2020年07月29日 08時00分ソフトウェア
自然なブログを書いてしまうほど超高精度な言語モデル「GPT-3」はどのように言葉を紡いでいるのか?
https://gigazine.net/news/20200729-how-gpt-3-work/
自然なブログを書いてしまうほど超高精度な言語モデル「GPT-3」はどのように言葉を紡いでいるのか?
https://gigazine.net/news/20200729-how-gpt-3-work/
930デフォルトの名無しさん
2020/08/12(水) 11:16:30.67ID:NP05B2hK 657 仕様書無しさん [sage] 2020/08/12(水) 11:11:53.67 ID:
>>655
ちんぽをシコシコするというのは主体が別に存在する(おそらく右手であろう)
しかし、ちんぼがシコシコするというのはちんぽさんが主体となって別の輪状、もしくは固定された箇所に向かって
往復運動をすることを言う
そしてそれはシコシコと形容される範囲内におけるような物体や部位である必要がある
つまり、日本語でいうところのチンポがシコシコするというのは文法上は正しい
しかしである
ちんぽは主語になってよいものかという問題が残る
ちんぽは思考できるのか、主体的な存在であるのかという疑問んである
我々はちんぽを自由自在に動かす事はできない
「勃つんだ!ジョー!!」などと呼びかけた人もいるであろう
ちんぽは人の付属物であると同時に1本の主体的な存在でもある
思考や意識といったものはないかもしれないし他動的な刺激により、また体調により変化を兆す。
つまり、チンポがシコシコするというのはチンポが主体的な存在かどうかが問われているのであり
勃起に至る過程からそれはまさに肯定されるべきなのである
>>655
ちんぽをシコシコするというのは主体が別に存在する(おそらく右手であろう)
しかし、ちんぼがシコシコするというのはちんぽさんが主体となって別の輪状、もしくは固定された箇所に向かって
往復運動をすることを言う
そしてそれはシコシコと形容される範囲内におけるような物体や部位である必要がある
つまり、日本語でいうところのチンポがシコシコするというのは文法上は正しい
しかしである
ちんぽは主語になってよいものかという問題が残る
ちんぽは思考できるのか、主体的な存在であるのかという疑問んである
我々はちんぽを自由自在に動かす事はできない
「勃つんだ!ジョー!!」などと呼びかけた人もいるであろう
ちんぽは人の付属物であると同時に1本の主体的な存在でもある
思考や意識といったものはないかもしれないし他動的な刺激により、また体調により変化を兆す。
つまり、チンポがシコシコするというのはチンポが主体的な存在かどうかが問われているのであり
勃起に至る過程からそれはまさに肯定されるべきなのである
931デフォルトの名無しさん
2020/08/12(水) 19:17:07.69ID:NP05B2hK 『過信』
鳥塚 力(56)
世界一になりたくて人生を無駄にした。
バンドで野心をもって人生を無駄にした。
詩の天才を信じて人生を無駄にした。
母の私への願いは
平凡な家庭を持ち、正しき仕事をすること。
母の願いを裏切って、孤独のまま
もう平凡にも戻れない。
http://blog.esuteru.com/archives/9558461.html
鳥塚 力(56)
世界一になりたくて人生を無駄にした。
バンドで野心をもって人生を無駄にした。
詩の天才を信じて人生を無駄にした。
母の私への願いは
平凡な家庭を持ち、正しき仕事をすること。
母の願いを裏切って、孤独のまま
もう平凡にも戻れない。
http://blog.esuteru.com/archives/9558461.html
932デフォルトの名無しさん
2020/08/13(木) 21:43:13.46ID:P0whfGXq 意見が異なる人間を、自分たちの縄張りやコミュニティから、
はじき出そうと必死な人がいる。はじき出されないよう、
必死に気を配りまくり、意見を言わずに黙り込んでいる人もいる。
著名人であっても、ファンにそっぽを向かれないよう、
自分に貼られたレッテルから外れた意見を言わないよう、
振舞っている人を僕は見かける。
心の底から、気の毒だと思う。
そんなコミュニティにいて、楽しいのだろうか?
「はじき出してやろう」「はじき出されないようにしよう」
と必死な人たちに、何としてでも好かれたいのか?
僕は、まっぴらだ。
一緒にいて楽しくない人たちに好かれようと努力すると、
自分を見失ってしまう。
人生において、自分を捨ててはいけない。絶対にいけない。
「はじき出してやろう」としてくる人など、遠慮なく捨ててほしいと思う。
<堀江貴文「捨て本」67頁>
はじき出そうと必死な人がいる。はじき出されないよう、
必死に気を配りまくり、意見を言わずに黙り込んでいる人もいる。
著名人であっても、ファンにそっぽを向かれないよう、
自分に貼られたレッテルから外れた意見を言わないよう、
振舞っている人を僕は見かける。
心の底から、気の毒だと思う。
そんなコミュニティにいて、楽しいのだろうか?
「はじき出してやろう」「はじき出されないようにしよう」
と必死な人たちに、何としてでも好かれたいのか?
僕は、まっぴらだ。
一緒にいて楽しくない人たちに好かれようと努力すると、
自分を見失ってしまう。
人生において、自分を捨ててはいけない。絶対にいけない。
「はじき出してやろう」としてくる人など、遠慮なく捨ててほしいと思う。
<堀江貴文「捨て本」67頁>
933デフォルトの名無しさん
2020/08/13(木) 22:21:50.44ID:P0whfGXq 939 優しい名無しさん sage 2020/08/13(木) 11:29:23.57 ID:H3nfnQ6W
チンポ【が】シコシコするなんて言ってる奴聞いた事ねーよ
どこの方言?ダサww
チンポ【が】シコシコするなんて言ってる奴聞いた事ねーよ
どこの方言?ダサww
934デフォルトの名無しさん
2020/08/14(金) 07:45:58.69ID:Wo0gSBUj 314 太上天君 (ワッチョイ 9967-E2Bm) 2020/08/13(木) 18:33:48.27 ID:UPcr7eZE0
>>312
ぬしゃよ、はいぎぃ〜っぬしゃあ「シコシコする」の定義次第じゃな。
せんずりをこくことを「シコシコする」というのなら間違いじゃ。
センズリはチンコの自律運動ではなく、チンコの所有者の行為だからな。
「心臓がドキドキする」は主語である心臓自体の自律運動だから正しいのじゃw
はふんはふんおふんおふん。
>>312
ぬしゃよ、はいぎぃ〜っぬしゃあ「シコシコする」の定義次第じゃな。
せんずりをこくことを「シコシコする」というのなら間違いじゃ。
センズリはチンコの自律運動ではなく、チンコの所有者の行為だからな。
「心臓がドキドキする」は主語である心臓自体の自律運動だから正しいのじゃw
はふんはふんおふんおふん。
935デフォルトの名無しさん
2020/08/14(金) 14:22:38.34ID:/7ySu5xk >>849
>NLPの不完全性からの問題提起もオブジェクト指向の集約も夢精の例もほぼ意味がなく、
1: 以下、名無しにかわりましてVIPがお送りします 2013/03/31(日) 00:08:38.70 ID:GVdw15xL0
40秒くらいから着替えだが全体的にキチガイじみてる
http://majikichi.com/archives/7808383.html
>NLPの不完全性からの問題提起もオブジェクト指向の集約も夢精の例もほぼ意味がなく、
1: 以下、名無しにかわりましてVIPがお送りします 2013/03/31(日) 00:08:38.70 ID:GVdw15xL0
40秒くらいから着替えだが全体的にキチガイじみてる
http://majikichi.com/archives/7808383.html
936デフォルトの名無しさん
2020/08/17(月) 12:27:17.09ID:soYdDlhA 超高精度な文章生成ツール「GPT-3」は、“人間にしかできないこと”の定義を根本から揺るがした
https://wired.jp/2020/08/17/ai-text-generator-gpt-3-learning-language-fitfully/
https://wired.jp/2020/08/17/ai-text-generator-gpt-3-learning-language-fitfully/
937デフォルトの名無しさん
2020/08/17(月) 12:40:36.79ID:wiEf4b6A でもこれ自然言語で3桁の計算もできないんだよ(笑)
938デフォルトの名無しさん
2020/08/17(月) 12:46:34.32ID:6yBIhPPf 2かける3
を
3かける2
って書くと間違いにされるんだよな
を
3かける2
って書くと間違いにされるんだよな
939デフォルトの名無しさん
2020/08/18(火) 10:04:44.59ID:Fd7uJYBs あんだけ膨大なパラメータがあっても
知性らしきものの欠片は見つかる程度で
ほとんど進展なし、ってのもねえ
知性らしきものの欠片は見つかる程度で
ほとんど進展なし、ってのもねえ
940デフォルトの名無しさん
2020/08/18(火) 10:12:48.95ID:TScP2Zja 冬の時期到来不可避
941デフォルトの名無しさん
2020/08/18(火) 12:38:13.52ID:1N2TKAu+ > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw
日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw
日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
942デフォルトの名無しさん
2020/08/18(火) 12:46:19.65ID:wz1BB6CR 言語モデルは言語知識に特化すべきで
実世界モデルは別途組み込めるようにならないとダメだよね
よく設計されたタスクが出てこないと
そのあたりの技術もなかなか進展しないね
実世界モデルは別途組み込めるようにならないとダメだよね
よく設計されたタスクが出てこないと
そのあたりの技術もなかなか進展しないね
943デフォルトの名無しさん
2020/08/20(木) 08:17:13.79ID:ztQrzX/E 規則ベースって限界があるじゃん?
でもなんとかして論理を組み込まないといけないんだよね
どうすればいいんだろう。。。
でもなんとかして論理を組み込まないといけないんだよね
どうすればいいんだろう。。。
944デフォルトの名無しさん
2020/08/23(日) 20:42:39.62ID:qp6BB2Af945デフォルトの名無しさん
2020/08/26(水) 10:04:49.29ID:4GZ9k+0t 540 デフォルトの名無しさん 2020/08/26(水) 10:02:48.02 ID:NYX2/iU2
// おしっこルーチン
俺.パンツを脱ぐ()
while (俺.オシッコ残量 != 0) {
俺.オシッコ残量 -= 俺.チンポ.オシッコを出す()
}
do {
俺.チンポフリフリする()
} while(count < MAX && 俺.残尿感())
俺.パンツを履く()
// おしっこルーチン
俺.パンツを脱ぐ()
while (俺.オシッコ残量 != 0) {
俺.オシッコ残量 -= 俺.チンポ.オシッコを出す()
}
do {
俺.チンポフリフリする()
} while(count < MAX && 俺.残尿感())
俺.パンツを履く()
946デフォルトの名無しさん
2020/08/26(水) 20:02:38.07ID:Pf4G7zlI 2013年07月29日 21時00分52秒
怠け者で愚かな人間ほど優秀なプログラマーに向いている理由
https://gigazine.net/amp/20130729-reasons-good-programmer-must-be-lazy-and-dumb/
怠け者で愚かな人間ほど優秀なプログラマーに向いている理由
https://gigazine.net/amp/20130729-reasons-good-programmer-must-be-lazy-and-dumb/
947デフォルトの名無しさん
2020/08/27(木) 19:42:56.65ID:OAHLXlr3 多重継承は曖昧だというが、自然言語処理はその曖昧さが大切になる。チンポは随意筋であり不随意筋である。
最終的に,クラス階層は最上位クラスを含めた
最大8 階層から構成され,「伝統的な日本の絵画」
に属する用語に対応する 55 クラスと解説文中か
ら抽出した139 クラスが配置された。ただし,そ
のうち 32 クラスが複数の上位クラスをもつとい
う多重継承が示された。例えば,「ngyc:絵巻物」
は「ngyc:伝統的な日本の絵画」と,「ngyc:表具の
形式」の下位クラスである「ngyc:巻子」の 2 つの
クラスを継承する(図 2)。こうした多重継承は,
本質属性をもつ基本概念と機能を表すロール概念
を分離することで,基本概念による属性継承に限
った階層関係に変更するという考え方もあり 10),
「ngyc:伝統的な日本の絵画」がロール概念で,
「ngyc:表具の形式」が基本概念と捉えることもで
きる。しかし,本研究ではテキストからの情報抽
出に即して配置し,多重継承を許容した階層を導
き出した。
http://www.mslis.jp/am2019yoko/05_kobayashi.pdf
随意筋 不随意筋
↖ ↗
チンポ
最終的に,クラス階層は最上位クラスを含めた
最大8 階層から構成され,「伝統的な日本の絵画」
に属する用語に対応する 55 クラスと解説文中か
ら抽出した139 クラスが配置された。ただし,そ
のうち 32 クラスが複数の上位クラスをもつとい
う多重継承が示された。例えば,「ngyc:絵巻物」
は「ngyc:伝統的な日本の絵画」と,「ngyc:表具の
形式」の下位クラスである「ngyc:巻子」の 2 つの
クラスを継承する(図 2)。こうした多重継承は,
本質属性をもつ基本概念と機能を表すロール概念
を分離することで,基本概念による属性継承に限
った階層関係に変更するという考え方もあり 10),
「ngyc:伝統的な日本の絵画」がロール概念で,
「ngyc:表具の形式」が基本概念と捉えることもで
きる。しかし,本研究ではテキストからの情報抽
出に即して配置し,多重継承を許容した階層を導
き出した。
http://www.mslis.jp/am2019yoko/05_kobayashi.pdf
随意筋 不随意筋
↖ ↗
チンポ
948デフォルトの名無しさん
2020/08/27(木) 20:38:08.18ID:mPgiETdu 新井紀子だっけ?
949デフォルトの名無しさん
2020/09/04(金) 10:21:25.57ID:3K6ISx4z Janomeを使って何か自然言語処理の練習したいんだけど、良い題材ない?
950デフォルトの名無しさん
2020/09/04(金) 13:23:52.05ID:lHqiid/j タガーだっけ?janomeって
951デフォルトの名無しさん
2020/09/04(金) 13:31:33.06ID:IxxfcH8z >>949
5chのテキストをパースして自動的に分類する
5chのテキストをパースして自動的に分類する
レス数が950を超えています。1000を超えると書き込みができなくなります。
ニュース
- 中国国営メディア「沖縄は日本ではない」… ★2 [BFU★]
- 中国国営メディア「沖縄は日本ではない」… ★3 [BFU★]
- 高市政権にパイプ役不在…日中高まる緊張 公明党の連立離脱影響、自民内にも懸念「自分でまいた種は自分で刈り取ってもらわないと」 [ぐれ★]
- 小野田氏、”中国経済への依存“に警戒感 高市首相の国会答弁巡り [煮卵★]
- 【サッカー】独占入手 最年長JリーガーにW不倫疑惑 『お風呂覗きたいんですが笑』LINE流出も… 慰謝料トラブルを本人に直撃 [冬月記者★]
- 【こんなの初めて…】民泊には既にキャンセルも 中国の渡航自粛で [ぐれ★]
- 【なぜ】安倍晋三の評価、地味に上がってる模様… [343591364]
- 【画像】セクシー女優・天沢りんさん「お休み頂いてた半年間でこんな体になりました🪽🤍」👉予想通りの展開に [242521385]
- 中国国営放送「日本は琉球をただちに中国に返還せよ」 キタ━━━━(゚∀゚)━━━━!!!!! [314039747]
- とうすこ🏡愛され絵文字♡🤥👊😅👊👶♡
- 自民「高市の一言でこれまで積み上げてきた関係が駄目になる。言葉の重みを分かっていない。自分でまいた種は自分で刈り取ってもらう」 [256556981]
- 【高市悲報】アメリカ戦争省「あのさ、何回シミュレートしてもわーくに中国に負けちゃうんだよね🤗」 [359965264]
