このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
探検
自然言語処理スレッド その5
レス数が950を超えています。1000を超えると書き込みができなくなります。
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
885デフォルトの名無しさん
2020/07/07(火) 08:50:36.93ID:6CuCzitb あとサ変動詞(〇〇する)、も「〇〇」と「する」をまとめたかったり。
〇〇「を」する という言い方もたまにするので微妙。
〇〇「を」する という言い方もたまにするので微妙。
886デフォルトの名無しさん
2020/07/07(火) 16:21:30.75ID:gKTXd2VQ 489 名無し三等兵 sage 2020/07/07(火) 13:32:25.30 ID:VR0moFYQ
やっぱり珍カスの別人格じゃんチンボ脳www
ケツ蹴るぞとか言われたら発狂して(でもチビるほど怖いから)別のキチガイ人格でレスして勝った気になるマジキチガイ、
それが珍カス
やっぱり珍カスの別人格じゃんチンボ脳www
ケツ蹴るぞとか言われたら発狂して(でもチビるほど怖いから)別のキチガイ人格でレスして勝った気になるマジキチガイ、
それが珍カス
887デフォルトの名無しさん
2020/07/07(火) 16:25:31.33ID:092JXqIf どうしたん
字繰りの練習か?
字繰りの練習か?
888デフォルトの名無しさん
2020/07/08(水) 09:54:53.62ID:15dYshT+ MeCabのC++ APIを使ってみようかと思うのですが。taggerでnodeを作って。
品詞はnode->featureの値のカンマ区切りを自分でパースしてゲットするので正解?
nodeに品詞の値の要素があってもいいのではと思ったり。
元のテキスト上のオフセットとノードの関係を知りたい場合、node->surfaceが元の
テキストのポインター? バイトオフセットを計算する必要があると。
UTF-16で使いた場合、MeCabってUTF-16でセットアップできるんですかね。それとも
UTF-8でセットアップして、プログラム上で毎回文字コード変換?
などという疑問が早速あるのですが、皆さんいかがしてますでしょう。
個人的にはJavaのBreakIteratorのような使い勝手が欲しいのですが...
品詞はnode->featureの値のカンマ区切りを自分でパースしてゲットするので正解?
nodeに品詞の値の要素があってもいいのではと思ったり。
元のテキスト上のオフセットとノードの関係を知りたい場合、node->surfaceが元の
テキストのポインター? バイトオフセットを計算する必要があると。
UTF-16で使いた場合、MeCabってUTF-16でセットアップできるんですかね。それとも
UTF-8でセットアップして、プログラム上で毎回文字コード変換?
などという疑問が早速あるのですが、皆さんいかがしてますでしょう。
個人的にはJavaのBreakIteratorのような使い勝手が欲しいのですが...
889デフォルトの名無しさん
2020/07/08(水) 10:00:05.70ID:hADFKHgu890デフォルトの名無しさん
2020/07/08(水) 10:03:49.95ID:hADFKHgu891デフォルトの名無しさん
2020/07/08(水) 10:05:02.57ID:DqItxZMn goやらrustがあるのに?
しかもコマンドラインでやればいいようなことしかしてないくせに?
しかもコマンドラインでやればいいようなことしかしてないくせに?
892デフォルトの名無しさん
2020/07/08(水) 15:46:13.33ID:DqItxZMn javaやpythonのポーティングもあったよね
きうてぃーもあるのに
きうてぃーもあるのに
893888
2020/07/08(水) 16:31:27.31ID:oN5ATRHi 皆さん一般的な使い方のリンクをありがとう。そのレベルは一応大丈夫なつもり。
MeCabのAPI、パース結果と元のテキスト上の位置との関連を見つけにくいような。
パース結果だけを(で)取り扱う、という立ち位置なのか。
JavaのBreakIteratorはイテレータだけでなく元のテキストのオフセットで結果を得る
メソッド等もあり、パース結果と元のテキストとの関連をより処理しやすい。
(>>888の最後に書いたのはそういう意味。言語自体のことではなく。)
うーんもしかして必要に応じて自分で少し作り足したりする必要があるのかな?
MeCabのAPI、パース結果と元のテキスト上の位置との関連を見つけにくいような。
パース結果だけを(で)取り扱う、という立ち位置なのか。
JavaのBreakIteratorはイテレータだけでなく元のテキストのオフセットで結果を得る
メソッド等もあり、パース結果と元のテキストとの関連をより処理しやすい。
(>>888の最後に書いたのはそういう意味。言語自体のことではなく。)
うーんもしかして必要に応じて自分で少し作り足したりする必要があるのかな?
894デフォルトの名無しさん
2020/07/08(水) 16:38:43.55ID:oN5ATRHi ちなみにJava APIはNode.getSurface()がStringを返してくるのでC++ APIとは違い
元のテキスト上のオフセットはわからないのではないか、という。
(まさかStringに対してポインタ演算みたいなことはしないですよね?)
これも、オフセットが必要な使い方はするな、という立ち位置なのかもしれんけど。
元のテキスト上のオフセットはわからないのではないか、という。
(まさかStringに対してポインタ演算みたいなことはしないですよね?)
これも、オフセットが必要な使い方はするな、という立ち位置なのかもしれんけど。
895デフォルトの名無しさん
2020/07/08(水) 17:08:30.52ID:oN5ATRHi Java APIではNode.getLength()が要素のバイト長を返してくるようで(例えばUTF-8とか)。
しかしJavaで文字処理してるときにUTF-8のバイト長を教えられても、って感じはする。
ま、Node.getSurface()がStringだからそのlength()でいいんだろうけど。
Javaだけで使うならMeCab本体のエンコーディングはUTF-16の方がうれしいような。可能?
一方MeCab本体をUTF-8でインストールしてもJava API自体は動いているわけだから文字
エンコーディングのマッチングとか、何かしてるのかな?
しかしJavaで文字処理してるときにUTF-8のバイト長を教えられても、って感じはする。
ま、Node.getSurface()がStringだからそのlength()でいいんだろうけど。
Javaだけで使うならMeCab本体のエンコーディングはUTF-16の方がうれしいような。可能?
一方MeCab本体をUTF-8でインストールしてもJava API自体は動いているわけだから文字
エンコーディングのマッチングとか、何かしてるのかな?
896デフォルトの名無しさん
2020/07/08(水) 20:35:44.70ID:k8Tc16Vc 511 名無し三等兵 sage 2020/07/07(火) 21:24:00.41 ID:e+um6EKL
カスミンが「「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!」に霞ケ浦の回答をするのは何時なりや?
全世界は知らんと欲す
カスミンが「「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!」に霞ケ浦の回答をするのは何時なりや?
全世界は知らんと欲す
897デフォルトの名無しさん
2020/07/09(木) 04:21:03.81ID:Igq+wx0J そんなことしなくても
コマンドラインでできそう(笑)
コマンドラインでできそう(笑)
898デフォルトの名無しさん
2020/07/09(木) 08:09:13.69ID:TKLTGhB7899デフォルトの名無しさん
2020/07/09(木) 09:12:00.22ID:vrNDocOm AIがプロファイリングするとJava使えっていう結論が出た
900デフォルトの名無しさん
2020/07/09(木) 16:23:26.64ID:nvkXrAxh だからコマンドラインでできそうだなあってこと(笑)
901デフォルトの名無しさん
2020/07/09(木) 18:03:29.48ID:TKLTGhB7 もうお前らどうでもいい。
MeCabの、自分にとって使いにくい部分はアダプタを書いてイテレータのクラスに
繋げた。今のところ若干無理矢理感があるがインターフェース自体はおk。
そういえば思い出した。
昔、Mac OS Xのライブラリを眺めていると何故かMeCabがあり、遊んでみたら何故か
辞書がUTF-16だった。
今になって全てわかった気がする。
MeCabの、自分にとって使いにくい部分はアダプタを書いてイテレータのクラスに
繋げた。今のところ若干無理矢理感があるがインターフェース自体はおk。
そういえば思い出した。
昔、Mac OS Xのライブラリを眺めていると何故かMeCabがあり、遊んでみたら何故か
辞書がUTF-16だった。
今になって全てわかった気がする。
902デフォルトの名無しさん
2020/07/09(木) 20:01:48.96ID:nvkXrAxh mecabで何すんの?(笑)
903デフォルトの名無しさん
2020/07/09(木) 21:25:21.99ID:KHuqFwsC 酢で和えるとおいしい
904デフォルトの名無しさん
2020/07/10(金) 10:50:45.15ID:gD4CX8ug テキストの処理で単語を処理単位にした方がいい場合がいろいろある。
ちなみにメヒビとかアオサとか割と好き。
しかしMeCab用の巨大辞書を某デバイスに突っ込むことは容認されるだろうか。
Text To Speechのファイルよりもでかかったらまずいか。
そういえばあれだってトークナイズとかしてるんだろうなあ。
ちなみにメヒビとかアオサとか割と好き。
しかしMeCab用の巨大辞書を某デバイスに突っ込むことは容認されるだろうか。
Text To Speechのファイルよりもでかかったらまずいか。
そういえばあれだってトークナイズとかしてるんだろうなあ。
905デフォルトの名無しさん
2020/07/10(金) 10:55:56.90ID:2/Ccitmb 読み上げ君とかは時々変な読み上げ方するが
MeCab使ってたらもうちょっとマシなんだろうか
MeCab使ってたらもうちょっとマシなんだろうか
906デフォルトの名無しさん
2020/07/10(金) 16:59:23.16ID:4InogVIm とりあえずMeCabの辞書って圧縮とかはかかってないっぽいかも。
squashfs上に置いたりしたら性能がどのくらい落ちるかな。
squashfs上に置いたりしたら性能がどのくらい落ちるかな。
907デフォルトの名無しさん
2020/07/18(土) 08:30:17.82ID:Iwhr9cjK 覚えたてか(笑)
908デフォルトの名無しさん
2020/07/18(土) 12:55:50.29ID:mNXnDrlR MecabはEUCやshift-jisが効率よいんですよ。
909デフォルトの名無しさん
2020/07/18(土) 13:46:55.67ID:csmyIL5D >>908
何の効率ですか? メモリ使用量? 処理速度?
今日び文字処理がUTF-16なAPIが少なくないので、連携して使うとするとMeCab側に
UTF-16のオプションがあると使いやすいのだが。
辞書は、UTF-8だと日本語が1文字3バイト使うのでやはりこちらもUTF-16だと
いいんじゃないかと。圧縮とかしてたら違ってくるけど。
何の効率ですか? メモリ使用量? 処理速度?
今日び文字処理がUTF-16なAPIが少なくないので、連携して使うとするとMeCab側に
UTF-16のオプションがあると使いやすいのだが。
辞書は、UTF-8だと日本語が1文字3バイト使うのでやはりこちらもUTF-16だと
いいんじゃないかと。圧縮とかしてたら違ってくるけど。
910デフォルトの名無しさん
2020/07/18(土) 14:44:43.40ID:Iwhr9cjK UTF 16なんて Java だけじゃない?
911デフォルトの名無しさん
2020/07/18(土) 19:55:51.11ID:OcCP0Pji というかJavaはでかいでしょw
Objective-CやSwiftのNSStringもUTF-16。
この時点で昨今のユーザー用デバイスの上は基本的にUTF-16ということであるw
C++にはchar16_tというUTF-16用のネイティブな型がある。
Objective-CやSwiftのNSStringもUTF-16。
この時点で昨今のユーザー用デバイスの上は基本的にUTF-16ということであるw
C++にはchar16_tというUTF-16用のネイティブな型がある。
912デフォルトの名無しさん
2020/07/18(土) 21:08:42.78ID:mNXnDrlR 仕組みを知らないレベルなら、上からモノを言わないほうが良いのだろうけど。
913デフォルトの名無しさん
2020/07/18(土) 21:32:00.36ID:Iwhr9cjK 古い情報で動いてる 新参だろ
914デフォルトの名無しさん
2020/07/19(日) 10:58:42.94ID:DFSJX5gq わざと煽るとレスが増える
わざと間違えるとレスが増える
味を覚えたら繰り返す
わざと間違えるとレスが増える
味を覚えたら繰り返す
915デフォルトの名無しさん
2020/07/19(日) 20:28:34.01ID:tfox/PaN 人をおちょくることにだけ長けた古参が集う、そんなスレ。
自分からは生産的なことは何一つできない。
ザ・老害。
自分からは生産的なことは何一つできない。
ザ・老害。
916デフォルトの名無しさん
2020/07/25(土) 19:09:18.22ID:gG3SN9py >例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。
当然ながら起きているときも、チンポがシコシコする!
風呂から出て体一杯に水を浴びながら竜哉は、この時始めて英子に対する心を決めた。裸の上半身にタオルをかけ、
離れに上ると彼は障子の外から声を掛けた。
「英子さん」
部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。
その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。
●これが衝撃の「障子破り」シーンだ! (石原慎太郎 『太陽の季節』 (新潮文庫) より)
>その瞬間、竜哉は体中が引き締まるような快感を感じた
チンポがシコシコする≠勃起、つまりそれはただチンポが勃起するのではなくて、
「体中が引き締まるような快感を感じた」ということなのである!!
当然ながら起きているときも、チンポがシコシコする!
風呂から出て体一杯に水を浴びながら竜哉は、この時始めて英子に対する心を決めた。裸の上半身にタオルをかけ、
離れに上ると彼は障子の外から声を掛けた。
「英子さん」
部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。
その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。
●これが衝撃の「障子破り」シーンだ! (石原慎太郎 『太陽の季節』 (新潮文庫) より)
>その瞬間、竜哉は体中が引き締まるような快感を感じた
チンポがシコシコする≠勃起、つまりそれはただチンポが勃起するのではなくて、
「体中が引き締まるような快感を感じた」ということなのである!!
917デフォルトの名無しさん
2020/07/25(土) 20:58:49.42ID:IpZkqo3u こんな過疎スレ、言うほど古参なんか集まってくる?(笑)
918デフォルトの名無しさん
2020/07/26(日) 01:26:45.61ID:3Ai910F/ mecab + ipadic、「10月」 とかの場合に「月」は助数詞として扱われないのな。
年や日は助数詞になるのに。月は数詞扱いじゃ駄目なん?
年や日は助数詞になるのに。月は数詞扱いじゃ駄目なん?
919デフォルトの名無しさん
2020/07/28(火) 00:18:25.11ID:D1wUMbm4 鬼滅の刃に出てくるやつ -> それは十二「鬼」月
でもこれって十二の鬼月(ただこの場合普通は「おにづき」)なのか、
十二鬼の月なのか。助数詞が変わってくる。
でもこれって十二の鬼月(ただこの場合普通は「おにづき」)なのか、
十二鬼の月なのか。助数詞が変わってくる。
920デフォルトの名無しさん
2020/07/31(金) 19:48:50.98ID:0cmnY8cb >>919
鬼月ってのはそういう苗字があるみたいね。確かに作者がどこかで「すべて実在する名前
から取ってる」みたいなことを言ってたか。
しかし、mecab-ipadic-neologd さんだと全て対応済みっぽい。
$ echo 十二鬼月 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
十二 名詞,固有名詞,人名,姓,*,*,十二,ジュウニ,ジューニ
鬼月 名詞,固有名詞,人名,姓,*,*,鬼月,キヅキ,キズキ
EOS
echo 竈門炭治郎 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
竈門炭治郎 名詞,固有名詞,人名,一般,*,*,竈門炭治郎,カマドタンジロウ,カマドタンジロー
EOS
echo 吾峠呼世晴 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
吾峠呼世晴 名詞,固有名詞,人名,一般,*,*,吾峠呼世晴,ゴトウゲコヨハル,ゴトーゲコヨハル
EOS
鬼月ってのはそういう苗字があるみたいね。確かに作者がどこかで「すべて実在する名前
から取ってる」みたいなことを言ってたか。
しかし、mecab-ipadic-neologd さんだと全て対応済みっぽい。
$ echo 十二鬼月 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
十二 名詞,固有名詞,人名,姓,*,*,十二,ジュウニ,ジューニ
鬼月 名詞,固有名詞,人名,姓,*,*,鬼月,キヅキ,キズキ
EOS
echo 竈門炭治郎 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
竈門炭治郎 名詞,固有名詞,人名,一般,*,*,竈門炭治郎,カマドタンジロウ,カマドタンジロー
EOS
echo 吾峠呼世晴 | mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd
吾峠呼世晴 名詞,固有名詞,人名,一般,*,*,吾峠呼世晴,ゴトウゲコヨハル,ゴトーゲコヨハル
EOS
921デフォルトの名無しさん
2020/08/01(土) 22:04:57.45ID:rpF69vZ/ 人の名前はどうにもならないな
新しい名前はどんどん出てくるし
ラノベとかだと現実にあり得ない名前とか
普通に出てくる
新しい名前はどんどん出てくるし
ラノベとかだと現実にあり得ない名前とか
普通に出てくる
922デフォルトの名無しさん
2020/08/02(日) 20:20:25.58ID:63NiyH+f 結局辞書をメンテすれば済む話じゃない?
923デフォルトの名無しさん
2020/08/02(日) 20:55:22.51ID:rl9xr/mh >>845
マスクの着用、手指のアルコール消毒に協力すればいいんだね。分かった!
マスクの着用、手指のアルコール消毒に協力すればいいんだね。分かった!
924デフォルトの名無しさん
2020/08/04(火) 22:14:21.47ID:uMd91kkd トランスフォーマーの Self Attention ってニューラルネットワークなの?
925デフォルトの名無しさん
2020/08/06(木) 16:07:21.15ID:UxgwWB45 >>921
ニューラルネットとかを使って文脈で「この位置に来るのは人名(少なくとも名詞)」
みたいのを精度高く判断できればいいんじゃないかと思ったり。
文脈がない(短い)場合は駄目なわけだけど。
あと、人間が文章を読んでいるときは「これ人の名前っぽい」って思う要素があるよね。
必ずしも文脈(だけ)じゃなくて字面も影響してるかなこれは。
ニューラルネットとかを使って文脈で「この位置に来るのは人名(少なくとも名詞)」
みたいのを精度高く判断できればいいんじゃないかと思ったり。
文脈がない(短い)場合は駄目なわけだけど。
あと、人間が文章を読んでいるときは「これ人の名前っぽい」って思う要素があるよね。
必ずしも文脈(だけ)じゃなくて字面も影響してるかなこれは。
926デフォルトの名無しさん
2020/08/06(木) 16:17:31.91ID:IAzz78X7 先達も同じ発想だった
927デフォルトの名無しさん
2020/08/06(木) 16:31:45.13ID:NudvYbs2928デフォルトの名無しさん
2020/08/07(金) 00:51:58.42ID:DGuyAjIv >>926
ですよねw でも、ニューラルネットの学習規模をもっとでかくするとか...
で、巨大な辞書を利用することになるのかw
とりあえず、気に入らない分かち結果だけ自前のコードで修正して使うことにしました。
ですよねw でも、ニューラルネットの学習規模をもっとでかくするとか...
で、巨大な辞書を利用することになるのかw
とりあえず、気に入らない分かち結果だけ自前のコードで修正して使うことにしました。
929デフォルトの名無しさん
2020/08/11(火) 20:01:52.86ID:aCyqldbU 2020年07月29日 08時00分ソフトウェア
自然なブログを書いてしまうほど超高精度な言語モデル「GPT-3」はどのように言葉を紡いでいるのか?
https://gigazine.net/news/20200729-how-gpt-3-work/
自然なブログを書いてしまうほど超高精度な言語モデル「GPT-3」はどのように言葉を紡いでいるのか?
https://gigazine.net/news/20200729-how-gpt-3-work/
930デフォルトの名無しさん
2020/08/12(水) 11:16:30.67ID:NP05B2hK 657 仕様書無しさん [sage] 2020/08/12(水) 11:11:53.67 ID:
>>655
ちんぽをシコシコするというのは主体が別に存在する(おそらく右手であろう)
しかし、ちんぼがシコシコするというのはちんぽさんが主体となって別の輪状、もしくは固定された箇所に向かって
往復運動をすることを言う
そしてそれはシコシコと形容される範囲内におけるような物体や部位である必要がある
つまり、日本語でいうところのチンポがシコシコするというのは文法上は正しい
しかしである
ちんぽは主語になってよいものかという問題が残る
ちんぽは思考できるのか、主体的な存在であるのかという疑問んである
我々はちんぽを自由自在に動かす事はできない
「勃つんだ!ジョー!!」などと呼びかけた人もいるであろう
ちんぽは人の付属物であると同時に1本の主体的な存在でもある
思考や意識といったものはないかもしれないし他動的な刺激により、また体調により変化を兆す。
つまり、チンポがシコシコするというのはチンポが主体的な存在かどうかが問われているのであり
勃起に至る過程からそれはまさに肯定されるべきなのである
>>655
ちんぽをシコシコするというのは主体が別に存在する(おそらく右手であろう)
しかし、ちんぼがシコシコするというのはちんぽさんが主体となって別の輪状、もしくは固定された箇所に向かって
往復運動をすることを言う
そしてそれはシコシコと形容される範囲内におけるような物体や部位である必要がある
つまり、日本語でいうところのチンポがシコシコするというのは文法上は正しい
しかしである
ちんぽは主語になってよいものかという問題が残る
ちんぽは思考できるのか、主体的な存在であるのかという疑問んである
我々はちんぽを自由自在に動かす事はできない
「勃つんだ!ジョー!!」などと呼びかけた人もいるであろう
ちんぽは人の付属物であると同時に1本の主体的な存在でもある
思考や意識といったものはないかもしれないし他動的な刺激により、また体調により変化を兆す。
つまり、チンポがシコシコするというのはチンポが主体的な存在かどうかが問われているのであり
勃起に至る過程からそれはまさに肯定されるべきなのである
931デフォルトの名無しさん
2020/08/12(水) 19:17:07.69ID:NP05B2hK 『過信』
鳥塚 力(56)
世界一になりたくて人生を無駄にした。
バンドで野心をもって人生を無駄にした。
詩の天才を信じて人生を無駄にした。
母の私への願いは
平凡な家庭を持ち、正しき仕事をすること。
母の願いを裏切って、孤独のまま
もう平凡にも戻れない。
http://blog.esuteru.com/archives/9558461.html
鳥塚 力(56)
世界一になりたくて人生を無駄にした。
バンドで野心をもって人生を無駄にした。
詩の天才を信じて人生を無駄にした。
母の私への願いは
平凡な家庭を持ち、正しき仕事をすること。
母の願いを裏切って、孤独のまま
もう平凡にも戻れない。
http://blog.esuteru.com/archives/9558461.html
932デフォルトの名無しさん
2020/08/13(木) 21:43:13.46ID:P0whfGXq 意見が異なる人間を、自分たちの縄張りやコミュニティから、
はじき出そうと必死な人がいる。はじき出されないよう、
必死に気を配りまくり、意見を言わずに黙り込んでいる人もいる。
著名人であっても、ファンにそっぽを向かれないよう、
自分に貼られたレッテルから外れた意見を言わないよう、
振舞っている人を僕は見かける。
心の底から、気の毒だと思う。
そんなコミュニティにいて、楽しいのだろうか?
「はじき出してやろう」「はじき出されないようにしよう」
と必死な人たちに、何としてでも好かれたいのか?
僕は、まっぴらだ。
一緒にいて楽しくない人たちに好かれようと努力すると、
自分を見失ってしまう。
人生において、自分を捨ててはいけない。絶対にいけない。
「はじき出してやろう」としてくる人など、遠慮なく捨ててほしいと思う。
<堀江貴文「捨て本」67頁>
はじき出そうと必死な人がいる。はじき出されないよう、
必死に気を配りまくり、意見を言わずに黙り込んでいる人もいる。
著名人であっても、ファンにそっぽを向かれないよう、
自分に貼られたレッテルから外れた意見を言わないよう、
振舞っている人を僕は見かける。
心の底から、気の毒だと思う。
そんなコミュニティにいて、楽しいのだろうか?
「はじき出してやろう」「はじき出されないようにしよう」
と必死な人たちに、何としてでも好かれたいのか?
僕は、まっぴらだ。
一緒にいて楽しくない人たちに好かれようと努力すると、
自分を見失ってしまう。
人生において、自分を捨ててはいけない。絶対にいけない。
「はじき出してやろう」としてくる人など、遠慮なく捨ててほしいと思う。
<堀江貴文「捨て本」67頁>
933デフォルトの名無しさん
2020/08/13(木) 22:21:50.44ID:P0whfGXq 939 優しい名無しさん sage 2020/08/13(木) 11:29:23.57 ID:H3nfnQ6W
チンポ【が】シコシコするなんて言ってる奴聞いた事ねーよ
どこの方言?ダサww
チンポ【が】シコシコするなんて言ってる奴聞いた事ねーよ
どこの方言?ダサww
934デフォルトの名無しさん
2020/08/14(金) 07:45:58.69ID:Wo0gSBUj 314 太上天君 (ワッチョイ 9967-E2Bm) 2020/08/13(木) 18:33:48.27 ID:UPcr7eZE0
>>312
ぬしゃよ、はいぎぃ〜っぬしゃあ「シコシコする」の定義次第じゃな。
せんずりをこくことを「シコシコする」というのなら間違いじゃ。
センズリはチンコの自律運動ではなく、チンコの所有者の行為だからな。
「心臓がドキドキする」は主語である心臓自体の自律運動だから正しいのじゃw
はふんはふんおふんおふん。
>>312
ぬしゃよ、はいぎぃ〜っぬしゃあ「シコシコする」の定義次第じゃな。
せんずりをこくことを「シコシコする」というのなら間違いじゃ。
センズリはチンコの自律運動ではなく、チンコの所有者の行為だからな。
「心臓がドキドキする」は主語である心臓自体の自律運動だから正しいのじゃw
はふんはふんおふんおふん。
935デフォルトの名無しさん
2020/08/14(金) 14:22:38.34ID:/7ySu5xk >>849
>NLPの不完全性からの問題提起もオブジェクト指向の集約も夢精の例もほぼ意味がなく、
1: 以下、名無しにかわりましてVIPがお送りします 2013/03/31(日) 00:08:38.70 ID:GVdw15xL0
40秒くらいから着替えだが全体的にキチガイじみてる
http://majikichi.com/archives/7808383.html
>NLPの不完全性からの問題提起もオブジェクト指向の集約も夢精の例もほぼ意味がなく、
1: 以下、名無しにかわりましてVIPがお送りします 2013/03/31(日) 00:08:38.70 ID:GVdw15xL0
40秒くらいから着替えだが全体的にキチガイじみてる
http://majikichi.com/archives/7808383.html
936デフォルトの名無しさん
2020/08/17(月) 12:27:17.09ID:soYdDlhA 超高精度な文章生成ツール「GPT-3」は、“人間にしかできないこと”の定義を根本から揺るがした
https://wired.jp/2020/08/17/ai-text-generator-gpt-3-learning-language-fitfully/
https://wired.jp/2020/08/17/ai-text-generator-gpt-3-learning-language-fitfully/
937デフォルトの名無しさん
2020/08/17(月) 12:40:36.79ID:wiEf4b6A でもこれ自然言語で3桁の計算もできないんだよ(笑)
938デフォルトの名無しさん
2020/08/17(月) 12:46:34.32ID:6yBIhPPf 2かける3
を
3かける2
って書くと間違いにされるんだよな
を
3かける2
って書くと間違いにされるんだよな
939デフォルトの名無しさん
2020/08/18(火) 10:04:44.59ID:Fd7uJYBs あんだけ膨大なパラメータがあっても
知性らしきものの欠片は見つかる程度で
ほとんど進展なし、ってのもねえ
知性らしきものの欠片は見つかる程度で
ほとんど進展なし、ってのもねえ
940デフォルトの名無しさん
2020/08/18(火) 10:12:48.95ID:TScP2Zja 冬の時期到来不可避
941デフォルトの名無しさん
2020/08/18(火) 12:38:13.52ID:1N2TKAu+ > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw
日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw
日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
942デフォルトの名無しさん
2020/08/18(火) 12:46:19.65ID:wz1BB6CR 言語モデルは言語知識に特化すべきで
実世界モデルは別途組み込めるようにならないとダメだよね
よく設計されたタスクが出てこないと
そのあたりの技術もなかなか進展しないね
実世界モデルは別途組み込めるようにならないとダメだよね
よく設計されたタスクが出てこないと
そのあたりの技術もなかなか進展しないね
943デフォルトの名無しさん
2020/08/20(木) 08:17:13.79ID:ztQrzX/E 規則ベースって限界があるじゃん?
でもなんとかして論理を組み込まないといけないんだよね
どうすればいいんだろう。。。
でもなんとかして論理を組み込まないといけないんだよね
どうすればいいんだろう。。。
944デフォルトの名無しさん
2020/08/23(日) 20:42:39.62ID:qp6BB2Af945デフォルトの名無しさん
2020/08/26(水) 10:04:49.29ID:4GZ9k+0t 540 デフォルトの名無しさん 2020/08/26(水) 10:02:48.02 ID:NYX2/iU2
// おしっこルーチン
俺.パンツを脱ぐ()
while (俺.オシッコ残量 != 0) {
俺.オシッコ残量 -= 俺.チンポ.オシッコを出す()
}
do {
俺.チンポフリフリする()
} while(count < MAX && 俺.残尿感())
俺.パンツを履く()
// おしっこルーチン
俺.パンツを脱ぐ()
while (俺.オシッコ残量 != 0) {
俺.オシッコ残量 -= 俺.チンポ.オシッコを出す()
}
do {
俺.チンポフリフリする()
} while(count < MAX && 俺.残尿感())
俺.パンツを履く()
946デフォルトの名無しさん
2020/08/26(水) 20:02:38.07ID:Pf4G7zlI 2013年07月29日 21時00分52秒
怠け者で愚かな人間ほど優秀なプログラマーに向いている理由
https://gigazine.net/amp/20130729-reasons-good-programmer-must-be-lazy-and-dumb/
怠け者で愚かな人間ほど優秀なプログラマーに向いている理由
https://gigazine.net/amp/20130729-reasons-good-programmer-must-be-lazy-and-dumb/
947デフォルトの名無しさん
2020/08/27(木) 19:42:56.65ID:OAHLXlr3 多重継承は曖昧だというが、自然言語処理はその曖昧さが大切になる。チンポは随意筋であり不随意筋である。
最終的に,クラス階層は最上位クラスを含めた
最大8 階層から構成され,「伝統的な日本の絵画」
に属する用語に対応する 55 クラスと解説文中か
ら抽出した139 クラスが配置された。ただし,そ
のうち 32 クラスが複数の上位クラスをもつとい
う多重継承が示された。例えば,「ngyc:絵巻物」
は「ngyc:伝統的な日本の絵画」と,「ngyc:表具の
形式」の下位クラスである「ngyc:巻子」の 2 つの
クラスを継承する(図 2)。こうした多重継承は,
本質属性をもつ基本概念と機能を表すロール概念
を分離することで,基本概念による属性継承に限
った階層関係に変更するという考え方もあり 10),
「ngyc:伝統的な日本の絵画」がロール概念で,
「ngyc:表具の形式」が基本概念と捉えることもで
きる。しかし,本研究ではテキストからの情報抽
出に即して配置し,多重継承を許容した階層を導
き出した。
http://www.mslis.jp/am2019yoko/05_kobayashi.pdf
随意筋 不随意筋
↖ ↗
チンポ
最終的に,クラス階層は最上位クラスを含めた
最大8 階層から構成され,「伝統的な日本の絵画」
に属する用語に対応する 55 クラスと解説文中か
ら抽出した139 クラスが配置された。ただし,そ
のうち 32 クラスが複数の上位クラスをもつとい
う多重継承が示された。例えば,「ngyc:絵巻物」
は「ngyc:伝統的な日本の絵画」と,「ngyc:表具の
形式」の下位クラスである「ngyc:巻子」の 2 つの
クラスを継承する(図 2)。こうした多重継承は,
本質属性をもつ基本概念と機能を表すロール概念
を分離することで,基本概念による属性継承に限
った階層関係に変更するという考え方もあり 10),
「ngyc:伝統的な日本の絵画」がロール概念で,
「ngyc:表具の形式」が基本概念と捉えることもで
きる。しかし,本研究ではテキストからの情報抽
出に即して配置し,多重継承を許容した階層を導
き出した。
http://www.mslis.jp/am2019yoko/05_kobayashi.pdf
随意筋 不随意筋
↖ ↗
チンポ
948デフォルトの名無しさん
2020/08/27(木) 20:38:08.18ID:mPgiETdu 新井紀子だっけ?
949デフォルトの名無しさん
2020/09/04(金) 10:21:25.57ID:3K6ISx4z Janomeを使って何か自然言語処理の練習したいんだけど、良い題材ない?
950デフォルトの名無しさん
2020/09/04(金) 13:23:52.05ID:lHqiid/j タガーだっけ?janomeって
951デフォルトの名無しさん
2020/09/04(金) 13:31:33.06ID:IxxfcH8z >>949
5chのテキストをパースして自動的に分類する
5chのテキストをパースして自動的に分類する
952デフォルトの名無しさん
2020/09/04(金) 13:35:36.72ID:pWGMbRem チンポって見ると、あわしろいくやを連想する。
953デフォルトの名無しさん
2020/09/04(金) 15:14:28.55ID:3K6ISx4z954デフォルトの名無しさん
2020/09/04(金) 19:36:24.47ID:lHqiid/j pos taggerって言うの
955デフォルトの名無しさん
2020/09/05(土) 09:59:45.78ID:D6IgUwp/ †
956デフォルトの名無しさん
2020/09/06(日) 10:22:12.68ID:y7ovSoOJ > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw
日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
Pythonさえろくにできないバカチョンのくせに
できるとほざくクソチョンw
日本で強姦と窃盗を繰り返す
犯罪者在日のクソチョンw
957デフォルトの名無しさん
2020/09/06(日) 11:30:10.23ID:upVLHx9G ルネ・トムってすごいね
958デフォルトの名無しさん
2020/09/06(日) 11:42:30.22ID:fnIXCpSw transformerの次がなかなか出てこないね
959デフォルトの名無しさん
2020/09/08(火) 21:52:39.64ID:2si/FE61 tranfomer について詳しく解説してあるページとか本ありませんか?
960デフォルトの名無しさん
2020/09/09(水) 10:17:02.71ID:lnf2Fwrw 山ほどあるけど
調べられないのだとしたら
理解するのも難しいね
調べられないのだとしたら
理解するのも難しいね
961デフォルトの名無しさん
2020/09/09(水) 23:04:42.60ID:9WOiVX53 google scholar で transformaer で検索
その中で英語論文を読む
その中で英語論文を読む
962デフォルトの名無しさん
2020/09/11(金) 19:14:16.24ID:Y+1ewbLi annotated Transformer わかりやすいかな
963デフォルトの名無しさん
2020/09/12(土) 11:58:20.06ID:lrygipm3964デフォルトの名無しさん
2020/09/15(火) 15:55:37.76ID:DIcfhHA7 スタンフォードのinfilling by language modeling、頭いい
965デフォルトの名無しさん
2020/09/17(木) 16:47:09.20ID:bZN6UsQ+ 839 名無し三等兵 sage 2020/09/17(木) 13:10:27.16 ID:MgqlxbwX
サルのセンズリみたいに同じことばっかり言ってんなよ
サルのセンズリみたいに同じことばっかり言ってんなよ
966デフォルトの名無しさん
2020/09/18(金) 08:29:34.03ID:fRIMKZI2 なんでわざわざbertを持ち出してくるのか
自社技術でもない上に改良型がでているのに
センスなさすぎない?
人間超えの精度をうたう日本語AIエンジン「ELYZA Brain」、各業界のパートナー企業を募集
https://it.impress.co.jp/articles/-/20402
自社技術でもない上に改良型がでているのに
センスなさすぎない?
人間超えの精度をうたう日本語AIエンジン「ELYZA Brain」、各業界のパートナー企業を募集
https://it.impress.co.jp/articles/-/20402
967デフォルトの名無しさん
2020/09/27(日) 17:06:16.27ID:TN/zu207 601 大学への名無しさん sage 2020/09/25(金) 23:00:42.22 ID:Iqfa/Obf0
>>600
ネタとしてそういうこと思いついちゃったのは別にいいんだけどキミの文章は読んでてつまらないな
キミが今興味をもっていて伝えたいことは文章を読まされる側は最初の時点では微塵も興味ないんだよ
その温度差を埋める手順を踏まずにいきなりガーッと来られてもこっちはひいちゃうよ
>>600
ネタとしてそういうこと思いついちゃったのは別にいいんだけどキミの文章は読んでてつまらないな
キミが今興味をもっていて伝えたいことは文章を読まされる側は最初の時点では微塵も興味ないんだよ
その温度差を埋める手順を踏まずにいきなりガーッと来られてもこっちはひいちゃうよ
968デフォルトの名無しさん
2020/09/27(日) 17:54:50.78ID:puZoniiK 金曜の方が進んでない感じがする
969デフォルトの名無しさん
2020/10/02(金) 13:58:39.92ID:jsy1W/mx 磯崎さんて亡くなってたんだな
知らんかった
知らんかった
970デフォルトの名無しさん
2020/10/05(月) 15:19:14.63ID:1rQLIMGN アハモジャ、で検索したら
茂木某がトップにでてきて草
どうやってるんだろう(笑)
茂木某がトップにでてきて草
どうやってるんだろう(笑)
971デフォルトの名無しさん
2020/10/08(木) 19:41:57.61ID:174QUmSs 677 大学への名無しさん sage 2020/10/08(木) 18:02:01.48 ID:KNTLGZSn0
30年近く前の絶版になったマンガを使い
この数年他のスレでも同じことを書き続ける
何をどうこじらせたらこんなふうになるんだ?
こんなのばっかり
30年近く前の絶版になったマンガを使い
この数年他のスレでも同じことを書き続ける
何をどうこじらせたらこんなふうになるんだ?
こんなのばっかり
972デフォルトの名無しさん
2020/10/09(金) 09:44:30.19ID:vl+UDRkB 財布の忘れ物は戻ってくるっていうけど
傘は盗まれるそして戻ってこない
傘は盗まれるそして戻ってこない
973デフォルトの名無しさん
2020/10/09(金) 09:48:27.91ID:gzRzO1zZ 都会では自殺する若者が増えている
974デフォルトの名無しさん
2020/10/12(月) 12:00:15.91ID:DchzyShu 879 デフォルトの名無しさん sage 2020/09/14(月) 15:24:58.35 ID:arUBFBXX
“そいつに何をやらせたいか”を抽象化したレベルに持って行って
ママの「おしっこしてきて」で命令が済むように
1つ1つのモジュールが自立管理する前提で考えられた概念を
下から細々組み立ててた低レベル階層に導入しようとした結果
命令が低レベルに細分化されて思想を導入した意味がなくなってるだけやで。
もともとは巨大コンピュータのネットワークで
各コンピュータで独立して動いてるモジュールに
「これやって!」「できた?」って指令送る環境前提なので。
“そいつに何をやらせたいか”を抽象化したレベルに持って行って
ママの「おしっこしてきて」で命令が済むように
1つ1つのモジュールが自立管理する前提で考えられた概念を
下から細々組み立ててた低レベル階層に導入しようとした結果
命令が低レベルに細分化されて思想を導入した意味がなくなってるだけやで。
もともとは巨大コンピュータのネットワークで
各コンピュータで独立して動いてるモジュールに
「これやって!」「できた?」って指令送る環境前提なので。
975デフォルトの名無しさん
2020/10/12(月) 13:19:26.41ID:DchzyShu 186 デフォルトの名無しさん sage 2020/10/12(月) 12:23:26.11 ID:PgbimoqJ
胸は自らが動くからドキドキでよい
チンポをシコシコするのは右手(もしくは左手、足の場合もあるが詳細は省略)
つまり主語は(省略された)右手であってチンポは受け身の存在
要するにメッセージを送信するのは右手であって、受信したチンポはシコシコ指令を受けて
副作用としてドピュッシーを発生させる
シコシコはオブジェクト間メッセージなんだよ
もしこれが自分の右手じゃなくて彼女の足だったとする
足でもシコシコメッセージを送信することが出来る
これがオブジェクト指向の利点だ
彼女にシコシコされたチンポは右手にシコシコされた場合と同様にドピュッシーを発生させるんだ
夢精でドビュッシーするのはシコシコではなくムラムラ
違うメッセージでも同じ副作用を発生させるのが容易なのもオブジェクト指向的なんだ
胸は自らが動くからドキドキでよい
チンポをシコシコするのは右手(もしくは左手、足の場合もあるが詳細は省略)
つまり主語は(省略された)右手であってチンポは受け身の存在
要するにメッセージを送信するのは右手であって、受信したチンポはシコシコ指令を受けて
副作用としてドピュッシーを発生させる
シコシコはオブジェクト間メッセージなんだよ
もしこれが自分の右手じゃなくて彼女の足だったとする
足でもシコシコメッセージを送信することが出来る
これがオブジェクト指向の利点だ
彼女にシコシコされたチンポは右手にシコシコされた場合と同様にドピュッシーを発生させるんだ
夢精でドビュッシーするのはシコシコではなくムラムラ
違うメッセージでも同じ副作用を発生させるのが容易なのもオブジェクト指向的なんだ
976デフォルトの名無しさん
2020/10/13(火) 15:17:58.60ID:ZfqB/5p2 なんでテキストファイルってbomなしutf-8のlf改行がスタンダードなの?
977デフォルトの名無しさん
2020/10/13(火) 17:15:08.33ID:FpFGKRx+ 効率が良いから
978デフォルトの名無しさん
2020/10/13(火) 19:05:38.78ID:03VVLclZ 192 デフォルトの名無しさん sage 2020/10/13(火) 15:22:42.55 ID:h/Kpn3E/
チンポがシコシコ君は根本的に分かってないようだが
オブジェクトは主語ではなく、目的語。
SOVCのOはObjectのOダゾ
チンポがシコシコ君は根本的に分かってないようだが
オブジェクトは主語ではなく、目的語。
SOVCのOはObjectのOダゾ
>>976
BOM は UTF16 のためのものであって、UTF-8 には不要です
BOM は UTF16 のためのものであって、UTF-8 には不要です
980デフォルトの名無しさん
2020/10/13(火) 22:01:27.14ID:a0s81Coe そっかーサンクス
981デフォルトの名無しさん
2020/10/13(火) 22:21:22.94ID:pbfg/soH signatureならUTF-8にあってもいいよ。
983デフォルトの名無しさん
2020/10/13(火) 23:05:06.91ID:pbfg/soH それは「UTF-16LEにBOMは不要」てのと同じ意味でな。
テキストファイルの中身がUTF-8なのかUTF-16LEなのか事前にわからない状況ではsignatureも有用だろう。
テキストファイルの中身がUTF-8なのかUTF-16LEなのか事前にわからない状況ではsignatureも有用だろう。
>>983
>テキストファイルの中身がUTF-8なのかUTF-16LEなのか事前にわからない状況
で、そのテキストに BOM があれば、そのテキストは utf-8 か utf-16 little endian かが区別つくのでしょうか?
>テキストファイルの中身がUTF-8なのかUTF-16LEなのか事前にわからない状況
で、そのテキストに BOM があれば、そのテキストは utf-8 か utf-16 little endian かが区別つくのでしょうか?
レス数が950を超えています。1000を超えると書き込みができなくなります。
ニュース
- 日本行き空路49万件キャンセル 中国自粛呼びかけ 日本行きチケット予約の約32%に相当 ★4 [ぐれ★]
- 中国の局長は「両手をポケット」で対峙 宣伝戦で国民に示す ★3 [蚤の市★]
- 【音楽】Perfume・あ~ちゃんの結婚相手「一般男性」は吉田カバンの社長・吉田幸裕氏(41) 高身長で山本耕史似 [Ailuropoda melanoleuca★]
- 【大分】佐賀関で大規模火災、170棟以上が延焼中 70代男性1人と連絡取れず [ぐれ★]
- 【サッカー】U-17日本代表、激闘PK戦制す 北朝鮮撃破で6大会ぶり8強入り U17W杯 [久太郎★]
- 「クマはなるべく山に返す努力を」「クマと戦争は間違っている」動物保護活動家の主張 棲み分けと学習放獣でクマ被害なくなるのか?★7 [ぐれ★]
- とらせん IPあり
- 【DAZN】ワールドカップ欧州予選総合 ★5
- 巨専】
- こいせん 全レス転載禁止
- 侍ジャパンシリーズ2025「日本vs韓国」その12
- 【J SPORTS】FIFA U-17ワールドカップ ★10
- 高市「次回選挙争点は台湾有事よ!!」自民立憲公明維新国民「やめろーー!!」これが現実になりそうな件 [469534301]
- 経済保安相「気に入らないことがあれば経済的威圧をする国への依存はリスク」日本さん遂にアメリカと断交へ!!! [472617201]
- 自閉症が「んなっしょい」と連呼するお🏡
- 「世の中、バカが多くて疲れません?」👉1991年日本人大発狂 [543236886]
- アンケート調査で「高市発言は問題なし」 93.5%wwwwwwwwwwwwwwwwwwwwwwwww [279254606]
- 来年は卵が1パック400円以上になるらしい
