このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
探検
自然言語処理スレッド その5
■ このスレッドは過去ログ倉庫に格納されています
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
773デフォルトの名無しさん
2020/03/11(水) 17:31:54.14ID:/W59Vvow 頭が赤い魚を食べる猫
https://i.imgur.com/c8wOw6D.jpg
https://i.imgur.com/c8wOw6D.jpg
774デフォルトの名無しさん
2020/03/11(水) 18:04:39.92ID:0ettDLj0 コンテクストで周辺化すれば解決する?
775デフォルトの名無しさん
2020/03/11(水) 19:04:49.09ID:6icVeYcf 黒い瞳の大きな女の子
776デフォルトの名無しさん
2020/03/11(水) 22:44:18.45ID:DZf6OcqR 作者の気持ちを考えろ
複数の意味に捉えられるのが正解だ
複数の意味に捉えられるのが正解だ
777ことのは
2020/03/12(木) 01:15:14.09ID:/YIFSAvr >>771
昔はコンパイラだとかの言語処理も
人工知能の研究範囲だったらしいね?
人間がしてた最適化を機械でできた
だから全部いっぺんに生成するのは
AIではできないけど部分的な自動化
できる部分は拡大していくだろうよ
また前からしてるRPAの話につなげると
プロセスマイニングとかでより効率的な
RPAの命令を生成するのはそれに近くて
実現可能性もそこそこある領域だと思う
「翻訳メモリ」の利用っていうのと
「プロセスマイニング」って
データベース化した知識って点で
じつは共通するからね?
でも結論としては今すぐ失業はしない
プログラミング全自動化できる位に
強いAIがまだ実現していないから
>>772
カーネギーメロン大は昔から自然言語処理が得意だね
昔はコンパイラだとかの言語処理も
人工知能の研究範囲だったらしいね?
人間がしてた最適化を機械でできた
だから全部いっぺんに生成するのは
AIではできないけど部分的な自動化
できる部分は拡大していくだろうよ
また前からしてるRPAの話につなげると
プロセスマイニングとかでより効率的な
RPAの命令を生成するのはそれに近くて
実現可能性もそこそこある領域だと思う
「翻訳メモリ」の利用っていうのと
「プロセスマイニング」って
データベース化した知識って点で
じつは共通するからね?
でも結論としては今すぐ失業はしない
プログラミング全自動化できる位に
強いAIがまだ実現していないから
>>772
カーネギーメロン大は昔から自然言語処理が得意だね
778ことのは
2020/03/12(木) 01:33:02.43ID:/YIFSAvr >>773
「曖昧な日本の私」みたいな
日本語の係り受けの曖昧さの問題だね!
これは二番目が一番標準的な解析になるべきだと考える
なぜならまず係り受けが最小で連続しててキレイでしょ?
それから日常的にも一番出現確率が高そうな場面だよね?
だけどそれだけが唯一の正解って訳じゃなくて……
「曖昧な日本の私」みたいな
日本語の係り受けの曖昧さの問題だね!
これは二番目が一番標準的な解析になるべきだと考える
なぜならまず係り受けが最小で連続しててキレイでしょ?
それから日常的にも一番出現確率が高そうな場面だよね?
だけどそれだけが唯一の正解って訳じゃなくて……
779ことのは
2020/03/12(木) 01:33:20.86ID:/YIFSAvr >>774
前後の文を見てコンテクストを拡張しよう
っていうのももちろんあるやり方だし
また「マルチモーダル」や「人間との共同作業」が
実現できる環境なら、たんにそれらの画像を生成して
ユーザに選択させれば意図は確実に分かる
まあこの例だとナンセンスな気がするけどたとえば
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかが
ビジネスで重要な問題になるかもしれないとかだと
いちいち選択させるだけの動機はあるはず
前後の文を見てコンテクストを拡張しよう
っていうのももちろんあるやり方だし
また「マルチモーダル」や「人間との共同作業」が
実現できる環境なら、たんにそれらの画像を生成して
ユーザに選択させれば意図は確実に分かる
まあこの例だとナンセンスな気がするけどたとえば
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかが
ビジネスで重要な問題になるかもしれないとかだと
いちいち選択させるだけの動機はあるはず
780ことのは
2020/03/12(木) 01:40:21.76ID:/YIFSAvr781ことのは
2020/03/12(木) 01:40:37.23ID:/YIFSAvr >>776
>作者の気持ち
>複数の意味
これは難しいが高度な自然言語処理としてはありうる
たとえばお世辞で褒めてるとか
皮肉で逆の意味を示してるとか
今のテキストマイニングの
感情表現とかの情報抽出は
まだそのレベルまで行ってないだろうけど
Prologの自由変数の非決定性みたいな
多義性を保持する何らかの言語上の仕組みと
文脈解析する何らかのアルゴリズムが
必要になってくるだろうね?
>作者の気持ち
>複数の意味
これは難しいが高度な自然言語処理としてはありうる
たとえばお世辞で褒めてるとか
皮肉で逆の意味を示してるとか
今のテキストマイニングの
感情表現とかの情報抽出は
まだそのレベルまで行ってないだろうけど
Prologの自由変数の非決定性みたいな
多義性を保持する何らかの言語上の仕組みと
文脈解析する何らかのアルゴリズムが
必要になってくるだろうね?
782デフォルトの名無しさん
2020/03/12(木) 02:11:31.16ID:NA68FhbL 1から100までの足し算を求めよ くらいのプログラムなら現時点でもAIプログラマでできるはず
ちょっと進化して、
電気回路の電流求めるみたいなn元1次方程式も多分AIプログラマは出来るだろう
ちょっと進化して、
電気回路の電流求めるみたいなn元1次方程式も多分AIプログラマは出来るだろう
783デフォルトの名無しさん
2020/03/12(木) 02:15:05.32ID:8IVaSSC9 文法ではすり抜けるけど
事例で統計を取れば尤もらしい解釈が得られる
事例で統計を取れば尤もらしい解釈が得られる
784デフォルトの名無しさん
2020/03/12(木) 02:21:35.62ID:NA68FhbL GoogleのBERTなら今でも
このくらい↓のことはできるぞ(英語のみだが)
質問
「Where do water droplets collide with ice crystals to form precipitation?」
(水滴が氷の結晶と衝突して雨を形成するのはどこですか?)
Wikipedia
「-Precipitation forms as smller droplets coalesce via collision with other rain drops or ice crystals within a cloud」
(雨粒は、雲の中で他の雨粒や氷の結晶と衝突して合体し、小さな水滴として形成されます)
答え
「within a cloud」(雲の中)
このくらい↓のことはできるぞ(英語のみだが)
質問
「Where do water droplets collide with ice crystals to form precipitation?」
(水滴が氷の結晶と衝突して雨を形成するのはどこですか?)
Wikipedia
「-Precipitation forms as smller droplets coalesce via collision with other rain drops or ice crystals within a cloud」
(雨粒は、雲の中で他の雨粒や氷の結晶と衝突して合体し、小さな水滴として形成されます)
答え
「within a cloud」(雲の中)
785デフォルトの名無しさん
2020/03/12(木) 04:22:39.56ID:NA68FhbL >>782
こんな簡単なプログラムでも解くのはなかなかむずかしい
入力=”1から100までの和sを求めよ”
出力例=
”
s=0
for i in range(100):
s=s+i+1
print(s)
”
こんな数行のプログラミングでも難しい
AIにやらせると多分こうなる
"s=1+2+3+4+5+6+.…+99+100"
これも確かに答えだからなあ
こんな簡単なプログラムでも解くのはなかなかむずかしい
入力=”1から100までの和sを求めよ”
出力例=
”
s=0
for i in range(100):
s=s+i+1
print(s)
”
こんな数行のプログラミングでも難しい
AIにやらせると多分こうなる
"s=1+2+3+4+5+6+.…+99+100"
これも確かに答えだからなあ
786デフォルトの名無しさん
2020/03/12(木) 09:13:16.75ID:8IVaSSC9 MTに大量のコーパスが必要、というのが解せない
人間は1000万文なんて読まなくても翻訳できるのに
人間は1000万文なんて読まなくても翻訳できるのに
787デフォルトの名無しさん
2020/03/12(木) 09:52:53.59ID:eSw88mGJ 人間は文字や文章だけじゃなく様々な情報から知識や知能を身に付けてるのだから、違いがあるのは当然だろう
788デフォルトの名無しさん
2020/03/12(木) 10:52:14.52ID:2DPQopCV789デフォルトの名無しさん
2020/03/12(木) 12:59:44.57ID:vOpmeZnq それはどうでもいいかな
790デフォルトの名無しさん
2020/03/12(木) 13:37:54.15ID:NA68FhbL791デフォルトの名無しさん
2020/03/12(木) 14:18:44.24ID:MzPDqAwN 「ブカンもういいね」と近平が言ったから三月十二日はコロナ記念日
792ことのは
2020/03/12(木) 20:11:20.59ID:/YIFSAvr794ことのは
2020/03/12(木) 20:15:37.61ID:/YIFSAvr795ことのは
2020/03/12(木) 20:19:56.04ID:/YIFSAvr796ことのは
2020/03/12(木) 20:24:55.80ID:/YIFSAvr あとRPAの話題を続けて言えば
プロセスマイニングと
テキストマイニングを合わせて使うことで
シナジーが生じないか考えてる
たとえばRPAの操作ごとに
自然文を入力もしくは出力して
ログを溜めておき
定期的にマイニングすると
操作データと文章データを比較することで
何か得る物があるかもしれない
それからWebサービスに
チャット(ボット)をつけても
同じようなことができるだろう
というかつけてる所はログを解析してるだろう
プロセスマイニングと
テキストマイニングを合わせて使うことで
シナジーが生じないか考えてる
たとえばRPAの操作ごとに
自然文を入力もしくは出力して
ログを溜めておき
定期的にマイニングすると
操作データと文章データを比較することで
何か得る物があるかもしれない
それからWebサービスに
チャット(ボット)をつけても
同じようなことができるだろう
というかつけてる所はログを解析してるだろう
797デフォルトの名無しさん
2020/03/12(木) 20:55:07.53ID:8IVaSSC9 ググルのアシスタントはそういうフィードバックを収集してるみたい
798ことのは
2020/03/12(木) 21:06:48.68ID:/YIFSAvr >>797
スマートスピーカーとかは
当然のように情報収集してるだろうね
そもそも昔から検索エンジンの
クエリが情報源になってると思うけど
「データ イズ キング」で
ビッグデータを取れる
プラットフォームがAIには有利だな
このままだとグーグルやアマゾンに
全産業が寡占されそうで危機感ある
スマートスピーカーとかは
当然のように情報収集してるだろうね
そもそも昔から検索エンジンの
クエリが情報源になってると思うけど
「データ イズ キング」で
ビッグデータを取れる
プラットフォームがAIには有利だな
このままだとグーグルやアマゾンに
全産業が寡占されそうで危機感ある
799ことのは
2020/03/12(木) 21:08:12.01ID:/YIFSAvr reCAPTCHA - Wikipedia
https://ja.wikipedia.org/wiki/ReCAPTCHA
あんまりマニアックな論文とか紹介すると
手口がバレちゃうけどこれは有名な例だからいいかな
このreCAPTCHAはシステムの裏で
人間から情報収集する典型例だと思う
さっきのRPAでプロセスとテキストを
両方マイニングすればいいのでは
っていう発想の元ネタになってる
あとこれもカーネギーメロン大だね
自然言語処理に強いことで有名
https://ja.wikipedia.org/wiki/ReCAPTCHA
あんまりマニアックな論文とか紹介すると
手口がバレちゃうけどこれは有名な例だからいいかな
このreCAPTCHAはシステムの裏で
人間から情報収集する典型例だと思う
さっきのRPAでプロセスとテキストを
両方マイニングすればいいのでは
っていう発想の元ネタになってる
あとこれもカーネギーメロン大だね
自然言語処理に強いことで有名
800デフォルトの名無しさん
2020/03/12(木) 21:20:03.96ID:8IVaSSC9 コンピュータサイエンスでは
バークレーとcmu強いよね
カーネギーメロンて聞くと
メロンを思い出しちゃう
バークレーとcmu強いよね
カーネギーメロンて聞くと
メロンを思い出しちゃう
801デフォルトの名無しさん
2020/03/12(木) 21:28:51.90ID:R0x/UfYo >>796
RPAとまでゆかずともExelの操作やショートカットを発話でできたら、老人やスマホ世代には確実にウケるよ
類義語辞典の作成とdialogflowのAPIだけ借りて
複雑になり過ぎたGUIを音声の意味理解が吸収するのは合理的だし、ok googleや音声入力する人が(周りにはいないが)結構いるデータも後押ししてる
マイクロソフトとアドビの操作を覚えるなんて時間の無駄って世界にすべきだわ
RPAとまでゆかずともExelの操作やショートカットを発話でできたら、老人やスマホ世代には確実にウケるよ
類義語辞典の作成とdialogflowのAPIだけ借りて
複雑になり過ぎたGUIを音声の意味理解が吸収するのは合理的だし、ok googleや音声入力する人が(周りにはいないが)結構いるデータも後押ししてる
マイクロソフトとアドビの操作を覚えるなんて時間の無駄って世界にすべきだわ
802デフォルトの名無しさん
2020/03/12(木) 22:11:34.53ID:MBvc0z2j803ことのは
2020/03/12(木) 22:17:52.11ID:/YIFSAvr >>801
GUIからCUI(音声認識含む)に戻す
っていうのはシンプルだけど
大きな需要があると思ってる
たとえばスマートスピーカーは
とくにキッチンとかで手が離せない
状況の時に役立つからね
PCのGUIは残ると思うが
スマホも画面小さいから
複雑な操作はしにくいし
GUIからCUI(音声認識含む)に戻す
っていうのはシンプルだけど
大きな需要があると思ってる
たとえばスマートスピーカーは
とくにキッチンとかで手が離せない
状況の時に役立つからね
PCのGUIは残ると思うが
スマホも画面小さいから
複雑な操作はしにくいし
804ことのは
2020/03/12(木) 22:28:44.13ID:/YIFSAvr >>802
囲碁AIが「独学」で最強に グーグル、産業応用探る 日経
https://www.nikkei.com/article/DGXMZO22407340Y7A011C1TI1000/
最近の機械学習は自己学習できるようになってるよね
ただ囲碁や画像処理みたいに
公開された情報だけで白黒つく分野と
そうでない分野があるから
情報収集が全部不要になるとは限らないんだ
たとえば株価なんかはいくら学習の精度が上がっても
株価だけで正確に予測できるようになるのは難しい
もしそうだったらプログラマが
ジャンジャン金持ちになってるはずだから
企業やその評価についての情報を入手する必要がありそう
つまりテクニカルだけでは不足でファンダメンタルな情報が必要
株の話はひとつの例だけどマーケティングは
人間の行動の予測だから
やはり自己学習だけで完結できると思えない
となるとやっぱりデータイズキングだし
やっぱりGAFAが有利なんじゃないかと思う
囲碁AIが「独学」で最強に グーグル、産業応用探る 日経
https://www.nikkei.com/article/DGXMZO22407340Y7A011C1TI1000/
最近の機械学習は自己学習できるようになってるよね
ただ囲碁や画像処理みたいに
公開された情報だけで白黒つく分野と
そうでない分野があるから
情報収集が全部不要になるとは限らないんだ
たとえば株価なんかはいくら学習の精度が上がっても
株価だけで正確に予測できるようになるのは難しい
もしそうだったらプログラマが
ジャンジャン金持ちになってるはずだから
企業やその評価についての情報を入手する必要がありそう
つまりテクニカルだけでは不足でファンダメンタルな情報が必要
株の話はひとつの例だけどマーケティングは
人間の行動の予測だから
やはり自己学習だけで完結できると思えない
となるとやっぱりデータイズキングだし
やっぱりGAFAが有利なんじゃないかと思う
805デフォルトの名無しさん
2020/03/13(金) 00:32:07.48ID:3thqY/PO >>804
私はプログラミングの世界は本来「完全情報ゲーム」だと思ってる
情報が完全でなければプログラミングは不可能だ
現実にはプログラミングの時点でも仕様が確定しないということはあるだろう
プログラマはその都度、仕様確定に奔走し、情報を完全にしようとする
しかしその多くは人間の不完全さから起こることであって、本来は完全な情報を与えるのがミッションのはずだ
もしプログラミングが「完全情報ゲーム」であるとすれば、AIとの親和性はいいはずだ
AIプログラマはいずれ実現すると思う
株価変動のような「不完全情報ゲーム」とは分けて考えるべきだろう
私はプログラミングの世界は本来「完全情報ゲーム」だと思ってる
情報が完全でなければプログラミングは不可能だ
現実にはプログラミングの時点でも仕様が確定しないということはあるだろう
プログラマはその都度、仕様確定に奔走し、情報を完全にしようとする
しかしその多くは人間の不完全さから起こることであって、本来は完全な情報を与えるのがミッションのはずだ
もしプログラミングが「完全情報ゲーム」であるとすれば、AIとの親和性はいいはずだ
AIプログラマはいずれ実現すると思う
株価変動のような「不完全情報ゲーム」とは分けて考えるべきだろう
806デフォルトの名無しさん
2020/03/13(金) 01:04:33.05ID:3thqY/PO 私も囲碁のアマ高段者のはしくれなので、「アルファ碁」の出現には驚いた
初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった
現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、100勝0敗である
アルファ碁は入力情報は棋譜である
棋譜とは19×19のマス目に白黒の石の配置と手順記録したものである
こんな感じ
1)先手 黒4−四 2)後手 白16−一七 3)先手 黒………
入力情報は19×19の画像情報である
探索空間は1手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが19×19の画像となりニューラルネットへの入力となる
アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の1手を割り出していく
http://home.q00.itscom.net/otsuki/alphaZero.pdf
https://www.slideshare.net/suckgeunlee/alphago-zero
初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった
現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、100勝0敗である
アルファ碁は入力情報は棋譜である
棋譜とは19×19のマス目に白黒の石の配置と手順記録したものである
こんな感じ
1)先手 黒4−四 2)後手 白16−一七 3)先手 黒………
入力情報は19×19の画像情報である
探索空間は1手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが19×19の画像となりニューラルネットへの入力となる
アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の1手を割り出していく
http://home.q00.itscom.net/otsuki/alphaZero.pdf
https://www.slideshare.net/suckgeunlee/alphago-zero
807デフォルトの名無しさん
2020/03/13(金) 01:23:15.89ID:bBSRp/P7 いずれにせよ滅び行くゲームだな。
808デフォルトの名無しさん ◆aPqBDZ8KLvOt
2020/03/13(金) 17:52:49.28ID:3thqY/PO 面白いのは初代の「アルファ碁」は時々読み落としをしていたこと
これは人間がよくやる間違いと同質のミスである
探索空間が木構造である以上、少なくとも(19×19)の階乗 程度の組合わせとなり
組合せ爆発が起こるので、スーパーコンピュータでも到底解けない
宇宙年齢より時間がかかってしまうだろうから
そこで教師あり学習によって経験を積み、無用な探索を行わないように探索空間を枝刈りするというテクニックを採用した
しかし枝刈りされた探索木の中にも最適解や局所解は存在するかもしれない
実際そういうことが稀に起こって人間に負けることがあった
注目を浴びた韓国プロ棋士との5番勝負で4勝1敗になったのはそのケースだ
しかし強化学習を積上げることで、そのようなまぐれ負けは起こらなくなった
アルファ碁は1日に何万局もの自己対局を行うことができるので、
経験値を積み上げた結果、
人間が何百年もかけて築いてきた経験と知識を凌駕してしまったのだ
これは人間がよくやる間違いと同質のミスである
探索空間が木構造である以上、少なくとも(19×19)の階乗 程度の組合わせとなり
組合せ爆発が起こるので、スーパーコンピュータでも到底解けない
宇宙年齢より時間がかかってしまうだろうから
そこで教師あり学習によって経験を積み、無用な探索を行わないように探索空間を枝刈りするというテクニックを採用した
しかし枝刈りされた探索木の中にも最適解や局所解は存在するかもしれない
実際そういうことが稀に起こって人間に負けることがあった
注目を浴びた韓国プロ棋士との5番勝負で4勝1敗になったのはそのケースだ
しかし強化学習を積上げることで、そのようなまぐれ負けは起こらなくなった
アルファ碁は1日に何万局もの自己対局を行うことができるので、
経験値を積み上げた結果、
人間が何百年もかけて築いてきた経験と知識を凌駕してしまったのだ
809デフォルトの名無しさん
2020/03/13(金) 18:11:34.44ID:jvKiI+vV コピペされた文章を添削するスレか?ここは
810ことのは
2020/03/13(金) 19:50:32.30ID:ZeWzgGw6 >>805
>プログラミングの世界は本来「完全情報ゲーム」
>株価変動のような「不完全情報ゲーム」とは分けて考えるべき
その前提がよく分からないな?
人間の社会や市場は不完全情報で動いているので
ビジネスアプリの開発はそれに対応せざるをえない
いや別に「完全情報のゲーム」になるよう
囲碁や将棋のアプリとかだけ作っていてもいいんだけど
それはなんか個人の美学みたいな感じになっちゃうから
匿名掲示板だしオレは生産性を基準にする立場に立つね?
「〜すべき」みたいな限定する前提はなるべく
生産性を高める場合に使うと生産性が高まるから
もし株式市場の予測ソフトで儲かるなら
不完全でも何でも単にそれを作ればいいことでしょ?
>プログラミングの世界は本来「完全情報ゲーム」
>株価変動のような「不完全情報ゲーム」とは分けて考えるべき
その前提がよく分からないな?
人間の社会や市場は不完全情報で動いているので
ビジネスアプリの開発はそれに対応せざるをえない
いや別に「完全情報のゲーム」になるよう
囲碁や将棋のアプリとかだけ作っていてもいいんだけど
それはなんか個人の美学みたいな感じになっちゃうから
匿名掲示板だしオレは生産性を基準にする立場に立つね?
「〜すべき」みたいな限定する前提はなるべく
生産性を高める場合に使うと生産性が高まるから
もし株式市場の予測ソフトで儲かるなら
不完全でも何でも単にそれを作ればいいことでしょ?
811ことのは
2020/03/13(金) 19:53:58.87ID:ZeWzgGw6 >>806
>アルファ碁は入力情報は棋譜
>入力情報は19×19の画像情報
たしかに言語(棋譜)とも言えるし画像とも言えるね
究極的にはコンピュータが扱うデータは
1と0のバイナリだからみんな同じとも見なせる
じっさい機械学習では単語をベクトルにしたりするよね?
>アルファ碁は入力情報は棋譜
>入力情報は19×19の画像情報
たしかに言語(棋譜)とも言えるし画像とも言えるね
究極的にはコンピュータが扱うデータは
1と0のバイナリだからみんな同じとも見なせる
じっさい機械学習では単語をベクトルにしたりするよね?
812ことのは
2020/03/13(金) 19:55:32.58ID:ZeWzgGw6 >>807
はたしてどうかな?
チェスや将棋でプロ棋士に勝った時もよく言われたけど
自動車の方が人間より早いけど陸上競技はなくならない
ゲームが残るかどうかは人間が面白いかどうかじゃない?
ただプロの世界が消えてしまうことは想定できるかもね
はたしてどうかな?
チェスや将棋でプロ棋士に勝った時もよく言われたけど
自動車の方が人間より早いけど陸上競技はなくならない
ゲームが残るかどうかは人間が面白いかどうかじゃない?
ただプロの世界が消えてしまうことは想定できるかもね
813デフォルトの名無しさん
2020/03/13(金) 19:56:27.57ID:3thqY/PO814ことのは
2020/03/13(金) 20:08:11.39ID:ZeWzgGw6 >>808
>組合せ爆発が起こるので
>スーパーコンピュータでも到底解けない
総当たりだとそうなるだろうね
だから局所的なパターンを学習することで
組み合わせ爆発を避けるのがAIの基本になる
しかも自然言語の場合は19×19どころではなく
五十音(漢字を入れれば数千)×文字数
になるのだから、なおさら組み合わせ数は多い
そしてそのすべての文字の組み合わせで
文脈が決まるから文脈解析が難しいのも自然
その上で人間同士の会話では文字以外の情報も
参照してマルチモーダルな学習になっている
株価が株価だけで決まらないのと似たようなもの
で、難しいからどうするかだけど
一番シンプルな解決法としては
最初に文脈を限定してしまうのが早い
たとえば問い合わせのテキストマイニングなんかは
もっぱら特定の商品やサービスに
文脈が限定されているから解析しやすい
最初の話に戻ると囲碁だって棋譜っていう制限された文法で
自然言語処理ではなく人工言語処理だから解析できた訳でしょ?
>組合せ爆発が起こるので
>スーパーコンピュータでも到底解けない
総当たりだとそうなるだろうね
だから局所的なパターンを学習することで
組み合わせ爆発を避けるのがAIの基本になる
しかも自然言語の場合は19×19どころではなく
五十音(漢字を入れれば数千)×文字数
になるのだから、なおさら組み合わせ数は多い
そしてそのすべての文字の組み合わせで
文脈が決まるから文脈解析が難しいのも自然
その上で人間同士の会話では文字以外の情報も
参照してマルチモーダルな学習になっている
株価が株価だけで決まらないのと似たようなもの
で、難しいからどうするかだけど
一番シンプルな解決法としては
最初に文脈を限定してしまうのが早い
たとえば問い合わせのテキストマイニングなんかは
もっぱら特定の商品やサービスに
文脈が限定されているから解析しやすい
最初の話に戻ると囲碁だって棋譜っていう制限された文法で
自然言語処理ではなく人工言語処理だから解析できた訳でしょ?
815ことのは
2020/03/13(金) 20:11:08.50ID:ZeWzgGw6816ことのは
2020/03/13(金) 20:17:59.09ID:ZeWzgGw6 >>813
>あなたはプログラミングの経験がないのでは?
決めつけはよくないな
「あなたは要件定義の経験がないのでは?」
とでも返そうか?
業務は流動的なので確定していないことが多い
RPA(の導入)なんかでもツール自体よりも
業務フローの把握や整理とかが難しいことが多い
>仕様が確定すればプログラミングは可能になる
もちろん仕様が確定してた方が作りやすいけど
本当は長期的には不確定な部分は必ず残るんだよね
たとえば消費税や年号のように変化する部分がある
機能の拡張や修正なども当然出てくるだろうし
それでプログラムを抽象化するのは未来への投資で
抽象化や間接化で不確定性に対応できるようにする
逆に変化しないならハードコーディングでいいけど
>あなたはプログラミングの経験がないのでは?
決めつけはよくないな
「あなたは要件定義の経験がないのでは?」
とでも返そうか?
業務は流動的なので確定していないことが多い
RPA(の導入)なんかでもツール自体よりも
業務フローの把握や整理とかが難しいことが多い
>仕様が確定すればプログラミングは可能になる
もちろん仕様が確定してた方が作りやすいけど
本当は長期的には不確定な部分は必ず残るんだよね
たとえば消費税や年号のように変化する部分がある
機能の拡張や修正なども当然出てくるだろうし
それでプログラムを抽象化するのは未来への投資で
抽象化や間接化で不確定性に対応できるようにする
逆に変化しないならハードコーディングでいいけど
817デフォルトの名無しさん
2020/03/13(金) 20:19:38.63ID:3thqY/PO >>811
>>たしかに言語(棋譜)とも言えるし画像とも言えるね
アルファ碁に関しては専門の論文や解説書があるので、ここでは深く言及しないが
将棋でも囲碁もある局面(例えば10手進んだ局面)では画像データになる
19×19の碁盤に白石と黒石が配置された1枚の絵になるので
Googleは画像処理技術を応用したんですよ
猫の画像を入力する代わりに、ある瞬間の棋譜の画像を入力する
猫か猫でないかを判別する代わりに、その局面が優勢か劣勢かを判別する
>>たしかに言語(棋譜)とも言えるし画像とも言えるね
アルファ碁に関しては専門の論文や解説書があるので、ここでは深く言及しないが
将棋でも囲碁もある局面(例えば10手進んだ局面)では画像データになる
19×19の碁盤に白石と黒石が配置された1枚の絵になるので
Googleは画像処理技術を応用したんですよ
猫の画像を入力する代わりに、ある瞬間の棋譜の画像を入力する
猫か猫でないかを判別する代わりに、その局面が優勢か劣勢かを判別する
818ことのは
2020/03/13(金) 20:29:08.90ID:ZeWzgGw6 >>817
>Googleは画像処理技術を応用した
グーグルだから有名な話だと思うけど
じつは他にも同様の例があるんだよ?
たとえば株式市場はチャートで表現できるから
グラフの画像にして画像認識させて
それで株価が上がるか下がるかを出力させようと
でもここで囲碁と大きな違いがあってそれはやはり
囲碁は完全情報だけど株式市場は不完全情報なので
株価を予測できるとは限らない(できない場合が多い)
>Googleは画像処理技術を応用した
グーグルだから有名な話だと思うけど
じつは他にも同様の例があるんだよ?
たとえば株式市場はチャートで表現できるから
グラフの画像にして画像認識させて
それで株価が上がるか下がるかを出力させようと
でもここで囲碁と大きな違いがあってそれはやはり
囲碁は完全情報だけど株式市場は不完全情報なので
株価を予測できるとは限らない(できない場合が多い)
819デフォルトの名無しさん
2020/03/13(金) 20:29:25.88ID:3thqY/PO >>816
あなたとけんかするつもりはないですが、
要件定義はプログラミングとは呼ばない (呼ぶべきではない)
基本設計も同じ
一般に自動化プログラミングと呼ばれるものが過去にもあったけど、
自動化プログラミングとAIとは違いますよね
入力情報と出力結果は自動化プログラミングでもAIでも同じです
自動化プログラミングは仕様書を機械的にプログラム言語に置き換えただけ
AIは別のアプローチでプログラムを作る(探索とか学習とかで)
自動化プログラミングで仕様書からプログラムを作れるのならこれは完全情報ゲームですよ
あなたとけんかするつもりはないですが、
要件定義はプログラミングとは呼ばない (呼ぶべきではない)
基本設計も同じ
一般に自動化プログラミングと呼ばれるものが過去にもあったけど、
自動化プログラミングとAIとは違いますよね
入力情報と出力結果は自動化プログラミングでもAIでも同じです
自動化プログラミングは仕様書を機械的にプログラム言語に置き換えただけ
AIは別のアプローチでプログラムを作る(探索とか学習とかで)
自動化プログラミングで仕様書からプログラムを作れるのならこれは完全情報ゲームですよ
820デフォルトの名無しさん
2020/03/13(金) 20:39:23.40ID:3thqY/PO >>818
意味がわからない
株価予測と株価データからチャートを作成する問題は別
株価チャートを作るプログラミングは完全情報ゲームとして扱わないとプログラムなんか作れませんよね
例えば1カ月分の日足データと、グラフィックライブラリがあれば基本的に作成できるはず
サイズとか期間とか目盛とかいろいろあるんでしょうけど、全部事前に決めてあげるもので
全部決まったら完全情報ゲームですよ
意味がわからない
株価予測と株価データからチャートを作成する問題は別
株価チャートを作るプログラミングは完全情報ゲームとして扱わないとプログラムなんか作れませんよね
例えば1カ月分の日足データと、グラフィックライブラリがあれば基本的に作成できるはず
サイズとか期間とか目盛とかいろいろあるんでしょうけど、全部事前に決めてあげるもので
全部決まったら完全情報ゲームですよ
821デフォルトの名無しさん
2020/03/13(金) 20:49:38.40ID:yORqQ+vG 明地文男、3点チャージ投資法
http://3-charge.b.la9.jp/
日経平均大幅続落で、日経225は、198銘柄が3点チャージ!
「トヨタ」「ホンダ」「キャノン」」などがレア・チャージ!
底値に針を仕掛ければ、一瞬で、数% は上がる!
http://3-charge.b.la9.jp/
日経平均大幅続落で、日経225は、198銘柄が3点チャージ!
「トヨタ」「ホンダ」「キャノン」」などがレア・チャージ!
底値に針を仕掛ければ、一瞬で、数% は上がる!
822デフォルトの名無しさん
2020/03/13(金) 20:50:09.00ID:7lz2hazk そもそも生データがあるのにわざわざチャート画像化して学習する意味あるの?
823ことのは
2020/03/13(金) 20:51:14.93ID:ZeWzgGw6 >>819
株価予測AIが作れても予測が上手くいかないのは
不完全情報ゲームが対象だから、不完全なものになるから
「情報が完全でなければプログラミングは不可能」というよりも
「情報が不完全なら不完全なプログラム」になるということです
つまりプログラムの作成は可能だが機能は不完全だということ
要件定義を通して現実世界とのズレが埋まってないとも言えます
>自動化プログラミングで仕様書から
>プログラムを作れるのならこれは完全情報ゲーム
でもそれは仕様書レベルからの自動化であって
要件レベルから直接的に自動化できるプログラムはまだない
(もしあればプログラマは皆失業する)
たいていの場合は要件というか
自然言語で表現される対象の現実が不完全なので
人工言語の仕様書に落として
人工言語のプログラムに翻訳するという形になる
これはコンパイラ(やインタプリタ)が高級言語を
アセンブラや機械語に翻訳するのと同じ構図でしょう?
だからふり返って昔にはコンパイラの研究が人工知能と
分類されていたのもそんなにおかしくないんだけれど……
それで色んな事をガーッと言ってきたけど、とくに私が言いたい
さしあたりの結論としてはビジネスでは現実とのズレはなくらないということ
または、もしプログラミングは完全でもソフト開発としては不完全ということ
株価予測AIが作れても予測が上手くいかないのは
不完全情報ゲームが対象だから、不完全なものになるから
「情報が完全でなければプログラミングは不可能」というよりも
「情報が不完全なら不完全なプログラム」になるということです
つまりプログラムの作成は可能だが機能は不完全だということ
要件定義を通して現実世界とのズレが埋まってないとも言えます
>自動化プログラミングで仕様書から
>プログラムを作れるのならこれは完全情報ゲーム
でもそれは仕様書レベルからの自動化であって
要件レベルから直接的に自動化できるプログラムはまだない
(もしあればプログラマは皆失業する)
たいていの場合は要件というか
自然言語で表現される対象の現実が不完全なので
人工言語の仕様書に落として
人工言語のプログラムに翻訳するという形になる
これはコンパイラ(やインタプリタ)が高級言語を
アセンブラや機械語に翻訳するのと同じ構図でしょう?
だからふり返って昔にはコンパイラの研究が人工知能と
分類されていたのもそんなにおかしくないんだけれど……
それで色んな事をガーッと言ってきたけど、とくに私が言いたい
さしあたりの結論としてはビジネスでは現実とのズレはなくらないということ
または、もしプログラミングは完全でもソフト開発としては不完全ということ
824ことのは
2020/03/13(金) 20:53:13.98ID:ZeWzgGw6825ことのは
2020/03/13(金) 20:57:53.52ID:ZeWzgGw6 >>822
えーっともちろんべつに画像化しなくても
独自のデータ構造で解析してもいいんだろうけど……
画像化することで画像認識のライブラリが使えるから
少なくとも一から作る手間が省けるとか
一つの試みとしてメリットは存在するでしょうと
えーっともちろんべつに画像化しなくても
独自のデータ構造で解析してもいいんだろうけど……
画像化することで画像認識のライブラリが使えるから
少なくとも一から作る手間が省けるとか
一つの試みとしてメリットは存在するでしょうと
826デフォルトの名無しさん
2020/03/13(金) 21:04:03.31ID:8rhGFCvZ cnnから入った人は
時系列データとか
分からない
時系列データとか
分からない
827ことのは
2020/03/13(金) 21:10:47.88ID:ZeWzgGw6 もちろん画像と違って
株式市場は時系列データだから
そういう処理をしようという考え方もあるよ
言語も時系列データ(音声言語はとくにそうだし)
として扱うのも有効な手法でしょう
囲碁の局面を画像化するという話題が出たから
それの応用が利くような例を挙げただけ
株式市場は時系列データだから
そういう処理をしようという考え方もあるよ
言語も時系列データ(音声言語はとくにそうだし)
として扱うのも有効な手法でしょう
囲碁の局面を画像化するという話題が出たから
それの応用が利くような例を挙げただけ
828デフォルトの名無しさん
2020/03/13(金) 21:15:53.75ID:3thqY/PO >>823
話が発散していて会話が成立しません
まず私が「AIプログラミング」と呼んでいるのは「AIが仕様書に基づいて完全なプログラムを作成すること」です
仕様書が不完全なら当然プログラムは欠陥になります
完全な仕様書を作成するのにもAI分野の技術手法は使えるかもしれませんが
それはここではAIプログラミングとは呼びません (話が発散してしまうので)
基本的なアプローチとして、機械に近い部分から解決していくか、人間に近い部分から解決していくか
というスタンスがあります
いろいろ考え方はあると思いますが、
機械に近い部分から解決されていくだろう…と私は思っています
機械に近い部分は規則や前提条件が明確だからです
詳細仕様書からAIがプログラムを作れるようになれば、次は
基本設計書から詳細仕様書を作る方法は?といった具合に
より曖昧でてこずる領域に進んでいくのだと思います
多分、何十年もかけてね
話が発散していて会話が成立しません
まず私が「AIプログラミング」と呼んでいるのは「AIが仕様書に基づいて完全なプログラムを作成すること」です
仕様書が不完全なら当然プログラムは欠陥になります
完全な仕様書を作成するのにもAI分野の技術手法は使えるかもしれませんが
それはここではAIプログラミングとは呼びません (話が発散してしまうので)
基本的なアプローチとして、機械に近い部分から解決していくか、人間に近い部分から解決していくか
というスタンスがあります
いろいろ考え方はあると思いますが、
機械に近い部分から解決されていくだろう…と私は思っています
機械に近い部分は規則や前提条件が明確だからです
詳細仕様書からAIがプログラムを作れるようになれば、次は
基本設計書から詳細仕様書を作る方法は?といった具合に
より曖昧でてこずる領域に進んでいくのだと思います
多分、何十年もかけてね
829デフォルトの名無しさん
2020/03/13(金) 21:22:12.36ID:3thqY/PO >>824
意味がわかりません
株価予測プログラムならそんなのは無理ですよ
経済学を駆使してでも物理学を駆使しても理論的基盤がないのだからね
せいぜい統計学と確率論でルールを決めうちしてプログラムを作ることになるのでしょう
ルールを決め打ちしてしまったなら、そこから先は「完全情報ゲーム」の世界に移行するのでは?
意味がわかりません
株価予測プログラムならそんなのは無理ですよ
経済学を駆使してでも物理学を駆使しても理論的基盤がないのだからね
せいぜい統計学と確率論でルールを決めうちしてプログラムを作ることになるのでしょう
ルールを決め打ちしてしまったなら、そこから先は「完全情報ゲーム」の世界に移行するのでは?
830デフォルトの名無しさん
2020/03/13(金) 21:30:38.42ID:3thqY/PO >>822
目的次第でしょうね
この会話ではそこがぶれてるのでなかなか一致点を見つけるのがむずかしい
株価予測が目的なら、多分、過去の株価データからパターンを見つけ出して…
というところに学習の意味があるのでは
私が学習と言っているのはAIにプログラムを作らせたい…というのが念頭にあるので、
プログラマが過去に作った大量のプログラムを学習して…というイメージで話しています
目的次第でしょうね
この会話ではそこがぶれてるのでなかなか一致点を見つけるのがむずかしい
株価予測が目的なら、多分、過去の株価データからパターンを見つけ出して…
というところに学習の意味があるのでは
私が学習と言っているのはAIにプログラムを作らせたい…というのが念頭にあるので、
プログラマが過去に作った大量のプログラムを学習して…というイメージで話しています
831デフォルトの名無しさん
2020/03/13(金) 21:53:18.76ID:5Vo4PMAW 完ぺきな株価予測プログラムは存在しないが、
トレーダーの代わりに株の売買が出来るAIは存在するし既に稼働している。
金融工学を極めた高給取りのファンドだって損をしながらギリギリで利益を出してる。
AIに求められる精度は連中と同等で全然オケ
トレーダーの代わりに株の売買が出来るAIは存在するし既に稼働している。
金融工学を極めた高給取りのファンドだって損をしながらギリギリで利益を出してる。
AIに求められる精度は連中と同等で全然オケ
832ことのは
2020/03/13(金) 22:16:05.53ID:ZeWzgGw6 >>828
>話が発散していて会話が成立しません
ではイメージできるよう
具体的なストーリーにしましょう
>「AIプログラミング」と呼んでいるのは
>「AIが仕様書に基づいて完全なプログラムを作成すること」
――という前提なら、「AIプログラミング」の定義上
AIプログラミング自体は完全な仕様書を作成できないので
仕様書は人間(プログラマ)が作ることになるでしょう
プログラムはAIが仕様書から完全に作れるのだから
プログラマには仕様書を書くのが残された仕事になると
するとプログラマのプログラミングとは仕様書書きで
それは自動化できない前提だから不完全な世界なのです
じっさい要件定義は不完全な現実が入ってくるし
となるとプログラミングが「完全でないと不可能」というより
「可能だが不完全」という方が実態に合ってくるでしょう?
まあ正確には逃げ道がいくつもありますけどね
囲碁(のゲームAI)のように完全な世界だけを扱おうとか
仕様書の作成は「プログラミング」ではなく「設計」だとか
仕様書の作成は「プログラマ」ではなく「SE」の仕事だとか
仕様書を自動作成する「メタAIプログラミング」を仮定するとか
>話が発散していて会話が成立しません
ではイメージできるよう
具体的なストーリーにしましょう
>「AIプログラミング」と呼んでいるのは
>「AIが仕様書に基づいて完全なプログラムを作成すること」
――という前提なら、「AIプログラミング」の定義上
AIプログラミング自体は完全な仕様書を作成できないので
仕様書は人間(プログラマ)が作ることになるでしょう
プログラムはAIが仕様書から完全に作れるのだから
プログラマには仕様書を書くのが残された仕事になると
するとプログラマのプログラミングとは仕様書書きで
それは自動化できない前提だから不完全な世界なのです
じっさい要件定義は不完全な現実が入ってくるし
となるとプログラミングが「完全でないと不可能」というより
「可能だが不完全」という方が実態に合ってくるでしょう?
まあ正確には逃げ道がいくつもありますけどね
囲碁(のゲームAI)のように完全な世界だけを扱おうとか
仕様書の作成は「プログラミング」ではなく「設計」だとか
仕様書の作成は「プログラマ」ではなく「SE」の仕事だとか
仕様書を自動作成する「メタAIプログラミング」を仮定するとか
833ことのは
2020/03/13(金) 22:21:37.30ID:ZeWzgGw6834ことのは
2020/03/13(金) 22:29:08.59ID:ZeWzgGw6 >>829
>株価予測プログラムならそんなのは無理ですよ
難しいとは思いますが無理とは断言できないでしょう
「ランダムウォーク仮説」が正しいかどうかは
経済学者でも意見が分かれるのだから
>統計学と確率論でルールを決めうちして
>そこから先は「完全情報ゲーム」の世界に移行
そこは決め打ちしかないとは決まってなくて
ファンダメンタルの情報を引っぱってこよう、
たとえば特許情報の解析は昔からあるけど
その応用で企業の決算書を解析しようとか
いろいろな手法がありえるでしょう
グーグルの機械検索エンジンだって
グーグルが実現するまでは
別に「理論的基盤」とかなかったでしょう?
グーグルがその基盤を作ったわけで
もっと言えばAIやインターネットだって
昔の人は「そんなのは無理」と言ったかもしれない
あまり断定すると技術的な可能性をなくしてしまうので
未来の技術は仮説的な思考で考えることにしています
>株価予測プログラムならそんなのは無理ですよ
難しいとは思いますが無理とは断言できないでしょう
「ランダムウォーク仮説」が正しいかどうかは
経済学者でも意見が分かれるのだから
>統計学と確率論でルールを決めうちして
>そこから先は「完全情報ゲーム」の世界に移行
そこは決め打ちしかないとは決まってなくて
ファンダメンタルの情報を引っぱってこよう、
たとえば特許情報の解析は昔からあるけど
その応用で企業の決算書を解析しようとか
いろいろな手法がありえるでしょう
グーグルの機械検索エンジンだって
グーグルが実現するまでは
別に「理論的基盤」とかなかったでしょう?
グーグルがその基盤を作ったわけで
もっと言えばAIやインターネットだって
昔の人は「そんなのは無理」と言ったかもしれない
あまり断定すると技術的な可能性をなくしてしまうので
未来の技術は仮説的な思考で考えることにしています
835ことのは
2020/03/13(金) 22:33:55.18ID:ZeWzgGw6 >>830
考えが一致するのが目的というより
考えの多様性と生産性が目的なので
別に一致しなくてもいいのです
もし昔の「ルールベースしかない」で
開発者が全員一致したままだったら
自然言語処理の次のステージに進んでなかったし
今の「ルールベースはオワコン」
「機械学習しかない」で全員一致したままでも
さらに次のステージに進んでいかないかもしれないから
考えが一致するのが目的というより
考えの多様性と生産性が目的なので
別に一致しなくてもいいのです
もし昔の「ルールベースしかない」で
開発者が全員一致したままだったら
自然言語処理の次のステージに進んでなかったし
今の「ルールベースはオワコン」
「機械学習しかない」で全員一致したままでも
さらに次のステージに進んでいかないかもしれないから
836ことのは
2020/03/13(金) 22:37:34.48ID:ZeWzgGw6 >>831
>完ぺきな株価予測プログラムは存在しない
完璧な絶望が存在しないようにね……w
>トレーダーの代わりに株の売買が出来る
>AIは存在するし既に稼働している
昔から「株ロボ」とかありましたからね
ただ一方で「ソーシャルトレード」みたいに
あえて人間を使おうという発想もやはりある
まあここでは自然言語処理が本題なんだけど
人間は自然言語を自然に理解できるので
人間に参加させるのは場合によって有力な手段です
>完ぺきな株価予測プログラムは存在しない
完璧な絶望が存在しないようにね……w
>トレーダーの代わりに株の売買が出来る
>AIは存在するし既に稼働している
昔から「株ロボ」とかありましたからね
ただ一方で「ソーシャルトレード」みたいに
あえて人間を使おうという発想もやはりある
まあここでは自然言語処理が本題なんだけど
人間は自然言語を自然に理解できるので
人間に参加させるのは場合によって有力な手段です
837デフォルトの名無しさん
2020/03/13(金) 22:49:42.90ID:3thqY/PO >>832
何を言ってるのか意味がわからん
大雑把な話を避けるために、話の領域(プログラムでいえばスコープ)を限定しようとしてるのに
プログラムを作るのがプログラマの仕事なので、ここがAIができるようになると人間は別の仕事に移行するのは当然ですが
そこに至るまでには多分長い時間がかかると思います
従って上流工程の部分をAIが本質的に解決するのはまだまだ難しい
でもプログラミングだけに限れば結構、条件が揃いつつあるんじゃないでしょうか?
今のIDEも高機能エディタも構文上、次に来るべきワードやシンタクスの候補を教えてくれます
また過去に開発した大量のプログラム資産はAIの学習教材として、かなり役立つはず
ライブラリの使用方法もプログラマが学習するよりもAIの方が得意なはず(本来はね)
問題は、何を解決したいか、必要なデータや資源(ライブラリや仕様書)をどのようにAIに指示・提供したらよいか
そういった部分がまだ手探りといったところ
それでも上流工程よりは条件整備ができつつあるんじゃないかと思ってます
何を言ってるのか意味がわからん
大雑把な話を避けるために、話の領域(プログラムでいえばスコープ)を限定しようとしてるのに
プログラムを作るのがプログラマの仕事なので、ここがAIができるようになると人間は別の仕事に移行するのは当然ですが
そこに至るまでには多分長い時間がかかると思います
従って上流工程の部分をAIが本質的に解決するのはまだまだ難しい
でもプログラミングだけに限れば結構、条件が揃いつつあるんじゃないでしょうか?
今のIDEも高機能エディタも構文上、次に来るべきワードやシンタクスの候補を教えてくれます
また過去に開発した大量のプログラム資産はAIの学習教材として、かなり役立つはず
ライブラリの使用方法もプログラマが学習するよりもAIの方が得意なはず(本来はね)
問題は、何を解決したいか、必要なデータや資源(ライブラリや仕様書)をどのようにAIに指示・提供したらよいか
そういった部分がまだ手探りといったところ
それでも上流工程よりは条件整備ができつつあるんじゃないかと思ってます
838デフォルトの名無しさん
2020/03/13(金) 23:05:21.51ID:3thqY/PO >>834
ランダムウォークは確率論ですよ
正確には確率過程、マルコフ過程の一つです
仮にランダムウォークという手法を使ってみると決めたら、そこから先の作業は「完全情報ゲーム」です
他の手法でも同じ
理論的基盤がないものを使って、解決ができないのは当たり前の話で
だから何が言いたいのかわかりません
大体、株価なんてのは天気の影響も受けるし、コロナの影響も受けるし、為替の影響も受けるし…
つまり理論的学術基盤が何もないので統計や確率でごまかしてるようなもん
ランダムウォークは確率論ですよ
正確には確率過程、マルコフ過程の一つです
仮にランダムウォークという手法を使ってみると決めたら、そこから先の作業は「完全情報ゲーム」です
他の手法でも同じ
理論的基盤がないものを使って、解決ができないのは当たり前の話で
だから何が言いたいのかわかりません
大体、株価なんてのは天気の影響も受けるし、コロナの影響も受けるし、為替の影響も受けるし…
つまり理論的学術基盤が何もないので統計や確率でごまかしてるようなもん
839デフォルトの名無しさん
2020/03/14(土) 13:07:52.69ID:XTUayws2 株で一番確実に儲かるのはインサイダーだす
840デフォルトの名無しさん
2020/03/14(土) 14:13:39.84ID:tSqMYlGi841デフォルトの名無しさん
2020/03/14(土) 14:52:05.88ID:XTUayws2 斬新な区切り方ですねω
842ことのは
2020/03/14(土) 20:40:37.22ID:wiK5yt+U >>832
>>837
結局私が言いたいことは
自然言語処理そのものが不完全だということです
AIプログラミングが完全でも仕様書は作れない
仕様書は自然言語で書かれているから
じゃあ自然言語処理のAIも不完全になる
そしてこの構図で見ると前世紀のルールベースでの
自然言語処理がなぜ挫折したのかよく分かる
Prologは一階述語論理を言語的に実装したもの
述語論理は完全な体系(本当は実装が不完全だが措く)
だが自然言語は述語論理より複雑な体系だから
フレーム問題のようなことが起きてカバーできない
だから完全な基盤があって上手くいく保証がある
って発想自体が自然言語処理では通用しない
8クイーンみたいな箱庭というかトイプロブレムなら
完全に解析できてる問題もあるんだけど
>>837
結局私が言いたいことは
自然言語処理そのものが不完全だということです
AIプログラミングが完全でも仕様書は作れない
仕様書は自然言語で書かれているから
じゃあ自然言語処理のAIも不完全になる
そしてこの構図で見ると前世紀のルールベースでの
自然言語処理がなぜ挫折したのかよく分かる
Prologは一階述語論理を言語的に実装したもの
述語論理は完全な体系(本当は実装が不完全だが措く)
だが自然言語は述語論理より複雑な体系だから
フレーム問題のようなことが起きてカバーできない
だから完全な基盤があって上手くいく保証がある
って発想自体が自然言語処理では通用しない
8クイーンみたいな箱庭というかトイプロブレムなら
完全に解析できてる問題もあるんだけど
843ことのは
2020/03/14(土) 20:46:04.08ID:wiK5yt+U >>837
>今のIDEも高機能エディタも構文上
>次に来るべきワードやシンタクスの候補を教えてくれます
これは日本語漢字入力や検索エンジンと
同じで局所的な問題でしょう
エキスパートシステムという言い方をすれば
前世紀でも部分的にはできていた
将棋や囲碁もエキスパートシステム(弱いAI)
であって強いAIではないから
結局弱いAIをどう使うかという問題になる
>ライブラリの使用方法
ライブラリの依存関係をAIに解かせる
みたいな環境構築の自動化は進展の余地があるでしょう
>問題は、何を解決したいか
>必要なデータや資源(ライブラリや仕様書)
>そういった部分がまだ手探り
要するに自然言語処理はまだ不完全なのです
だからこそ新規アプリを開発する余地がある
枯れきったジャンルだと新規参入は難しいし
>今のIDEも高機能エディタも構文上
>次に来るべきワードやシンタクスの候補を教えてくれます
これは日本語漢字入力や検索エンジンと
同じで局所的な問題でしょう
エキスパートシステムという言い方をすれば
前世紀でも部分的にはできていた
将棋や囲碁もエキスパートシステム(弱いAI)
であって強いAIではないから
結局弱いAIをどう使うかという問題になる
>ライブラリの使用方法
ライブラリの依存関係をAIに解かせる
みたいな環境構築の自動化は進展の余地があるでしょう
>問題は、何を解決したいか
>必要なデータや資源(ライブラリや仕様書)
>そういった部分がまだ手探り
要するに自然言語処理はまだ不完全なのです
だからこそ新規アプリを開発する余地がある
枯れきったジャンルだと新規参入は難しいし
844ことのは
2020/03/14(土) 20:54:19.62ID:wiK5yt+U >>838
やはりグーグルの例で
もしまだ人力ポータルが主流だった頃に
機械検索エンジンが作れると言ったら
「理論的基盤がないから、そんなのは無理ですよ」と言われても
当時はそれなりに説得力があったかもしれません
将棋のAIに機械学習が搭載されてから飛躍的に強くなったけど
昔は「機械学習では強くなれない」みたいな意見があったそうで
今から後出しジャンケンで言えば「何言ってんの」って思えるけど
だから不確実なものは不確実なので
できる訳ないとかできるに決まってるとか
先に決めつけても仕様がないのです
>株価なんてのは天気の影響も受けるし
気温が上がるとアイスクリームが売れるというのは
統計でよくある例だし常識的にも分かることだけど
株価と気温など天候の相関関係を統計的に解析する
というのも可能でしょう。儲かるかどうかは別だけど
固定観念の枠を外して可能性を考えることは
ソフトの開発において有効な考え方だと思います
それは自然言語処理がまだ未解決のジャンルだから
やはりグーグルの例で
もしまだ人力ポータルが主流だった頃に
機械検索エンジンが作れると言ったら
「理論的基盤がないから、そんなのは無理ですよ」と言われても
当時はそれなりに説得力があったかもしれません
将棋のAIに機械学習が搭載されてから飛躍的に強くなったけど
昔は「機械学習では強くなれない」みたいな意見があったそうで
今から後出しジャンケンで言えば「何言ってんの」って思えるけど
だから不確実なものは不確実なので
できる訳ないとかできるに決まってるとか
先に決めつけても仕様がないのです
>株価なんてのは天気の影響も受けるし
気温が上がるとアイスクリームが売れるというのは
統計でよくある例だし常識的にも分かることだけど
株価と気温など天候の相関関係を統計的に解析する
というのも可能でしょう。儲かるかどうかは別だけど
固定観念の枠を外して可能性を考えることは
ソフトの開発において有効な考え方だと思います
それは自然言語処理がまだ未解決のジャンルだから
845ことのは
2020/03/14(土) 21:05:09.18ID:wiK5yt+U >>840
自然言語処理ライブラリ「Camphr」(カンファー)をオープンソースとして公開
https://pkshatech.com/ja/news/2020-03-13/
リンクが崩れているので改めて張り直しました
このCamphrというのは説明を読むと
spaCyのプラグインで
spaCyとは Pythonで動かす自然言語処理ライブラリなので
今はPythonが主流だし開発環境の選択肢になるでしょう
>>839
それはそうですね
違法だけど
自然言語処理ライブラリ「Camphr」(カンファー)をオープンソースとして公開
https://pkshatech.com/ja/news/2020-03-13/
リンクが崩れているので改めて張り直しました
このCamphrというのは説明を読むと
spaCyのプラグインで
spaCyとは Pythonで動かす自然言語処理ライブラリなので
今はPythonが主流だし開発環境の選択肢になるでしょう
>>839
それはそうですね
違法だけど
846デフォルトの名無しさん
2020/03/14(土) 21:06:04.47ID:wCCqI4jt >>842
あなたは自分自身の自然言語が適切か省みたほうがよい
問いかけや課題に対して正面から向き合わず、別の話ばかりしている
>>AIプログラミングが完全でも仕様書は作れない
=>そんな話は私はしていないし、否定もしていない
仕様書をどう作るかという話は私は一度もしていない
できないことを議論しても仕方がない
できること(できそうなこと、可能性ある事)は何かという話をしている
>>だから完全な基盤があって上手くいく保証がある
>>って発想自体が自然言語処理では通用しない
=>そんな話は私はしていないし、否定もしていない
あなたが株価予測を例に挙げたので、株価予測には理論的基盤がないと申し上げた
例が適切ではないという意味だ
私はあなたの意見を全部否定してるわけではない
全部肯定しているわけでもない
どの部分が共感できてどの部分が共感できないか、
互いの関心の範囲がずれていれば、重ねられる部分はどこか
擦り合わせをすることで、自分の考えを補正したり再発見したりできる可能性がある
あなたは自分自身の自然言語が適切か省みたほうがよい
問いかけや課題に対して正面から向き合わず、別の話ばかりしている
>>AIプログラミングが完全でも仕様書は作れない
=>そんな話は私はしていないし、否定もしていない
仕様書をどう作るかという話は私は一度もしていない
できないことを議論しても仕方がない
できること(できそうなこと、可能性ある事)は何かという話をしている
>>だから完全な基盤があって上手くいく保証がある
>>って発想自体が自然言語処理では通用しない
=>そんな話は私はしていないし、否定もしていない
あなたが株価予測を例に挙げたので、株価予測には理論的基盤がないと申し上げた
例が適切ではないという意味だ
私はあなたの意見を全部否定してるわけではない
全部肯定しているわけでもない
どの部分が共感できてどの部分が共感できないか、
互いの関心の範囲がずれていれば、重ねられる部分はどこか
擦り合わせをすることで、自分の考えを補正したり再発見したりできる可能性がある
847デフォルトの名無しさん
2020/03/14(土) 21:49:06.23ID:XX3rV2Gi >>842
>結局私が言いたいことは
>自然言語処理そのものが不完全だということです
ならば「チンポがシコシコする」という日本語表現は、文法的に正しいのか?
チンポ「を」シコシコするのではなくて、チンポ「が」シコシコする。この場合、「チンポ」は主語となる。
オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンポ)が繋がっている場合と、
全体(俺)と部分(チンポ)が別々になっている場合とが考えられる。けれども「チンポ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。
違うか?
「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!
>結局私が言いたいことは
>自然言語処理そのものが不完全だということです
ならば「チンポがシコシコする」という日本語表現は、文法的に正しいのか?
チンポ「を」シコシコするのではなくて、チンポ「が」シコシコする。この場合、「チンポ」は主語となる。
オブジェクト指向で言う「集約」は2種類あって、全体(俺)と部分(チンポ)が繋がっている場合と、
全体(俺)と部分(チンポ)が別々になっている場合とが考えられる。けれども「チンポ」はそれ自体
が独立した生き物であり、所有者の意思とは無関係に、勃起して「シコシコする」。
例えば寝てる時にエロい夢みて朝起きてみたらチンコが勃起して射精してたとか。
違うか?
「胸がドキドキする」は良いが、「チンポがシコシコする」はダメな理由を、50字以内で述べろ!
848デフォルトの名無しさん
2020/03/14(土) 22:32:16.51ID:gKypLAhf 3/15 日 19:30 BS232 自然言語処理の応用 放送大学
849デフォルトの名無しさん
2020/03/15(日) 00:18:30.91ID:FATALO3v >>847
自律神経の働きによって胸は鼓動を打ちチンポは勃起するが、シコシコするのは人の意識のため主体は手となる
NLPの辞書としては、チンポが独立した生き物としての学習は可能だが世界の事実と異なるためデータ数が少なく採用されないだろう
そもそもとして、NLPの不完全性からの問題提起もオブジェクト指向の集約も夢精の例もほぼ意味がなく、生物学の知識だけで解けるという極めて低品質な謎かけ、読みやすさを意識した文体しか褒めるところがないな
自律神経の働きによって胸は鼓動を打ちチンポは勃起するが、シコシコするのは人の意識のため主体は手となる
NLPの辞書としては、チンポが独立した生き物としての学習は可能だが世界の事実と異なるためデータ数が少なく採用されないだろう
そもそもとして、NLPの不完全性からの問題提起もオブジェクト指向の集約も夢精の例もほぼ意味がなく、生物学の知識だけで解けるという極めて低品質な謎かけ、読みやすさを意識した文体しか褒めるところがないな
850デフォルトの名無しさん
2020/03/15(日) 08:22:22.79ID:FJtUQr7v 若い人なのかな、想いが先行して色々足りてない
851デフォルトの名無しさん
2020/03/15(日) 08:26:59.82ID:xDhRa7pP 世界の事実?
>>849
>チンポが独立した生き物としての学習は可能だが世界の事実と異なるため
化学の元素なるものは空想である、物理的エネルギーなどというのも空想である。
だいたい、客観的事実存在という観念なるものが大いなる空想である。
今日の実験や科学はけっして空想を排斥することはできないのである。
>>849
>チンポが独立した生き物としての学習は可能だが世界の事実と異なるため
化学の元素なるものは空想である、物理的エネルギーなどというのも空想である。
だいたい、客観的事実存在という観念なるものが大いなる空想である。
今日の実験や科学はけっして空想を排斥することはできないのである。
852デフォルトの名無しさん
2020/03/15(日) 11:00:04.12ID:80PNSiLp >>845
損みたいに自分の自社株持ってる人がコメントで株価操作出来る人は違法で逮捕されないのはなぜなんだぜ?
損みたいに自分の自社株持ってる人がコメントで株価操作出来る人は違法で逮捕されないのはなぜなんだぜ?
853デフォルトの名無しさん
2020/03/15(日) 11:48:26.52ID:X5C4uG55 株価が大きく動いた後で重大なニュースが発表されるということがよくある
間違いなくインサイダーなんだろうが、逮捕されたという話を聞いたことがない
間違いなくインサイダーなんだろうが、逮捕されたという話を聞いたことがない
854デフォルトの名無しさん
2020/03/15(日) 13:00:47.42ID:+iUdlEB1855デフォルトの名無しさん
2020/03/15(日) 13:21:03.46ID:FJtUQr7v このマウンティング合戦でどうしたいの?
856デフォルトの名無しさん
2020/03/15(日) 22:14:42.53ID:jeoNoYB+ 俺が一番偉い。みんな跪け。
これでトップはすでに決まった。
以降のマウンティングは無意味である。
これでトップはすでに決まった。
以降のマウンティングは無意味である。
857デフォルトの名無しさん
2020/03/16(月) 07:10:30.47ID:xhPu6vsp NICTからBERTのモデルが公開されたね
これはとても良いこと
これはとても良いこと
858デフォルトの名無しさん
2020/03/16(月) 07:20:50.25ID:x9PNMypw マウンティングの相手はbotだった
859デフォルトの名無しさん
2020/03/19(木) 09:38:18.82ID:WwJ6LrXC ロゼッタのBLEUが90あたりだそうで
0.2ポイント上がった(笑)とかでドヤ顔で論文出して喜んでいたのはなんだったんだろう、て思う
0.2ポイント上がった(笑)とかでドヤ顔で論文出して喜んでいたのはなんだったんだろう、て思う
860デフォルトの名無しさん
2020/03/20(金) 10:39:18.21ID:01DcwsDi >>530
>例えば、現実の世界に、円形をした物はたくさん存在するが、いずれも完全な円ではないし円そのものでもない。
例えばですけど、僕の知り合いが中学生のころ、数学で「√3は無理数なのに、1:2:√3の直角三角形は現実に存在する。
実物の三角形の√3の端はどうなっているんだ?」と疑問に思って親に聞いたところ答えられなかったことがあったそうです。
https://news.nicovideo.jp/watch/nw6859935?news_ref=top_topiclist
>例えば、現実の世界に、円形をした物はたくさん存在するが、いずれも完全な円ではないし円そのものでもない。
例えばですけど、僕の知り合いが中学生のころ、数学で「√3は無理数なのに、1:2:√3の直角三角形は現実に存在する。
実物の三角形の√3の端はどうなっているんだ?」と疑問に思って親に聞いたところ答えられなかったことがあったそうです。
https://news.nicovideo.jp/watch/nw6859935?news_ref=top_topiclist
861デフォルトの名無しさん
2020/03/20(金) 10:43:42.62ID:nAHhYb7g 虚数は存在しない(これも嘘だが)とされているが
無理数は実在するからな
無理数は実在するからな
862デフォルトの名無しさん
2020/03/20(金) 11:06:28.44ID:01DcwsDi >>849
>チンポは勃起するが、シコシコするのは人の意識のため
意識するのもチンポの働きなんだが?
<俺>
「 部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。 」
<チンポ>
「 その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。 」
>チンポは勃起するが、シコシコするのは人の意識のため
意識するのもチンポの働きなんだが?
<俺>
「 部屋の英子がこちらを向いた気配に、彼は勃○した陰○を外から障子に突きたてた。障子は乾いた音をたてて破れ、
それを見た英子は読んでいた本を力一杯障子にぶつけたのだ。本は見事、的に当って畳に落ちた。 」
<チンポ>
「 その瞬間、竜哉は体中が引き締まるような快感を感じた。彼は今、リングで感じるあのギラギラした、
抵抗される人間の喜びを味わったのだ。 」
863デフォルトの名無しさん
2020/03/23(月) 08:01:20.83ID:EBRrgZo4 中澤さん、必死やんw
https://twitter.com/Tzawa/status/1241647447790608384
https://twitter.com/5chan_nel (5ch newer account)
https://twitter.com/Tzawa/status/1241647447790608384
https://twitter.com/5chan_nel (5ch newer account)
864デフォルトの名無しさん
2020/03/23(月) 15:24:05.32ID:9h5nrsHl まあ確信犯やろなあ
https://i.imgur.com/xZcndZq.jpg
https://i.imgur.com/xZcndZq.jpg
865デフォルトの名無しさん
2020/03/23(月) 15:30:52.77ID:QFUl7nfE つまらんレスすんな
866デフォルトの名無しさん
2020/03/23(月) 15:43:41.09ID:K7Q6+7NK867デフォルトの名無しさん
2020/03/26(木) 19:10:51.36ID:d0aopsHm868デフォルトの名無しさん
2020/03/30(月) 09:51:52.14ID:k79WWqQa Google翻訳ってコーパスどうしているんだろう?
WEBサイトから集めて自動アライン?
WEBサイトから集めて自動アライン?
869デフォルトの名無しさん
2020/03/31(火) 00:48:25.33ID:sE4QkNC9 そんな高度なことはせずに、wiki+αでコスト重視だと思う
870デフォルトの名無しさん
2020/03/31(火) 08:22:25.84ID:FV+T/yCu 足りなくない?
特許明細書とかは?
特許明細書とかは?
871デフォルトの名無しさん
2020/04/05(日) 20:35:26.03ID:PrdRHcmB 942名無し三等兵2020/04/04(土) 08:20:34.27ID:VRY1NLOI
なんでカスミンを揶揄するとチンポ厨が牽制に出てくるんだろう
「正確な記述を心がけています」とかのたまったカスミンが「チンポがシコシコする」の語法的誤りには全く触れないのも変だし
カスミンが直接返答するとプライドに傷付くようなレスにばかりチンポ厨が牽制を入れるのも不自然だし
カスミンとチンポ厨は共依存で嫌われ者同士で援護しあう関係でしょうか
「カスミンはホモ」
なんでカスミンを揶揄するとチンポ厨が牽制に出てくるんだろう
「正確な記述を心がけています」とかのたまったカスミンが「チンポがシコシコする」の語法的誤りには全く触れないのも変だし
カスミンが直接返答するとプライドに傷付くようなレスにばかりチンポ厨が牽制を入れるのも不自然だし
カスミンとチンポ厨は共依存で嫌われ者同士で援護しあう関係でしょうか
「カスミンはホモ」
872デフォルトの名無しさん
2020/04/06(月) 17:36:18.80ID:NiaaJxMA 204 名無し三等兵 sage 2020/04/06(月) 14:56:56.40 ID:K9vi7RPu
本が読書する
ニンジンが料理する
これが妙だと思わない脳の持ち主ってどうよ? と思っていたが、脳がチンポなら仕方ない
ただし人間扱いしてやる理由もない
本が読書する
ニンジンが料理する
これが妙だと思わない脳の持ち主ってどうよ? と思っていたが、脳がチンポなら仕方ない
ただし人間扱いしてやる理由もない
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国国営メディア「沖縄は日本ではない」… ★6 [BFU★]
- 高市政権にパイプ役不在…日中高まる緊張 公明党の連立離脱影響、自民内にも懸念「自分でまいた種は自分で刈り取ってもらわないと」★2 [ぐれ★]
- 【速報】 日経平均の下落率3%超す、財政懸念で長期金利上昇 [お断り★]
- 【速報】 高市政権、「日本版DOGE」を立ち上げ 米国で歳出削減をした「政府効率化省(DOGE)」になぞらえたもの [お断り★]
- 台湾声明 「台湾は独立した主権国家、中国は台湾を統治したことがなく、中国は口出しする権利ない」 中国が高市首相に抗議で ★7 [お断り★]
- 【こんなの初めて…】民泊には既にキャンセルも 中国の渡航自粛で ★2 [ぐれ★]
- 【日刊】暇空茜、また敗訴🥸 [359965264]
- 台湾政党が高市首相「存立危機事態」発言に感謝の書簡「我々の心を強く奮い立たせるものでした」 [834922174]
- 中国「高市が謝罪撤回しないとこれ全部なくなるけどどうする?」 [931948549]
- 高市のプライドはエベレストより高い。だから、発言を撤回できない [805596214]
- 【正論】有識者「高市早苗に合理的配慮をしなかった野党が悪い」 [175344491]
- 日経平均、49000円割れ 国賊高市を許すな ★2 [402859164]
