このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。
探検
自然言語処理スレッド その5
■ このスレッドは過去ログ倉庫に格納されています
2018/09/17(月) 11:48:10.55ID:rTQuL7Ni
724デフォルトの名無しさん
2020/03/06(金) 10:24:45.48ID:C1NEJCD5725デフォルトの名無しさん
2020/03/06(金) 14:58:12.75ID:7RRa/W6z おまえら自然言語処理って何を想定して話してるん?
1)形態素解析
2)構文解析
3)意味解析
4)文脈解析
1)と2)は昔からあった技術だし、新奇性はあんまりないな
昔はLISPがデフォルトだったのがpythonが出てきて風が吹いた?
3)と4)とりわけ4)はニューラルネットの成功で昨今花形分野になってるが
1)形態素解析
2)構文解析
3)意味解析
4)文脈解析
1)と2)は昔からあった技術だし、新奇性はあんまりないな
昔はLISPがデフォルトだったのがpythonが出てきて風が吹いた?
3)と4)とりわけ4)はニューラルネットの成功で昨今花形分野になってるが
726デフォルトの名無しさん
2020/03/06(金) 15:09:48.66ID:sKEI9Mym 全部
end-to-endでできるのが綺麗
素敵
end-to-endでできるのが綺麗
素敵
727デフォルトの名無しさん
2020/03/06(金) 15:12:58.31ID:7RRa/W6z728デフォルトの名無しさん
2020/03/06(金) 16:06:20.07ID:sKEI9Mym やりたいのは機械翻訳なんだけど
729708
2020/03/06(金) 18:14:05.74ID:Z17kfdKR730ことのは
2020/03/06(金) 18:17:16.96ID:Z17kfdKR731ことのは
2020/03/06(金) 18:20:37.52ID:Z17kfdKR >>725
>LISPがデフォルト
Prologは面白いと思う
マイナーだけど今でも
>pythonが出てきて
一番普及してる言語ってだけで
Pythonだから新しく
何かできるってのはあまりないな
もちろんライブラリは別の話
>LISPがデフォルト
Prologは面白いと思う
マイナーだけど今でも
>pythonが出てきて
一番普及してる言語ってだけで
Pythonだから新しく
何かできるってのはあまりないな
もちろんライブラリは別の話
732ことのは
2020/03/06(金) 18:20:53.57ID:Z17kfdKR733ことのは
2020/03/06(金) 18:24:57.45ID:Z17kfdKR734ことのは
2020/03/06(金) 18:26:30.58ID:Z17kfdKR735デフォルトの名無しさん
2020/03/07(土) 09:29:39.56ID:RxuNI4Xs データの気持ち、コーパスの気持ち、翻訳するときの頭の使い方を
ニューラルネットワークの構造に落とし込めたらいいな、と思う
ニューラルネットワークの構造に落とし込めたらいいな、と思う
736デフォルトの名無しさん
2020/03/07(土) 10:20:20.91ID:7h4/v12R じじくさい
737デフォルトの名無しさん
2020/03/07(土) 17:34:56.58ID:RZgTMQsN Pythonはバランスが良い
C#は過小評価されてる
Rubyは過大評価されてる
VBやPHPは話にならない
COBOLやFORTRANはオワコン
C#は過小評価されてる
Rubyは過大評価されてる
VBやPHPは話にならない
COBOLやFORTRANはオワコン
738デフォルトの名無しさん
2020/03/07(土) 17:59:21.47ID:f259p7qQ 放送大学で自然言語処理の講義
739デフォルトの名無しさん
2020/03/07(土) 18:14:12.57ID:RZgTMQsN mecabと秋山さんのやつかな
740デフォルトの名無しさん
2020/03/07(土) 21:31:13.53ID:rbjTQwyv 少し違うがタロットカード解釈みたいなもんか。
良い占いの結果を期待しだすとキリがない。
良い占いの結果を期待しだすとキリがない。
741ことのは
2020/03/08(日) 00:29:38.45ID:q3PBpoad たとえばIBMのワトソンでも
Prologが使われていたよね
機械学習の発展が昔と一番違う所だけど
他が全部不要になるまでではないと思う
Prologが使われていたよね
機械学習の発展が昔と一番違う所だけど
他が全部不要になるまでではないと思う
742ことのは
2020/03/08(日) 00:41:24.43ID:q3PBpoad 機械翻訳は昔のルールベースがあって
次に統計的フレーズベースがあって
今のニューラルネットと段階がある
フレーズベースとニューラルでも大違いだが
ニューラルは段違いに計算資源を使うので
その辺も個人や零細だと参入障壁になる
そんなの知ってるとか思うかもしれないけど
今の自然言語処理の状況を整理してる段階ね
次に統計的フレーズベースがあって
今のニューラルネットと段階がある
フレーズベースとニューラルでも大違いだが
ニューラルは段違いに計算資源を使うので
その辺も個人や零細だと参入障壁になる
そんなの知ってるとか思うかもしれないけど
今の自然言語処理の状況を整理してる段階ね
743ことのは
2020/03/08(日) 01:03:13.55ID:q3PBpoad だから計算量のこともあるし
あと集客力とかもあるから
グーグルと真っ向勝負するのは厳しい
ただそれでもやり方はあると思うんだ
ライオンが食べた後の骨についた肉に
ハイエナがかじりつくようなやり方だけど
たとえば海外のサイトで有用な情報があって
そのサイトの翻訳に特化したアプリを作って
(公開するのは翻訳権の問題があるけど)
個人的に何かの商売に生かすとかね
そういう風に正面突破できなくても迂回したら
成立するアプリとかサービスとかあるはず
あと集客力とかもあるから
グーグルと真っ向勝負するのは厳しい
ただそれでもやり方はあると思うんだ
ライオンが食べた後の骨についた肉に
ハイエナがかじりつくようなやり方だけど
たとえば海外のサイトで有用な情報があって
そのサイトの翻訳に特化したアプリを作って
(公開するのは翻訳権の問題があるけど)
個人的に何かの商売に生かすとかね
そういう風に正面突破できなくても迂回したら
成立するアプリとかサービスとかあるはず
744ことのは
2020/03/08(日) 01:07:40.15ID:q3PBpoad グーグルのディープラーニングで
AIブームが来て自然言語処理も
周辺だけど波が来てるはず
この世界的ビッグウェーブに乗るしかない
逃したらまたAI冬の時代みたいになるかも
というかすでにピーク過ぎてる恐れもある
なのにこのスレは年中
「チンポでシコシコ」とか
ブツブツ言ってるだけで
世の中の流れに乗れてない
けどそれだと人生損する恐れがあるので
みんなでブレインストーミングというか
ちょっとずつ情報を持ち寄って
見通しを立てる位はできる場にしたい
と思ってコテハンになった訳だけど
もう少し話題を出していくね
AIブームが来て自然言語処理も
周辺だけど波が来てるはず
この世界的ビッグウェーブに乗るしかない
逃したらまたAI冬の時代みたいになるかも
というかすでにピーク過ぎてる恐れもある
なのにこのスレは年中
「チンポでシコシコ」とか
ブツブツ言ってるだけで
世の中の流れに乗れてない
けどそれだと人生損する恐れがあるので
みんなでブレインストーミングというか
ちょっとずつ情報を持ち寄って
見通しを立てる位はできる場にしたい
と思ってコテハンになった訳だけど
もう少し話題を出していくね
745ことのは
2020/03/08(日) 01:14:04.80ID:q3PBpoad たとえばスマートスピーカーの普及と
それに伴う音声認識や自然言語処理の需要はある
ってのはこの分野に関わってれば自然と分かるはず
だけどそこからもうひとひねりして
たとえば最近ブームになったRPAと
結びつけられるアプリやサービスはできないかとか
まあRPAもピーク過ぎた感もあるけど
付加価値があれば生き残れるかもしれない
それに伴う音声認識や自然言語処理の需要はある
ってのはこの分野に関わってれば自然と分かるはず
だけどそこからもうひとひねりして
たとえば最近ブームになったRPAと
結びつけられるアプリやサービスはできないかとか
まあRPAもピーク過ぎた感もあるけど
付加価値があれば生き残れるかもしれない
746ことのは
2020/03/08(日) 01:18:54.01ID:q3PBpoad もちろんRPAはたとえばの話で
他にも色々あるだろう
思いついたら書いていくけど
たぶんグーグルとかIT大資本と
正面から勝負するのは厳しい
まずサーバとかのインフラが違うから
もちろん技術の理解の深さとか全部違うけど
開発リソースが限られている中で
最終的にビジネス的に成功するには
既存の要素の組み合わせで
差別化していくしか生き残る道はないと思う
他にも色々あるだろう
思いついたら書いていくけど
たぶんグーグルとかIT大資本と
正面から勝負するのは厳しい
まずサーバとかのインフラが違うから
もちろん技術の理解の深さとか全部違うけど
開発リソースが限られている中で
最終的にビジネス的に成功するには
既存の要素の組み合わせで
差別化していくしか生き残る道はないと思う
747デフォルトの名無しさん
2020/03/08(日) 02:51:55.21ID:UdQenuRT 日本は国家プロジェクトとしてGoogleに対抗するくらいの本気度みせてほしいね
1950年頃はコンピュータ産業を育成するために産業編成までやって通産省が主導した歴史がある
中国は国を挙げてリソースを投入するから、後発といえども侮れない
1950年頃はコンピュータ産業を育成するために産業編成までやって通産省が主導した歴史がある
中国は国を挙げてリソースを投入するから、後発といえども侮れない
748デフォルトの名無しさん
2020/03/08(日) 05:25:44.76ID:Ll0mxARo >>747
livedoorとかは?
livedoorとかは?
749デフォルトの名無しさん
2020/03/08(日) 10:06:53.38ID:Q9GXCt8T それ失敗した奴じゃん。。。
今は翻訳バンクやってるけど
コーパスに容易にアクセスできない代物だし
今は翻訳バンクやってるけど
コーパスに容易にアクセスできない代物だし
750デフォルトの名無しさん
2020/03/08(日) 14:01:27.38ID:Y2NtS7Rm ●●省が主導すると碌なことにならない
751デフォルトの名無しさん
2020/03/08(日) 15:17:22.02ID:Q9GXCt8T 今更富士通がawsに対抗するクラウドを出すそうで(笑)
官公庁の仕事をとれるだろうけど
サービスの質悪いだろうなあ
官公庁の仕事をとれるだろうけど
サービスの質悪いだろうなあ
752デフォルトの名無しさん
2020/03/08(日) 15:21:57.90ID:OXOR+ex7753デフォルトの名無しさん
2020/03/08(日) 15:39:50.62ID:uM4e1gtU オブジェクトの多重継承だが?
>>744
>なのにこのスレは年中
>「チンポでシコシコ」とか
>ブツブツ言ってるだけで
>世の中の流れに乗れてない
511 デフォルトの名無しさん 2018/10/29(月) 23:32:40.68 ID:LL+W6ENh
随意筋←implements─チンポ─implements→不随意筋
チンコの随意筋と不随意筋
http://d.hatena.ne.jp/tottokotokoroten/touch/20130516/1368716650
>>744
>なのにこのスレは年中
>「チンポでシコシコ」とか
>ブツブツ言ってるだけで
>世の中の流れに乗れてない
511 デフォルトの名無しさん 2018/10/29(月) 23:32:40.68 ID:LL+W6ENh
随意筋←implements─チンポ─implements→不随意筋
チンコの随意筋と不随意筋
http://d.hatena.ne.jp/tottokotokoroten/touch/20130516/1368716650
754デフォルトの名無しさん
2020/03/08(日) 15:42:10.97ID:uM4e1gtU チンポは主格であって手段では無いぞ?
>>744
>なのにこのスレは年中
>「チンポでシコシコ」とか
格助詞「で」(手段)
https://www.tomojuku.com/blog/particle-de/
>>744
>なのにこのスレは年中
>「チンポでシコシコ」とか
格助詞「で」(手段)
https://www.tomojuku.com/blog/particle-de/
755ことのは
2020/03/09(月) 04:31:00.91ID:ajCpPJPb >>747
>国家プロジェクト
「第五世代コンピュータ」計画が失敗したからね
ただ個人的には失敗覚悟でもいいから
また挑戦して欲しい位に思ってる
日本のIT産業はGAFAに支配されてジリ貧だし
ハコモノとかは日常的に税金投入してるから
>国家プロジェクト
「第五世代コンピュータ」計画が失敗したからね
ただ個人的には失敗覚悟でもいいから
また挑戦して欲しい位に思ってる
日本のIT産業はGAFAに支配されてジリ貧だし
ハコモノとかは日常的に税金投入してるから
756ことのは
2020/03/09(月) 04:32:31.19ID:ajCpPJPb >>748
livedoor ニュースコーパス
https://www.rondhuit.com/download.html#ldcc
何の話? ググったら
これだけ見つかったけど
なるべくリンク貼って
livedoor ニュースコーパス
https://www.rondhuit.com/download.html#ldcc
何の話? ググったら
これだけ見つかったけど
なるべくリンク貼って
757ことのは
2020/03/09(月) 04:35:09.72ID:ajCpPJPb >>749
翻訳バンク
https://h-bank.nict.go.jp
『翻訳バンク』の運用開始 NICT
https://www.nict.go.jp/press/2017/09/08-1.html
NICT、翻訳エンジン安価に提供「翻訳バンク制度」 日経
https://www.nikkei.com/article/DGXMZO20926660Y7A900C1000000/
これね
翻訳バンク
https://h-bank.nict.go.jp
『翻訳バンク』の運用開始 NICT
https://www.nict.go.jp/press/2017/09/08-1.html
NICT、翻訳エンジン安価に提供「翻訳バンク制度」 日経
https://www.nikkei.com/article/DGXMZO20926660Y7A900C1000000/
これね
758ことのは
2020/03/09(月) 04:39:37.77ID:ajCpPJPb >>751
富士通が政府向けのクラウド事業に本格参入、AWSに対抗へ 日経XTECH
https://xtech.nikkei.com/atcl/nxt/news/18/07236/
官公庁専用のプライベートクラウドみたいなのか?
こういうのは「御用クラウド」って感じで
利権の温床になりそうな気もする
ハコモノがITのインフラになっただけで
でも外資から海外に資金が逃げるよりは
国内に金を落としてくれた方がいいよね
やたら割高でなければという前提だけど
個人的な結論としては
GAFAのIT植民地よりは御用クラウドの方がマシ!
富士通が政府向けのクラウド事業に本格参入、AWSに対抗へ 日経XTECH
https://xtech.nikkei.com/atcl/nxt/news/18/07236/
官公庁専用のプライベートクラウドみたいなのか?
こういうのは「御用クラウド」って感じで
利権の温床になりそうな気もする
ハコモノがITのインフラになっただけで
でも外資から海外に資金が逃げるよりは
国内に金を落としてくれた方がいいよね
やたら割高でなければという前提だけど
個人的な結論としては
GAFAのIT植民地よりは御用クラウドの方がマシ!
759ことのは
2020/03/09(月) 04:43:10.17ID:ajCpPJPb 雑談も普通の開発に近づいてるね
スレが前よりマシになってきたと思う
AIブームもピーク過ぎてるし
ここ数年が勝負な気がしてる
その間くらいスレが機能してて欲しい
スレが前よりマシになってきたと思う
AIブームもピーク過ぎてるし
ここ数年が勝負な気がしてる
その間くらいスレが機能してて欲しい
760ことのは
2020/03/09(月) 04:58:35.38ID:ajCpPJPb >>745
このアイディアにもうちょいつけ足しておくと
たとえばチャットボットをRPAの
インターフェイスにするのはどうか?
何となくRPAのスクレイピングとかと
ボットの相性が良さそうな気がしてる
それ昔から言われてる「対話システム」じゃん
って思うかもしれないけど
文脈を業務に限定してるから
一般的な会話よりは作りやすいはず
こういうのあまり手の内を明かすと
先を越して作られちゃうから
思わせぶりにキーワードだけ言うしかなくて
深く説明できなくてもどかしいんだけど
察することができる人はイメージできるはず
このアイディアにもうちょいつけ足しておくと
たとえばチャットボットをRPAの
インターフェイスにするのはどうか?
何となくRPAのスクレイピングとかと
ボットの相性が良さそうな気がしてる
それ昔から言われてる「対話システム」じゃん
って思うかもしれないけど
文脈を業務に限定してるから
一般的な会話よりは作りやすいはず
こういうのあまり手の内を明かすと
先を越して作られちゃうから
思わせぶりにキーワードだけ言うしかなくて
深く説明できなくてもどかしいんだけど
察することができる人はイメージできるはず
761ことのは
2020/03/09(月) 05:19:14.75ID:ajCpPJPb なんでオレがこのスレを再興しようとしているかというと
自然言語処理ってどんな方向性で何を作るかが
大きいジャンルだなって気がしてるから
過去をふり返るとそれが分かりやすくなる
ここが2ちゃん(5ちゃん)だけど
開設者のひろゆきが2ちゃんを作った頃は
普通の掲示板とか作っただけで成功できたよね?
ただ今はもうAIとか付加価値ないと後発は厳しい
だから自然言語処理を武器にしたいんだけど
自然言語処理って方向性でかなり違うものができるよね?
テキストマイニングだとほとんど統計だし
逆に文法をつつく分野もあるし機械学習もある
もちろん自然言語処理の論文とかも読んでるんだけど
そういうのは文法とかの細かい重箱の隅をつついてて
全体像がつかみにくいんで
あたりを見渡せる広場みたいな所が欲しいと思った次第
自然言語処理ってどんな方向性で何を作るかが
大きいジャンルだなって気がしてるから
過去をふり返るとそれが分かりやすくなる
ここが2ちゃん(5ちゃん)だけど
開設者のひろゆきが2ちゃんを作った頃は
普通の掲示板とか作っただけで成功できたよね?
ただ今はもうAIとか付加価値ないと後発は厳しい
だから自然言語処理を武器にしたいんだけど
自然言語処理って方向性でかなり違うものができるよね?
テキストマイニングだとほとんど統計だし
逆に文法をつつく分野もあるし機械学習もある
もちろん自然言語処理の論文とかも読んでるんだけど
そういうのは文法とかの細かい重箱の隅をつついてて
全体像がつかみにくいんで
あたりを見渡せる広場みたいな所が欲しいと思った次第
762デフォルトの名無しさん
2020/03/10(火) 09:39:50.57ID:iWnmXddY NLPは人に説明してアイデアを出してもらうのも難しい
今やってるインタラクション2020の猫の咀嚼音で個体識別なんかまさに良い意味で素人の発想であり、画像や音声の機械学習による分類がいかにモジュール化可能でわかりやすいことか
それに対し、NLPはどこからどこまでがNLPで情報学との境界もわかりにくく、さらには抽象度も高くドメイン特化アプリも想像し難い
ぜひ違った視点があれば教えてほちい
今やってるインタラクション2020の猫の咀嚼音で個体識別なんかまさに良い意味で素人の発想であり、画像や音声の機械学習による分類がいかにモジュール化可能でわかりやすいことか
それに対し、NLPはどこからどこまでがNLPで情報学との境界もわかりにくく、さらには抽象度も高くドメイン特化アプリも想像し難い
ぜひ違った視点があれば教えてほちい
763デフォルトの名無しさん
2020/03/10(火) 11:55:05.84ID:RfnZsUZw AIブームはピークを過ぎたが、打つ手が無くて収束した感じ
ハードルの低い画像認識ですら業務に適用できずに、
データ入力や目視検査も自動化出来ずに人頼み
ハードルの低い画像認識ですら業務に適用できずに、
データ入力や目視検査も自動化出来ずに人頼み
764デフォルトの名無しさん
2020/03/10(火) 12:41:48.11ID:X2DkodOC どのように使えない?
765デフォルトの名無しさん
2020/03/10(火) 13:41:30.99ID:178Z7LTW >>763
ブームだったのは真似っこAIだけでしょ
ブームだったのは真似っこAIだけでしょ
766デフォルトの名無しさん
2020/03/10(火) 17:39:33.18ID:TkMaYglQ BLEU88だそうで(笑)
https://www.rozetta.jp/download/2020030901.pdf
https://www.rozetta.jp/download/2020030901.pdf
767ことのは
2020/03/11(水) 00:23:49.18ID:bLDtqUyj >>762
良いよ! だいぶ生産的な雰囲気が出てきたね?
>猫の咀嚼音で個体識別
面白い研究だな! 実用性は不明だけど
将来的に家畜の管理とかに使えるかもね
で、NLPの話に戻るとたとえば
その画像や音声の力を借りちゃうとか?
表情や声色を画像認識や音声認識して
感情を読み取って文脈の情報として与えるとか
「マルチモーダル」みたいな概念も昔からあるけど
文脈解析が難航してるからそういう道もありそう
良いよ! だいぶ生産的な雰囲気が出てきたね?
>猫の咀嚼音で個体識別
面白い研究だな! 実用性は不明だけど
将来的に家畜の管理とかに使えるかもね
で、NLPの話に戻るとたとえば
その画像や音声の力を借りちゃうとか?
表情や声色を画像認識や音声認識して
感情を読み取って文脈の情報として与えるとか
「マルチモーダル」みたいな概念も昔からあるけど
文脈解析が難航してるからそういう道もありそう
768ことのは
2020/03/11(水) 00:25:00.07ID:bLDtqUyj >>762
NPLが分かりにくいっていう話への応答としては
NPLの技術を始点にしてどう使うかか考えるだけでなく
実用シーンから逆算して当てはまる技術を使うのも有効そう
っていうのもたとえばさっきの話で言うと
サポセンで使うソフトなら
感情(とくに怒り)を読み取ることも有効だろうし
文法とか辞書から正攻法で攻めるのも大事だが
研究でなくビジネスアプリだと他との競争だから
実用化にはどっか抜け道を探さないといけない
NPLが分かりにくいっていう話への応答としては
NPLの技術を始点にしてどう使うかか考えるだけでなく
実用シーンから逆算して当てはまる技術を使うのも有効そう
っていうのもたとえばさっきの話で言うと
サポセンで使うソフトなら
感情(とくに怒り)を読み取ることも有効だろうし
文法とか辞書から正攻法で攻めるのも大事だが
研究でなくビジネスアプリだと他との競争だから
実用化にはどっか抜け道を探さないといけない
769ことのは
2020/03/11(水) 00:30:53.18ID:bLDtqUyj >>763
AIブームのピークは過ぎても
まだ打つ手はあると思うけどな?
たとえば掃除ロボットに消毒液を噴霧させれば
感染症の対策になる(中国が実際やってる)し
同じ技術にどう付加価値を付けていくかという
「枯れた技術の水平思考」みたいなことだと思う
あとAI単体で完結せず人間の作業支援ソフトにするとか
人間が関わることで問題が解決できることもよくある
たとえば画像認識でAIだけだと100%補足できないけど
取りこぼしたものを人間がチェックするとかで
トータルの生産性が上がるなら導入するだろうし
そして自然言語処理はもっとハードル高いんだから
そういう人間との共同作業の余地は大きいと思う
AIブームのピークは過ぎても
まだ打つ手はあると思うけどな?
たとえば掃除ロボットに消毒液を噴霧させれば
感染症の対策になる(中国が実際やってる)し
同じ技術にどう付加価値を付けていくかという
「枯れた技術の水平思考」みたいなことだと思う
あとAI単体で完結せず人間の作業支援ソフトにするとか
人間が関わることで問題が解決できることもよくある
たとえば画像認識でAIだけだと100%補足できないけど
取りこぼしたものを人間がチェックするとかで
トータルの生産性が上がるなら導入するだろうし
そして自然言語処理はもっとハードル高いんだから
そういう人間との共同作業の余地は大きいと思う
770ことのは
2020/03/11(水) 00:36:03.13ID:bLDtqUyj >>766
ロゼッタのソフトで「翻訳メモリ」を利用して
自動翻訳を生成するって工夫はなるほどだね!
(「超絶」って言葉は煽り過ぎだと思うけどw)
少し前に機械翻訳とエンドツーエンドの話があったけど
まだ難しい部分は残ってるし、もしできたとしても
グーグルの機械学習ライブラリをそのまま使うだけで
グーグル翻訳の精度を抜くとかちょっとありえないはず
だから機械学習が強力なエンジンだとしても
既存の技術との組み合わせが必要だと個人的に考えてる
この翻訳メモリ利用なんかはまさしくその例だね
あとこの例は機械翻訳だけじゃなくて
別の分野に応用できそうだね
たとえばだけど自動要約でも
欲しい情報が残せるようになるとか?
ロゼッタのソフトで「翻訳メモリ」を利用して
自動翻訳を生成するって工夫はなるほどだね!
(「超絶」って言葉は煽り過ぎだと思うけどw)
少し前に機械翻訳とエンドツーエンドの話があったけど
まだ難しい部分は残ってるし、もしできたとしても
グーグルの機械学習ライブラリをそのまま使うだけで
グーグル翻訳の精度を抜くとかちょっとありえないはず
だから機械学習が強力なエンジンだとしても
既存の技術との組み合わせが必要だと個人的に考えてる
この翻訳メモリ利用なんかはまさしくその例だね
あとこの例は機械翻訳だけじゃなくて
別の分野に応用できそうだね
たとえばだけど自動要約でも
欲しい情報が残せるようになるとか?
771デフォルトの名無しさん
2020/03/11(水) 02:41:57.04ID:6icVeYcf AIにプログラミングさせろよ
いずれはAIプログラマが人間プログラマを超えるはず
今のプログラマはみんな失業だわ
いずれはAIプログラマが人間プログラマを超えるはず
今のプログラマはみんな失業だわ
772デフォルトの名無しさん
2020/03/11(水) 08:07:34.21ID:JC404dC6 それneubigさんのグループがやってた気がする
773デフォルトの名無しさん
2020/03/11(水) 17:31:54.14ID:/W59Vvow 頭が赤い魚を食べる猫
https://i.imgur.com/c8wOw6D.jpg
https://i.imgur.com/c8wOw6D.jpg
774デフォルトの名無しさん
2020/03/11(水) 18:04:39.92ID:0ettDLj0 コンテクストで周辺化すれば解決する?
775デフォルトの名無しさん
2020/03/11(水) 19:04:49.09ID:6icVeYcf 黒い瞳の大きな女の子
776デフォルトの名無しさん
2020/03/11(水) 22:44:18.45ID:DZf6OcqR 作者の気持ちを考えろ
複数の意味に捉えられるのが正解だ
複数の意味に捉えられるのが正解だ
777ことのは
2020/03/12(木) 01:15:14.09ID:/YIFSAvr >>771
昔はコンパイラだとかの言語処理も
人工知能の研究範囲だったらしいね?
人間がしてた最適化を機械でできた
だから全部いっぺんに生成するのは
AIではできないけど部分的な自動化
できる部分は拡大していくだろうよ
また前からしてるRPAの話につなげると
プロセスマイニングとかでより効率的な
RPAの命令を生成するのはそれに近くて
実現可能性もそこそこある領域だと思う
「翻訳メモリ」の利用っていうのと
「プロセスマイニング」って
データベース化した知識って点で
じつは共通するからね?
でも結論としては今すぐ失業はしない
プログラミング全自動化できる位に
強いAIがまだ実現していないから
>>772
カーネギーメロン大は昔から自然言語処理が得意だね
昔はコンパイラだとかの言語処理も
人工知能の研究範囲だったらしいね?
人間がしてた最適化を機械でできた
だから全部いっぺんに生成するのは
AIではできないけど部分的な自動化
できる部分は拡大していくだろうよ
また前からしてるRPAの話につなげると
プロセスマイニングとかでより効率的な
RPAの命令を生成するのはそれに近くて
実現可能性もそこそこある領域だと思う
「翻訳メモリ」の利用っていうのと
「プロセスマイニング」って
データベース化した知識って点で
じつは共通するからね?
でも結論としては今すぐ失業はしない
プログラミング全自動化できる位に
強いAIがまだ実現していないから
>>772
カーネギーメロン大は昔から自然言語処理が得意だね
778ことのは
2020/03/12(木) 01:33:02.43ID:/YIFSAvr >>773
「曖昧な日本の私」みたいな
日本語の係り受けの曖昧さの問題だね!
これは二番目が一番標準的な解析になるべきだと考える
なぜならまず係り受けが最小で連続しててキレイでしょ?
それから日常的にも一番出現確率が高そうな場面だよね?
だけどそれだけが唯一の正解って訳じゃなくて……
「曖昧な日本の私」みたいな
日本語の係り受けの曖昧さの問題だね!
これは二番目が一番標準的な解析になるべきだと考える
なぜならまず係り受けが最小で連続しててキレイでしょ?
それから日常的にも一番出現確率が高そうな場面だよね?
だけどそれだけが唯一の正解って訳じゃなくて……
779ことのは
2020/03/12(木) 01:33:20.86ID:/YIFSAvr >>774
前後の文を見てコンテクストを拡張しよう
っていうのももちろんあるやり方だし
また「マルチモーダル」や「人間との共同作業」が
実現できる環境なら、たんにそれらの画像を生成して
ユーザに選択させれば意図は確実に分かる
まあこの例だとナンセンスな気がするけどたとえば
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかが
ビジネスで重要な問題になるかもしれないとかだと
いちいち選択させるだけの動機はあるはず
前後の文を見てコンテクストを拡張しよう
っていうのももちろんあるやり方だし
また「マルチモーダル」や「人間との共同作業」が
実現できる環境なら、たんにそれらの画像を生成して
ユーザに選択させれば意図は確実に分かる
まあこの例だとナンセンスな気がするけどたとえば
「A社のようにコストが高くつかないシステム」で
A社のシステムのコストが高いか高くないかが
ビジネスで重要な問題になるかもしれないとかだと
いちいち選択させるだけの動機はあるはず
780ことのは
2020/03/12(木) 01:40:21.76ID:/YIFSAvr781ことのは
2020/03/12(木) 01:40:37.23ID:/YIFSAvr >>776
>作者の気持ち
>複数の意味
これは難しいが高度な自然言語処理としてはありうる
たとえばお世辞で褒めてるとか
皮肉で逆の意味を示してるとか
今のテキストマイニングの
感情表現とかの情報抽出は
まだそのレベルまで行ってないだろうけど
Prologの自由変数の非決定性みたいな
多義性を保持する何らかの言語上の仕組みと
文脈解析する何らかのアルゴリズムが
必要になってくるだろうね?
>作者の気持ち
>複数の意味
これは難しいが高度な自然言語処理としてはありうる
たとえばお世辞で褒めてるとか
皮肉で逆の意味を示してるとか
今のテキストマイニングの
感情表現とかの情報抽出は
まだそのレベルまで行ってないだろうけど
Prologの自由変数の非決定性みたいな
多義性を保持する何らかの言語上の仕組みと
文脈解析する何らかのアルゴリズムが
必要になってくるだろうね?
782デフォルトの名無しさん
2020/03/12(木) 02:11:31.16ID:NA68FhbL 1から100までの足し算を求めよ くらいのプログラムなら現時点でもAIプログラマでできるはず
ちょっと進化して、
電気回路の電流求めるみたいなn元1次方程式も多分AIプログラマは出来るだろう
ちょっと進化して、
電気回路の電流求めるみたいなn元1次方程式も多分AIプログラマは出来るだろう
783デフォルトの名無しさん
2020/03/12(木) 02:15:05.32ID:8IVaSSC9 文法ではすり抜けるけど
事例で統計を取れば尤もらしい解釈が得られる
事例で統計を取れば尤もらしい解釈が得られる
784デフォルトの名無しさん
2020/03/12(木) 02:21:35.62ID:NA68FhbL GoogleのBERTなら今でも
このくらい↓のことはできるぞ(英語のみだが)
質問
「Where do water droplets collide with ice crystals to form precipitation?」
(水滴が氷の結晶と衝突して雨を形成するのはどこですか?)
Wikipedia
「-Precipitation forms as smller droplets coalesce via collision with other rain drops or ice crystals within a cloud」
(雨粒は、雲の中で他の雨粒や氷の結晶と衝突して合体し、小さな水滴として形成されます)
答え
「within a cloud」(雲の中)
このくらい↓のことはできるぞ(英語のみだが)
質問
「Where do water droplets collide with ice crystals to form precipitation?」
(水滴が氷の結晶と衝突して雨を形成するのはどこですか?)
Wikipedia
「-Precipitation forms as smller droplets coalesce via collision with other rain drops or ice crystals within a cloud」
(雨粒は、雲の中で他の雨粒や氷の結晶と衝突して合体し、小さな水滴として形成されます)
答え
「within a cloud」(雲の中)
785デフォルトの名無しさん
2020/03/12(木) 04:22:39.56ID:NA68FhbL >>782
こんな簡単なプログラムでも解くのはなかなかむずかしい
入力=”1から100までの和sを求めよ”
出力例=
”
s=0
for i in range(100):
s=s+i+1
print(s)
”
こんな数行のプログラミングでも難しい
AIにやらせると多分こうなる
"s=1+2+3+4+5+6+.…+99+100"
これも確かに答えだからなあ
こんな簡単なプログラムでも解くのはなかなかむずかしい
入力=”1から100までの和sを求めよ”
出力例=
”
s=0
for i in range(100):
s=s+i+1
print(s)
”
こんな数行のプログラミングでも難しい
AIにやらせると多分こうなる
"s=1+2+3+4+5+6+.…+99+100"
これも確かに答えだからなあ
786デフォルトの名無しさん
2020/03/12(木) 09:13:16.75ID:8IVaSSC9 MTに大量のコーパスが必要、というのが解せない
人間は1000万文なんて読まなくても翻訳できるのに
人間は1000万文なんて読まなくても翻訳できるのに
787デフォルトの名無しさん
2020/03/12(木) 09:52:53.59ID:eSw88mGJ 人間は文字や文章だけじゃなく様々な情報から知識や知能を身に付けてるのだから、違いがあるのは当然だろう
788デフォルトの名無しさん
2020/03/12(木) 10:52:14.52ID:2DPQopCV789デフォルトの名無しさん
2020/03/12(木) 12:59:44.57ID:vOpmeZnq それはどうでもいいかな
790デフォルトの名無しさん
2020/03/12(木) 13:37:54.15ID:NA68FhbL791デフォルトの名無しさん
2020/03/12(木) 14:18:44.24ID:MzPDqAwN 「ブカンもういいね」と近平が言ったから三月十二日はコロナ記念日
792ことのは
2020/03/12(木) 20:11:20.59ID:/YIFSAvr794ことのは
2020/03/12(木) 20:15:37.61ID:/YIFSAvr795ことのは
2020/03/12(木) 20:19:56.04ID:/YIFSAvr796ことのは
2020/03/12(木) 20:24:55.80ID:/YIFSAvr あとRPAの話題を続けて言えば
プロセスマイニングと
テキストマイニングを合わせて使うことで
シナジーが生じないか考えてる
たとえばRPAの操作ごとに
自然文を入力もしくは出力して
ログを溜めておき
定期的にマイニングすると
操作データと文章データを比較することで
何か得る物があるかもしれない
それからWebサービスに
チャット(ボット)をつけても
同じようなことができるだろう
というかつけてる所はログを解析してるだろう
プロセスマイニングと
テキストマイニングを合わせて使うことで
シナジーが生じないか考えてる
たとえばRPAの操作ごとに
自然文を入力もしくは出力して
ログを溜めておき
定期的にマイニングすると
操作データと文章データを比較することで
何か得る物があるかもしれない
それからWebサービスに
チャット(ボット)をつけても
同じようなことができるだろう
というかつけてる所はログを解析してるだろう
797デフォルトの名無しさん
2020/03/12(木) 20:55:07.53ID:8IVaSSC9 ググルのアシスタントはそういうフィードバックを収集してるみたい
798ことのは
2020/03/12(木) 21:06:48.68ID:/YIFSAvr >>797
スマートスピーカーとかは
当然のように情報収集してるだろうね
そもそも昔から検索エンジンの
クエリが情報源になってると思うけど
「データ イズ キング」で
ビッグデータを取れる
プラットフォームがAIには有利だな
このままだとグーグルやアマゾンに
全産業が寡占されそうで危機感ある
スマートスピーカーとかは
当然のように情報収集してるだろうね
そもそも昔から検索エンジンの
クエリが情報源になってると思うけど
「データ イズ キング」で
ビッグデータを取れる
プラットフォームがAIには有利だな
このままだとグーグルやアマゾンに
全産業が寡占されそうで危機感ある
799ことのは
2020/03/12(木) 21:08:12.01ID:/YIFSAvr reCAPTCHA - Wikipedia
https://ja.wikipedia.org/wiki/ReCAPTCHA
あんまりマニアックな論文とか紹介すると
手口がバレちゃうけどこれは有名な例だからいいかな
このreCAPTCHAはシステムの裏で
人間から情報収集する典型例だと思う
さっきのRPAでプロセスとテキストを
両方マイニングすればいいのでは
っていう発想の元ネタになってる
あとこれもカーネギーメロン大だね
自然言語処理に強いことで有名
https://ja.wikipedia.org/wiki/ReCAPTCHA
あんまりマニアックな論文とか紹介すると
手口がバレちゃうけどこれは有名な例だからいいかな
このreCAPTCHAはシステムの裏で
人間から情報収集する典型例だと思う
さっきのRPAでプロセスとテキストを
両方マイニングすればいいのでは
っていう発想の元ネタになってる
あとこれもカーネギーメロン大だね
自然言語処理に強いことで有名
800デフォルトの名無しさん
2020/03/12(木) 21:20:03.96ID:8IVaSSC9 コンピュータサイエンスでは
バークレーとcmu強いよね
カーネギーメロンて聞くと
メロンを思い出しちゃう
バークレーとcmu強いよね
カーネギーメロンて聞くと
メロンを思い出しちゃう
801デフォルトの名無しさん
2020/03/12(木) 21:28:51.90ID:R0x/UfYo >>796
RPAとまでゆかずともExelの操作やショートカットを発話でできたら、老人やスマホ世代には確実にウケるよ
類義語辞典の作成とdialogflowのAPIだけ借りて
複雑になり過ぎたGUIを音声の意味理解が吸収するのは合理的だし、ok googleや音声入力する人が(周りにはいないが)結構いるデータも後押ししてる
マイクロソフトとアドビの操作を覚えるなんて時間の無駄って世界にすべきだわ
RPAとまでゆかずともExelの操作やショートカットを発話でできたら、老人やスマホ世代には確実にウケるよ
類義語辞典の作成とdialogflowのAPIだけ借りて
複雑になり過ぎたGUIを音声の意味理解が吸収するのは合理的だし、ok googleや音声入力する人が(周りにはいないが)結構いるデータも後押ししてる
マイクロソフトとアドビの操作を覚えるなんて時間の無駄って世界にすべきだわ
802デフォルトの名無しさん
2020/03/12(木) 22:11:34.53ID:MBvc0z2j803ことのは
2020/03/12(木) 22:17:52.11ID:/YIFSAvr >>801
GUIからCUI(音声認識含む)に戻す
っていうのはシンプルだけど
大きな需要があると思ってる
たとえばスマートスピーカーは
とくにキッチンとかで手が離せない
状況の時に役立つからね
PCのGUIは残ると思うが
スマホも画面小さいから
複雑な操作はしにくいし
GUIからCUI(音声認識含む)に戻す
っていうのはシンプルだけど
大きな需要があると思ってる
たとえばスマートスピーカーは
とくにキッチンとかで手が離せない
状況の時に役立つからね
PCのGUIは残ると思うが
スマホも画面小さいから
複雑な操作はしにくいし
804ことのは
2020/03/12(木) 22:28:44.13ID:/YIFSAvr >>802
囲碁AIが「独学」で最強に グーグル、産業応用探る 日経
https://www.nikkei.com/article/DGXMZO22407340Y7A011C1TI1000/
最近の機械学習は自己学習できるようになってるよね
ただ囲碁や画像処理みたいに
公開された情報だけで白黒つく分野と
そうでない分野があるから
情報収集が全部不要になるとは限らないんだ
たとえば株価なんかはいくら学習の精度が上がっても
株価だけで正確に予測できるようになるのは難しい
もしそうだったらプログラマが
ジャンジャン金持ちになってるはずだから
企業やその評価についての情報を入手する必要がありそう
つまりテクニカルだけでは不足でファンダメンタルな情報が必要
株の話はひとつの例だけどマーケティングは
人間の行動の予測だから
やはり自己学習だけで完結できると思えない
となるとやっぱりデータイズキングだし
やっぱりGAFAが有利なんじゃないかと思う
囲碁AIが「独学」で最強に グーグル、産業応用探る 日経
https://www.nikkei.com/article/DGXMZO22407340Y7A011C1TI1000/
最近の機械学習は自己学習できるようになってるよね
ただ囲碁や画像処理みたいに
公開された情報だけで白黒つく分野と
そうでない分野があるから
情報収集が全部不要になるとは限らないんだ
たとえば株価なんかはいくら学習の精度が上がっても
株価だけで正確に予測できるようになるのは難しい
もしそうだったらプログラマが
ジャンジャン金持ちになってるはずだから
企業やその評価についての情報を入手する必要がありそう
つまりテクニカルだけでは不足でファンダメンタルな情報が必要
株の話はひとつの例だけどマーケティングは
人間の行動の予測だから
やはり自己学習だけで完結できると思えない
となるとやっぱりデータイズキングだし
やっぱりGAFAが有利なんじゃないかと思う
805デフォルトの名無しさん
2020/03/13(金) 00:32:07.48ID:3thqY/PO >>804
私はプログラミングの世界は本来「完全情報ゲーム」だと思ってる
情報が完全でなければプログラミングは不可能だ
現実にはプログラミングの時点でも仕様が確定しないということはあるだろう
プログラマはその都度、仕様確定に奔走し、情報を完全にしようとする
しかしその多くは人間の不完全さから起こることであって、本来は完全な情報を与えるのがミッションのはずだ
もしプログラミングが「完全情報ゲーム」であるとすれば、AIとの親和性はいいはずだ
AIプログラマはいずれ実現すると思う
株価変動のような「不完全情報ゲーム」とは分けて考えるべきだろう
私はプログラミングの世界は本来「完全情報ゲーム」だと思ってる
情報が完全でなければプログラミングは不可能だ
現実にはプログラミングの時点でも仕様が確定しないということはあるだろう
プログラマはその都度、仕様確定に奔走し、情報を完全にしようとする
しかしその多くは人間の不完全さから起こることであって、本来は完全な情報を与えるのがミッションのはずだ
もしプログラミングが「完全情報ゲーム」であるとすれば、AIとの親和性はいいはずだ
AIプログラマはいずれ実現すると思う
株価変動のような「不完全情報ゲーム」とは分けて考えるべきだろう
806デフォルトの名無しさん
2020/03/13(金) 01:04:33.05ID:3thqY/PO 私も囲碁のアマ高段者のはしくれなので、「アルファ碁」の出現には驚いた
初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった
現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、100勝0敗である
アルファ碁は入力情報は棋譜である
棋譜とは19×19のマス目に白黒の石の配置と手順記録したものである
こんな感じ
1)先手 黒4−四 2)後手 白16−一七 3)先手 黒………
入力情報は19×19の画像情報である
探索空間は1手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが19×19の画像となりニューラルネットへの入力となる
アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の1手を割り出していく
http://home.q00.itscom.net/otsuki/alphaZero.pdf
https://www.slideshare.net/suckgeunlee/alphago-zero
初期の「アルファ碁」は教師あり学習で、プロ棋士の棋譜を多数学習して強化された
そのうちに「アルファ碁」同士で対局し、経験値を上げて人間より強くなった
現在の「アルファ碁ゼロ」は教師なし学習らしい
「アルファ碁ゼロ」は「「アルファ碁」よりもさらに強く、100勝0敗である
アルファ碁は入力情報は棋譜である
棋譜とは19×19のマス目に白黒の石の配置と手順記録したものである
こんな感じ
1)先手 黒4−四 2)後手 白16−一七 3)先手 黒………
入力情報は19×19の画像情報である
探索空間は1手進むごとに探索木が決定する木構造となる
ある局面の瞬間のスナップショットが19×19の画像となりニューラルネットへの入力となる
アルファ碁はある局面での優劣判断を過去の学習結果から計算できる
その計算により次の1手を割り出していく
http://home.q00.itscom.net/otsuki/alphaZero.pdf
https://www.slideshare.net/suckgeunlee/alphago-zero
807デフォルトの名無しさん
2020/03/13(金) 01:23:15.89ID:bBSRp/P7 いずれにせよ滅び行くゲームだな。
808デフォルトの名無しさん ◆aPqBDZ8KLvOt
2020/03/13(金) 17:52:49.28ID:3thqY/PO 面白いのは初代の「アルファ碁」は時々読み落としをしていたこと
これは人間がよくやる間違いと同質のミスである
探索空間が木構造である以上、少なくとも(19×19)の階乗 程度の組合わせとなり
組合せ爆発が起こるので、スーパーコンピュータでも到底解けない
宇宙年齢より時間がかかってしまうだろうから
そこで教師あり学習によって経験を積み、無用な探索を行わないように探索空間を枝刈りするというテクニックを採用した
しかし枝刈りされた探索木の中にも最適解や局所解は存在するかもしれない
実際そういうことが稀に起こって人間に負けることがあった
注目を浴びた韓国プロ棋士との5番勝負で4勝1敗になったのはそのケースだ
しかし強化学習を積上げることで、そのようなまぐれ負けは起こらなくなった
アルファ碁は1日に何万局もの自己対局を行うことができるので、
経験値を積み上げた結果、
人間が何百年もかけて築いてきた経験と知識を凌駕してしまったのだ
これは人間がよくやる間違いと同質のミスである
探索空間が木構造である以上、少なくとも(19×19)の階乗 程度の組合わせとなり
組合せ爆発が起こるので、スーパーコンピュータでも到底解けない
宇宙年齢より時間がかかってしまうだろうから
そこで教師あり学習によって経験を積み、無用な探索を行わないように探索空間を枝刈りするというテクニックを採用した
しかし枝刈りされた探索木の中にも最適解や局所解は存在するかもしれない
実際そういうことが稀に起こって人間に負けることがあった
注目を浴びた韓国プロ棋士との5番勝負で4勝1敗になったのはそのケースだ
しかし強化学習を積上げることで、そのようなまぐれ負けは起こらなくなった
アルファ碁は1日に何万局もの自己対局を行うことができるので、
経験値を積み上げた結果、
人間が何百年もかけて築いてきた経験と知識を凌駕してしまったのだ
809デフォルトの名無しさん
2020/03/13(金) 18:11:34.44ID:jvKiI+vV コピペされた文章を添削するスレか?ここは
810ことのは
2020/03/13(金) 19:50:32.30ID:ZeWzgGw6 >>805
>プログラミングの世界は本来「完全情報ゲーム」
>株価変動のような「不完全情報ゲーム」とは分けて考えるべき
その前提がよく分からないな?
人間の社会や市場は不完全情報で動いているので
ビジネスアプリの開発はそれに対応せざるをえない
いや別に「完全情報のゲーム」になるよう
囲碁や将棋のアプリとかだけ作っていてもいいんだけど
それはなんか個人の美学みたいな感じになっちゃうから
匿名掲示板だしオレは生産性を基準にする立場に立つね?
「〜すべき」みたいな限定する前提はなるべく
生産性を高める場合に使うと生産性が高まるから
もし株式市場の予測ソフトで儲かるなら
不完全でも何でも単にそれを作ればいいことでしょ?
>プログラミングの世界は本来「完全情報ゲーム」
>株価変動のような「不完全情報ゲーム」とは分けて考えるべき
その前提がよく分からないな?
人間の社会や市場は不完全情報で動いているので
ビジネスアプリの開発はそれに対応せざるをえない
いや別に「完全情報のゲーム」になるよう
囲碁や将棋のアプリとかだけ作っていてもいいんだけど
それはなんか個人の美学みたいな感じになっちゃうから
匿名掲示板だしオレは生産性を基準にする立場に立つね?
「〜すべき」みたいな限定する前提はなるべく
生産性を高める場合に使うと生産性が高まるから
もし株式市場の予測ソフトで儲かるなら
不完全でも何でも単にそれを作ればいいことでしょ?
811ことのは
2020/03/13(金) 19:53:58.87ID:ZeWzgGw6 >>806
>アルファ碁は入力情報は棋譜
>入力情報は19×19の画像情報
たしかに言語(棋譜)とも言えるし画像とも言えるね
究極的にはコンピュータが扱うデータは
1と0のバイナリだからみんな同じとも見なせる
じっさい機械学習では単語をベクトルにしたりするよね?
>アルファ碁は入力情報は棋譜
>入力情報は19×19の画像情報
たしかに言語(棋譜)とも言えるし画像とも言えるね
究極的にはコンピュータが扱うデータは
1と0のバイナリだからみんな同じとも見なせる
じっさい機械学習では単語をベクトルにしたりするよね?
812ことのは
2020/03/13(金) 19:55:32.58ID:ZeWzgGw6 >>807
はたしてどうかな?
チェスや将棋でプロ棋士に勝った時もよく言われたけど
自動車の方が人間より早いけど陸上競技はなくならない
ゲームが残るかどうかは人間が面白いかどうかじゃない?
ただプロの世界が消えてしまうことは想定できるかもね
はたしてどうかな?
チェスや将棋でプロ棋士に勝った時もよく言われたけど
自動車の方が人間より早いけど陸上競技はなくならない
ゲームが残るかどうかは人間が面白いかどうかじゃない?
ただプロの世界が消えてしまうことは想定できるかもね
813デフォルトの名無しさん
2020/03/13(金) 19:56:27.57ID:3thqY/PO814ことのは
2020/03/13(金) 20:08:11.39ID:ZeWzgGw6 >>808
>組合せ爆発が起こるので
>スーパーコンピュータでも到底解けない
総当たりだとそうなるだろうね
だから局所的なパターンを学習することで
組み合わせ爆発を避けるのがAIの基本になる
しかも自然言語の場合は19×19どころではなく
五十音(漢字を入れれば数千)×文字数
になるのだから、なおさら組み合わせ数は多い
そしてそのすべての文字の組み合わせで
文脈が決まるから文脈解析が難しいのも自然
その上で人間同士の会話では文字以外の情報も
参照してマルチモーダルな学習になっている
株価が株価だけで決まらないのと似たようなもの
で、難しいからどうするかだけど
一番シンプルな解決法としては
最初に文脈を限定してしまうのが早い
たとえば問い合わせのテキストマイニングなんかは
もっぱら特定の商品やサービスに
文脈が限定されているから解析しやすい
最初の話に戻ると囲碁だって棋譜っていう制限された文法で
自然言語処理ではなく人工言語処理だから解析できた訳でしょ?
>組合せ爆発が起こるので
>スーパーコンピュータでも到底解けない
総当たりだとそうなるだろうね
だから局所的なパターンを学習することで
組み合わせ爆発を避けるのがAIの基本になる
しかも自然言語の場合は19×19どころではなく
五十音(漢字を入れれば数千)×文字数
になるのだから、なおさら組み合わせ数は多い
そしてそのすべての文字の組み合わせで
文脈が決まるから文脈解析が難しいのも自然
その上で人間同士の会話では文字以外の情報も
参照してマルチモーダルな学習になっている
株価が株価だけで決まらないのと似たようなもの
で、難しいからどうするかだけど
一番シンプルな解決法としては
最初に文脈を限定してしまうのが早い
たとえば問い合わせのテキストマイニングなんかは
もっぱら特定の商品やサービスに
文脈が限定されているから解析しやすい
最初の話に戻ると囲碁だって棋譜っていう制限された文法で
自然言語処理ではなく人工言語処理だから解析できた訳でしょ?
815ことのは
2020/03/13(金) 20:11:08.50ID:ZeWzgGw6816ことのは
2020/03/13(金) 20:17:59.09ID:ZeWzgGw6 >>813
>あなたはプログラミングの経験がないのでは?
決めつけはよくないな
「あなたは要件定義の経験がないのでは?」
とでも返そうか?
業務は流動的なので確定していないことが多い
RPA(の導入)なんかでもツール自体よりも
業務フローの把握や整理とかが難しいことが多い
>仕様が確定すればプログラミングは可能になる
もちろん仕様が確定してた方が作りやすいけど
本当は長期的には不確定な部分は必ず残るんだよね
たとえば消費税や年号のように変化する部分がある
機能の拡張や修正なども当然出てくるだろうし
それでプログラムを抽象化するのは未来への投資で
抽象化や間接化で不確定性に対応できるようにする
逆に変化しないならハードコーディングでいいけど
>あなたはプログラミングの経験がないのでは?
決めつけはよくないな
「あなたは要件定義の経験がないのでは?」
とでも返そうか?
業務は流動的なので確定していないことが多い
RPA(の導入)なんかでもツール自体よりも
業務フローの把握や整理とかが難しいことが多い
>仕様が確定すればプログラミングは可能になる
もちろん仕様が確定してた方が作りやすいけど
本当は長期的には不確定な部分は必ず残るんだよね
たとえば消費税や年号のように変化する部分がある
機能の拡張や修正なども当然出てくるだろうし
それでプログラムを抽象化するのは未来への投資で
抽象化や間接化で不確定性に対応できるようにする
逆に変化しないならハードコーディングでいいけど
817デフォルトの名無しさん
2020/03/13(金) 20:19:38.63ID:3thqY/PO >>811
>>たしかに言語(棋譜)とも言えるし画像とも言えるね
アルファ碁に関しては専門の論文や解説書があるので、ここでは深く言及しないが
将棋でも囲碁もある局面(例えば10手進んだ局面)では画像データになる
19×19の碁盤に白石と黒石が配置された1枚の絵になるので
Googleは画像処理技術を応用したんですよ
猫の画像を入力する代わりに、ある瞬間の棋譜の画像を入力する
猫か猫でないかを判別する代わりに、その局面が優勢か劣勢かを判別する
>>たしかに言語(棋譜)とも言えるし画像とも言えるね
アルファ碁に関しては専門の論文や解説書があるので、ここでは深く言及しないが
将棋でも囲碁もある局面(例えば10手進んだ局面)では画像データになる
19×19の碁盤に白石と黒石が配置された1枚の絵になるので
Googleは画像処理技術を応用したんですよ
猫の画像を入力する代わりに、ある瞬間の棋譜の画像を入力する
猫か猫でないかを判別する代わりに、その局面が優勢か劣勢かを判別する
818ことのは
2020/03/13(金) 20:29:08.90ID:ZeWzgGw6 >>817
>Googleは画像処理技術を応用した
グーグルだから有名な話だと思うけど
じつは他にも同様の例があるんだよ?
たとえば株式市場はチャートで表現できるから
グラフの画像にして画像認識させて
それで株価が上がるか下がるかを出力させようと
でもここで囲碁と大きな違いがあってそれはやはり
囲碁は完全情報だけど株式市場は不完全情報なので
株価を予測できるとは限らない(できない場合が多い)
>Googleは画像処理技術を応用した
グーグルだから有名な話だと思うけど
じつは他にも同様の例があるんだよ?
たとえば株式市場はチャートで表現できるから
グラフの画像にして画像認識させて
それで株価が上がるか下がるかを出力させようと
でもここで囲碁と大きな違いがあってそれはやはり
囲碁は完全情報だけど株式市場は不完全情報なので
株価を予測できるとは限らない(できない場合が多い)
819デフォルトの名無しさん
2020/03/13(金) 20:29:25.88ID:3thqY/PO >>816
あなたとけんかするつもりはないですが、
要件定義はプログラミングとは呼ばない (呼ぶべきではない)
基本設計も同じ
一般に自動化プログラミングと呼ばれるものが過去にもあったけど、
自動化プログラミングとAIとは違いますよね
入力情報と出力結果は自動化プログラミングでもAIでも同じです
自動化プログラミングは仕様書を機械的にプログラム言語に置き換えただけ
AIは別のアプローチでプログラムを作る(探索とか学習とかで)
自動化プログラミングで仕様書からプログラムを作れるのならこれは完全情報ゲームですよ
あなたとけんかするつもりはないですが、
要件定義はプログラミングとは呼ばない (呼ぶべきではない)
基本設計も同じ
一般に自動化プログラミングと呼ばれるものが過去にもあったけど、
自動化プログラミングとAIとは違いますよね
入力情報と出力結果は自動化プログラミングでもAIでも同じです
自動化プログラミングは仕様書を機械的にプログラム言語に置き換えただけ
AIは別のアプローチでプログラムを作る(探索とか学習とかで)
自動化プログラミングで仕様書からプログラムを作れるのならこれは完全情報ゲームですよ
820デフォルトの名無しさん
2020/03/13(金) 20:39:23.40ID:3thqY/PO >>818
意味がわからない
株価予測と株価データからチャートを作成する問題は別
株価チャートを作るプログラミングは完全情報ゲームとして扱わないとプログラムなんか作れませんよね
例えば1カ月分の日足データと、グラフィックライブラリがあれば基本的に作成できるはず
サイズとか期間とか目盛とかいろいろあるんでしょうけど、全部事前に決めてあげるもので
全部決まったら完全情報ゲームですよ
意味がわからない
株価予測と株価データからチャートを作成する問題は別
株価チャートを作るプログラミングは完全情報ゲームとして扱わないとプログラムなんか作れませんよね
例えば1カ月分の日足データと、グラフィックライブラリがあれば基本的に作成できるはず
サイズとか期間とか目盛とかいろいろあるんでしょうけど、全部事前に決めてあげるもので
全部決まったら完全情報ゲームですよ
821デフォルトの名無しさん
2020/03/13(金) 20:49:38.40ID:yORqQ+vG 明地文男、3点チャージ投資法
http://3-charge.b.la9.jp/
日経平均大幅続落で、日経225は、198銘柄が3点チャージ!
「トヨタ」「ホンダ」「キャノン」」などがレア・チャージ!
底値に針を仕掛ければ、一瞬で、数% は上がる!
http://3-charge.b.la9.jp/
日経平均大幅続落で、日経225は、198銘柄が3点チャージ!
「トヨタ」「ホンダ」「キャノン」」などがレア・チャージ!
底値に針を仕掛ければ、一瞬で、数% は上がる!
822デフォルトの名無しさん
2020/03/13(金) 20:50:09.00ID:7lz2hazk そもそも生データがあるのにわざわざチャート画像化して学習する意味あるの?
823ことのは
2020/03/13(金) 20:51:14.93ID:ZeWzgGw6 >>819
株価予測AIが作れても予測が上手くいかないのは
不完全情報ゲームが対象だから、不完全なものになるから
「情報が完全でなければプログラミングは不可能」というよりも
「情報が不完全なら不完全なプログラム」になるということです
つまりプログラムの作成は可能だが機能は不完全だということ
要件定義を通して現実世界とのズレが埋まってないとも言えます
>自動化プログラミングで仕様書から
>プログラムを作れるのならこれは完全情報ゲーム
でもそれは仕様書レベルからの自動化であって
要件レベルから直接的に自動化できるプログラムはまだない
(もしあればプログラマは皆失業する)
たいていの場合は要件というか
自然言語で表現される対象の現実が不完全なので
人工言語の仕様書に落として
人工言語のプログラムに翻訳するという形になる
これはコンパイラ(やインタプリタ)が高級言語を
アセンブラや機械語に翻訳するのと同じ構図でしょう?
だからふり返って昔にはコンパイラの研究が人工知能と
分類されていたのもそんなにおかしくないんだけれど……
それで色んな事をガーッと言ってきたけど、とくに私が言いたい
さしあたりの結論としてはビジネスでは現実とのズレはなくらないということ
または、もしプログラミングは完全でもソフト開発としては不完全ということ
株価予測AIが作れても予測が上手くいかないのは
不完全情報ゲームが対象だから、不完全なものになるから
「情報が完全でなければプログラミングは不可能」というよりも
「情報が不完全なら不完全なプログラム」になるということです
つまりプログラムの作成は可能だが機能は不完全だということ
要件定義を通して現実世界とのズレが埋まってないとも言えます
>自動化プログラミングで仕様書から
>プログラムを作れるのならこれは完全情報ゲーム
でもそれは仕様書レベルからの自動化であって
要件レベルから直接的に自動化できるプログラムはまだない
(もしあればプログラマは皆失業する)
たいていの場合は要件というか
自然言語で表現される対象の現実が不完全なので
人工言語の仕様書に落として
人工言語のプログラムに翻訳するという形になる
これはコンパイラ(やインタプリタ)が高級言語を
アセンブラや機械語に翻訳するのと同じ構図でしょう?
だからふり返って昔にはコンパイラの研究が人工知能と
分類されていたのもそんなにおかしくないんだけれど……
それで色んな事をガーッと言ってきたけど、とくに私が言いたい
さしあたりの結論としてはビジネスでは現実とのズレはなくらないということ
または、もしプログラミングは完全でもソフト開発としては不完全ということ
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 中国国営メディア「沖縄は日本ではない」… [BFU★]
- NY円、一時1ユーロ=180円台まで下落…1999年のユーロ導入以来初 [蚤の市★]
- 【こんなの初めて…】民泊には既にキャンセルも 中国の渡航自粛で [ぐれ★]
- 【外交】日中関係悪化、長期化の様相 2012年には自動車輸出80%減も ロイター★3 [1ゲットロボ★]
- 高市政権にパイプ役不在…日中高まる緊張 公明党の連立離脱影響、自民内にも懸念「自分でまいた種は自分で刈り取ってもらわないと」 [ぐれ★]
- 国内ホテル、既にキャンセルも 訪日客関連業界、事態見守る ★3 [蚤の市★]
- 『しんちゃんと岸田さん』 [175344491]
- 自民「高市の一言でこれまで積み上げてきた関係が駄目になる。言葉の重みを分かっていない。自分でまいた種は自分で刈り取ってもらう」 [256556981]
- 【悲報】泉健太「質問した立憲民主党が悪いという主張は、高市政権が野党の忖度で成り立つ政権という汚名を自ら着るようなもの」 [519511584]
- 中国発日本行の航空券、491,000件(全体の32%)がキャンセルされたと判明。高市どうすんのこれ [603416639]
- 中国国営放送「日本は琉球をただちに中国に返還せよ」 キタ━━━━(゚∀゚)━━━━!!!!! [314039747]
- 【高市速報】小野田経済安保相「中国依存はリスクなおおおおおおおおおおお」 [127986362]
