!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。
機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです。
■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
探検
【統計分析】機械学習・データマイニング30
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん (ワッチョイ db01-G7ci [60.86.178.93])
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0959デフォルトの名無しさん (ワッチョイ 9d01-wtVn [60.69.230.42])
2021/08/30(月) 22:00:46.32ID:FcBMjYja0 精度が売上に直結するならいいけど
弱い相関ならシンプルなロジック選んでしまうな
弱い相関ならシンプルなロジック選んでしまうな
960デフォルトの名無しさん (ワッチョイ e302-3Axr [59.138.123.33])
2021/08/30(月) 22:13:34.30ID:IfLgW1Xz0 40年以上前から言われているけど
何文字以内、何行以下の要約というのは
あまり意味がない。必須な部分がかけてしまうかもしれないし
余分な部分が残ってしまうことがある
何文字以内、何行以下の要約というのは
あまり意味がない。必須な部分がかけてしまうかもしれないし
余分な部分が残ってしまうことがある
961デフォルトの名無しさん (ワッチョイ 25dd-RulN [122.249.112.164])
2021/08/30(月) 22:23:27.16ID:6Ldth3Lh0 愚痴みたいになるけど形態素解析とかIMEみたいな古典的な分野ばっかやりすぎて
統計的機械学習やディープラーニングへの対応が遅れて
世界に取り残されたのが日本の自然言語処理のアカデミアってイメージ
アテンションやトランスフォーマーみたいな仕組みが
日本から出てこなかったのは悲しい
統計的機械学習やディープラーニングへの対応が遅れて
世界に取り残されたのが日本の自然言語処理のアカデミアってイメージ
アテンションやトランスフォーマーみたいな仕組みが
日本から出てこなかったのは悲しい
962デフォルトの名無しさん (ワッチョイ 6b10-rjuI [153.131.102.129])
2021/08/30(月) 23:06:53.06ID:DbDPNUf30963デフォルトの名無しさん (ワッチョイ 3dca-yDFm [182.168.51.6])
2021/08/31(火) 04:15:10.73ID:D+Jl3XmV0 >>950
spaCyかな。利点はGPUを使えるので圧倒的に早いこと。欠点はPython依存。
spaCyかな。利点はGPUを使えるので圧倒的に早いこと。欠点はPython依存。
964デフォルトの名無しさん (ワッチョイ 3dca-yDFm [182.168.51.6])
2021/08/31(火) 04:39:38.87ID:D+Jl3XmV0 >>958
個人的にはあれはよくできてると思う。
まず、要約はextraction法とabstraction法の2種類がある。
extractionはbowを作って単語の頻出度で統計処理することでウェイトの高いセンテンスを抽出する。
一方、abstractionは要約済みの学習データをseq2seqで機械学習させることで、要約エンジンを作る。
松尾研のベンチャーが作ったのは、後者のabstractionの方で、日本語でabstractiono方式の要約エンジン
というのはほとんど見たことがない。
ただ、実際に売れるかどうかは別。
この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
企業は内部情報が外部に流出することになるのでまず100%導入はしない。
一般的なのは、企業が利用してるクラウドの中にシステム用のサーバーを立ち上げるか、
企業のイントラネットの中に専用サーバーを立ち上げることなんだが、
これをやるとSI業者には勝てない。
また、下手にこの領域に踏み込むとSI 業者が海外製の要約エンジンを日本語化して販売
を始めたりするので、敵を誘い込むことになる。
個人的にはあれはよくできてると思う。
まず、要約はextraction法とabstraction法の2種類がある。
extractionはbowを作って単語の頻出度で統計処理することでウェイトの高いセンテンスを抽出する。
一方、abstractionは要約済みの学習データをseq2seqで機械学習させることで、要約エンジンを作る。
松尾研のベンチャーが作ったのは、後者のabstractionの方で、日本語でabstractiono方式の要約エンジン
というのはほとんど見たことがない。
ただ、実際に売れるかどうかは別。
この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
企業は内部情報が外部に流出することになるのでまず100%導入はしない。
一般的なのは、企業が利用してるクラウドの中にシステム用のサーバーを立ち上げるか、
企業のイントラネットの中に専用サーバーを立ち上げることなんだが、
これをやるとSI業者には勝てない。
また、下手にこの領域に踏み込むとSI 業者が海外製の要約エンジンを日本語化して販売
を始めたりするので、敵を誘い込むことになる。
965デフォルトの名無しさん (ワッチョイ 4db0-Y/PZ [180.46.85.8])
2021/08/31(火) 07:41:34.77ID:vHl4DeHq0 >この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
>企業は内部情報が外部に流出することになるのでまず100%導入はしない。
用途で言えば内部情報より外部の公開情報を要約してリサーチ等に使う方が多そうな気がするが。
そうでなくても、契約文書をチェックするサービスなんてのも商売になっているくらいだし。
>企業は内部情報が外部に流出することになるのでまず100%導入はしない。
用途で言えば内部情報より外部の公開情報を要約してリサーチ等に使う方が多そうな気がするが。
そうでなくても、契約文書をチェックするサービスなんてのも商売になっているくらいだし。
966デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/31(火) 14:21:53.09ID:Sht6cbMy0 optunaで指定するパラメータの範囲はどう決めれば良いの?
apiにパラメータの取りうる範囲が1 <= p < ∞とあるとき
apiにパラメータの取りうる範囲が1 <= p < ∞とあるとき
967デフォルトの名無しさん (オイコラミネオ MM09-ABh5 [150.66.78.51])
2021/08/31(火) 15:50:48.02ID:j/ruVWceM 1と∞で二分探索
968デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
2021/08/31(火) 19:28:12.45ID:l6anRrPu0 無限の半分は・・・無限!!
969デフォルトの名無しさん (ワッチョイ 25dd-RulN [122.249.112.164])
2021/08/31(火) 19:30:49.23ID:IiAPjlBZ0 >>966
無限大に発散するような関数はまずないはずだけどどういう式?
無限大に発散するような関数はまずないはずだけどどういう式?
970id:ignore (オッペケ Sr99-BJ4f [126.255.84.77 [上級国民]])
2021/08/31(火) 20:06:05.81ID:Yj2FMtNrr exp
971デフォルトの名無しさん (ワッチョイ 7b89-U7Lh [39.111.228.181])
2021/08/31(火) 20:07:05.73ID:TL2gsmuJ0 表からともったら裏、裏かとと思ったら表
972デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/31(火) 20:56:01.05ID:Sht6cbMy0973デフォルトの名無しさん (ワッチョイ 85ca-mUqo [182.168.51.6])
2021/09/04(土) 02:49:35.61ID:9cArpdYt0974デフォルトの名無しさん (ワッチョイ 85ca-mUqo [182.168.51.6])
2021/09/04(土) 04:02:08.87ID:9cArpdYt0 >>965
いずれにしてもSeqモデルによる実装は簡単だから、要約済みの学習データさえ準備できれば
要約システムは簡単に構築可能。無料で出す分にはみんなは面白がって使うだろうけど、有料提供
となると、かなり困難に直面するんじゃないかと思っただけ。
Seqモデルは、かなり一般化してきてるので、NLP専攻の学卒者だったら、十分に構築は可能。
これが機械翻訳とかだと、かなり膨大な学習データが必要となるので、参入障壁になるが、
自動要約だと、元の学習量もしれてるので、NTTデータや富士通あたりだと多分、簡単に作れる。
また、要約の精度は学習データに依存するので、どこまで精度の高いデータを作れるかは、
最終的には開発元の資本力によって決まることになる。
いずれにしてもSeqモデルによる実装は簡単だから、要約済みの学習データさえ準備できれば
要約システムは簡単に構築可能。無料で出す分にはみんなは面白がって使うだろうけど、有料提供
となると、かなり困難に直面するんじゃないかと思っただけ。
Seqモデルは、かなり一般化してきてるので、NLP専攻の学卒者だったら、十分に構築は可能。
これが機械翻訳とかだと、かなり膨大な学習データが必要となるので、参入障壁になるが、
自動要約だと、元の学習量もしれてるので、NTTデータや富士通あたりだと多分、簡単に作れる。
また、要約の精度は学習データに依存するので、どこまで精度の高いデータを作れるかは、
最終的には開発元の資本力によって決まることになる。
975デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.155.87])
2021/09/05(日) 22:01:26.67ID:zykEaDwPr 松尾研で文章を3つの文にまとめるアプリができてましたが
これを任意の文の数にまとめられて更に
「動作を文章にするアプリ」と組み合わせることで作業手順書の自動作成ができて
ひいては行動計画に関する人工知能の開発が進むといいんですがねえ
これを任意の文の数にまとめられて更に
「動作を文章にするアプリ」と組み合わせることで作業手順書の自動作成ができて
ひいては行動計画に関する人工知能の開発が進むといいんですがねえ
976デフォルトの名無しさん (ワッチョイ 2302-KrGZ [59.138.123.33])
2021/09/05(日) 22:33:17.49ID:vgQPhGSA0 どうして文の「数」にこだわるの?
重要なことがその「数」以上あったらどうするの?
重要なことがその「数」以上あったらどうするの?
977デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.155.58])
2021/09/06(月) 01:15:14.50ID:otQfwK4Sr 3つにする、5つにする、など試して最も妥当な説明書になっているものを最終出力出来たらいいんですがねえ
978デフォルトの名無しさん (ワッチョイ 4b10-jJn5 [153.243.43.6])
2021/09/06(月) 01:21:37.13ID:owoO2Yj90 妥当な説明を定式化せよ
979デフォルトの名無しさん (テテンテンテン MM4b-8fYv [133.106.37.33])
2021/09/06(月) 08:50:13.28ID:0zGOZ0ajM >>975
できるんじゃない?
できるんじゃない?
980デフォルトの名無しさん (アウアウウー Sa69-KrGZ [106.129.21.248])
2021/09/06(月) 09:29:44.52ID:fsHJbGHja 重要な項目が5つあって、3つの文にせよ
という場合は、一つの文に2つ盛り込むとか?
なんだか本末転倒だなあ
重要な項目がいくつあるか分からなくなるじゃないの
という場合は、一つの文に2つ盛り込むとか?
なんだか本末転倒だなあ
重要な項目がいくつあるか分からなくなるじゃないの
981デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.147.134])
2021/09/06(月) 10:59:46.00ID:fK8LC2SFr 重要な項目の数に合わせて文の数も調整できたらなあ
更にはそれぞれの文の構造化まで自動化
更にはそれぞれの文の構造化まで自動化
982デフォルトの名無しさん (アウアウウー Sa69-KrGZ [106.129.21.248])
2021/09/06(月) 11:36:22.35ID:fsHJbGHja 例えば、裁判所の判決文とかは全部重要なのだそうで
要約できないらしい。法曹関係者が要約が下手なのは
そういう理由もあるらしい
要約できないらしい。法曹関係者が要約が下手なのは
そういう理由もあるらしい
983デフォルトの名無しさん (テテンテンテン MM4b-8fYv [133.106.60.110])
2021/09/06(月) 16:50:04.99ID:XuYnRkl0M ほう、そうかい
984デフォルトの名無しさん (ワッチョイ 2302-KrGZ [59.138.123.33])
2021/09/06(月) 21:34:45.15ID:3OGE1cne0 マニュアルを要約して
手順を飛ばされてもやだな
手順を飛ばされてもやだな
985デフォルトの名無しさん (ワッチョイ 4b10-jJn5 [153.243.43.6])
2021/09/07(火) 08:21:33.30ID:QjyEMXOy0 だが待って欲しい
その手順は本当に必要だったのだろうか
その手順は本当に必要だったのだろうか
986デフォルトの名無しさん (ワッチョイ ad5f-m4tS [106.73.78.34])
2021/09/07(火) 09:23:15.96ID:IHJavDsS0 いやちょっと待って欲しい
そもそも三つの文に…
そもそも三つの文に…
987デフォルトの名無しさん (ワッチョイ 6d6e-8fYv [138.64.70.222])
2021/09/07(火) 12:15:41.45ID:X6g3xS9u0 富士通あたりがやり出しそう(笑)
988デフォルトの名無しさん (アウアウウー Sa69-KUaQ [106.130.58.63])
2021/09/07(火) 13:03:13.11ID:oZHnA/lFa 試しにここのテキスト入れてみたら
めちゃくちゃ的外れな要約が出てきた
どうやら掲示板は向いてないらしい
めちゃくちゃ的外れな要約が出てきた
どうやら掲示板は向いてないらしい
989デフォルトの名無しさん (ワッチョイ 2302-KrGZ [59.138.123.33])
2021/09/07(火) 20:01:11.19ID:Cp1uuQsT0 新聞記事も読み終わって何がなんだかわからない
という記事が多いから、要約しても無駄だな
という記事が多いから、要約しても無駄だな
990デフォルトの名無しさん (ワッチョイ 13ad-GwBl [125.12.149.140])
2021/09/12(日) 11:08:30.42ID:PNU8wIel0 > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
991デフォルトの名無しさん (ワッチョイ e336-qG80 [115.36.133.227])
2021/09/22(水) 19:51:03.76ID:pNoEEii80 リッジとラッソ回帰をうまく説明するためのデータセットて何かある?
勉強会の資料で探すてる
ボストンの住宅価格でやると効果わかりにくいからその他でいいのおすえて
勉強会の資料で探すてる
ボストンの住宅価格でやると効果わかりにくいからその他でいいのおすえて
992デフォルトの名無しさん (エムゾネ FF43-hED7 [49.106.174.84])
2021/09/23(木) 12:44:23.64ID:7tGJmFKPF993デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:33:41.18ID:fnXwjiVa0994デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:34:31.80ID:fnXwjiVa0 スカラー倍
995デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:36:40.35ID:fnXwjiVa0 みっつの数に意味はない
ただの経験則
ただの経験則
996デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:41:50.83ID:fnXwjiVa0 アルタナティブ
997デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:42:53.67ID:fnXwjiVa0 🉑
998デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:44:07.46ID:fnXwjiVa0 (*´∀`*)
999デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:44:53.74ID:fnXwjiVa0 (*´∀`*)
1000デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:45:22.39ID:fnXwjiVa0 (*´∀`*)
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 267日 16時間 34分 27秒
新しいスレッドを立ててください。
life time: 267日 16時間 34分 27秒
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【学術団体】高市総理の台湾有事に関する発言を巡り、学者らが日中関係修復を求める緊急声明を発表… [BFU★]
- 中国と対話で良い関係つくるのが責任と首相 ★4 [少考さん★]
- 生クリームだけの真っ白なクリスマスケーキ 大手メーカーが販売、その理由は…フルーツなしで価格は半額以下に ★3 [おっさん友の会★]
- ぽっちゃりインフルエンサー藤田シオンさん(32) 「こう見えて76キロあります」→「サバ読むな」「どう見ても90kg」と批判受け謝罪 [muffin★]
- 【文春】元TOKIO・国分太一(51)「女性スタッフ2名への“わいせつ事案”」日テレ事情聴取の全貌が分かった! ★4 [Ailuropoda melanoleuca★]
- 〈シカが泣いている…〉奈良が“観光崩壊”危機…外国人観光客は44.5万人、宿泊客単価は3万1千円 [1ゲットロボ★]
- 【実況】博衣こよりのえちえちSSholox4周年切り抜き鑑賞🧪★2
- 高市がいつまで保つか予想するスレ [268718286]
- 【悲報】野田佳彦、高市さんの『存立危機事態』答弁を撤回 [519511584]
- 田中ほのか(54)が糞うざいからそろそろどうにかしようぜ🏡
- 現役JKのお茶会スレ( ¨̮ )︎︎𖠚ᐝ167
- 内閣に1人、とんでもない無能おるやろ? アイツ辞めさせんとこの国は滅ぶぞ!!🗾 [363226198]
