!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。
機械学習とデータマイニングについて語れ若人
*機械学習に意識・知能は存在しません。
人の意識に触れたい方はスレ違いです。
■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
探検
【統計分析】機械学習・データマイニング30
レス数が1000を超えています。これ以上書き込みはできません。
1デフォルトの名無しさん (ワッチョイ db01-G7ci [60.86.178.93])
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0952デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
2021/08/30(月) 11:41:39.31ID:D5v3tNv00 sudachi
953デフォルトの名無しさん (ワッチョイ 7b89-U7Lh [39.111.228.181])
2021/08/30(月) 13:28:14.44ID:HWYFF8sx0 メカブは体にいい
954デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/30(月) 19:26:51.33ID:t9q3RQuP0 >>951
使っている手法がcrfベースと古いから
使っている手法がcrfベースと古いから
955デフォルトの名無しさん (ワッチョイ 6b10-rjuI [153.131.102.129])
2021/08/30(月) 20:53:05.50ID:DbDPNUf30 >>954
手法が古くても必要な結果を得られたら問題無いんじゃね?
手法が古くても必要な結果を得られたら問題無いんじゃね?
956デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
2021/08/30(月) 20:58:58.02ID:D5v3tNv00 バイトペアエンコーディング全盛の今、形態素解析なんて時代遅れだよねと思いきや、Whole Wordなんて手法も出てきてやっぱり重要だっていうね
957デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/30(月) 21:56:49.19ID:t9q3RQuP0958デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/30(月) 21:59:20.42ID:t9q3RQuP0 松尾研の要約システム、ひどいな
959デフォルトの名無しさん (ワッチョイ 9d01-wtVn [60.69.230.42])
2021/08/30(月) 22:00:46.32ID:FcBMjYja0 精度が売上に直結するならいいけど
弱い相関ならシンプルなロジック選んでしまうな
弱い相関ならシンプルなロジック選んでしまうな
960デフォルトの名無しさん (ワッチョイ e302-3Axr [59.138.123.33])
2021/08/30(月) 22:13:34.30ID:IfLgW1Xz0 40年以上前から言われているけど
何文字以内、何行以下の要約というのは
あまり意味がない。必須な部分がかけてしまうかもしれないし
余分な部分が残ってしまうことがある
何文字以内、何行以下の要約というのは
あまり意味がない。必須な部分がかけてしまうかもしれないし
余分な部分が残ってしまうことがある
961デフォルトの名無しさん (ワッチョイ 25dd-RulN [122.249.112.164])
2021/08/30(月) 22:23:27.16ID:6Ldth3Lh0 愚痴みたいになるけど形態素解析とかIMEみたいな古典的な分野ばっかやりすぎて
統計的機械学習やディープラーニングへの対応が遅れて
世界に取り残されたのが日本の自然言語処理のアカデミアってイメージ
アテンションやトランスフォーマーみたいな仕組みが
日本から出てこなかったのは悲しい
統計的機械学習やディープラーニングへの対応が遅れて
世界に取り残されたのが日本の自然言語処理のアカデミアってイメージ
アテンションやトランスフォーマーみたいな仕組みが
日本から出てこなかったのは悲しい
962デフォルトの名無しさん (ワッチョイ 6b10-rjuI [153.131.102.129])
2021/08/30(月) 23:06:53.06ID:DbDPNUf30963デフォルトの名無しさん (ワッチョイ 3dca-yDFm [182.168.51.6])
2021/08/31(火) 04:15:10.73ID:D+Jl3XmV0 >>950
spaCyかな。利点はGPUを使えるので圧倒的に早いこと。欠点はPython依存。
spaCyかな。利点はGPUを使えるので圧倒的に早いこと。欠点はPython依存。
964デフォルトの名無しさん (ワッチョイ 3dca-yDFm [182.168.51.6])
2021/08/31(火) 04:39:38.87ID:D+Jl3XmV0 >>958
個人的にはあれはよくできてると思う。
まず、要約はextraction法とabstraction法の2種類がある。
extractionはbowを作って単語の頻出度で統計処理することでウェイトの高いセンテンスを抽出する。
一方、abstractionは要約済みの学習データをseq2seqで機械学習させることで、要約エンジンを作る。
松尾研のベンチャーが作ったのは、後者のabstractionの方で、日本語でabstractiono方式の要約エンジン
というのはほとんど見たことがない。
ただ、実際に売れるかどうかは別。
この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
企業は内部情報が外部に流出することになるのでまず100%導入はしない。
一般的なのは、企業が利用してるクラウドの中にシステム用のサーバーを立ち上げるか、
企業のイントラネットの中に専用サーバーを立ち上げることなんだが、
これをやるとSI業者には勝てない。
また、下手にこの領域に踏み込むとSI 業者が海外製の要約エンジンを日本語化して販売
を始めたりするので、敵を誘い込むことになる。
個人的にはあれはよくできてると思う。
まず、要約はextraction法とabstraction法の2種類がある。
extractionはbowを作って単語の頻出度で統計処理することでウェイトの高いセンテンスを抽出する。
一方、abstractionは要約済みの学習データをseq2seqで機械学習させることで、要約エンジンを作る。
松尾研のベンチャーが作ったのは、後者のabstractionの方で、日本語でabstractiono方式の要約エンジン
というのはほとんど見たことがない。
ただ、実際に売れるかどうかは別。
この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
企業は内部情報が外部に流出することになるのでまず100%導入はしない。
一般的なのは、企業が利用してるクラウドの中にシステム用のサーバーを立ち上げるか、
企業のイントラネットの中に専用サーバーを立ち上げることなんだが、
これをやるとSI業者には勝てない。
また、下手にこの領域に踏み込むとSI 業者が海外製の要約エンジンを日本語化して販売
を始めたりするので、敵を誘い込むことになる。
965デフォルトの名無しさん (ワッチョイ 4db0-Y/PZ [180.46.85.8])
2021/08/31(火) 07:41:34.77ID:vHl4DeHq0 >この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
>企業は内部情報が外部に流出することになるのでまず100%導入はしない。
用途で言えば内部情報より外部の公開情報を要約してリサーチ等に使う方が多そうな気がするが。
そうでなくても、契約文書をチェックするサービスなんてのも商売になっているくらいだし。
>企業は内部情報が外部に流出することになるのでまず100%導入はしない。
用途で言えば内部情報より外部の公開情報を要約してリサーチ等に使う方が多そうな気がするが。
そうでなくても、契約文書をチェックするサービスなんてのも商売になっているくらいだし。
966デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/31(火) 14:21:53.09ID:Sht6cbMy0 optunaで指定するパラメータの範囲はどう決めれば良いの?
apiにパラメータの取りうる範囲が1 <= p < ∞とあるとき
apiにパラメータの取りうる範囲が1 <= p < ∞とあるとき
967デフォルトの名無しさん (オイコラミネオ MM09-ABh5 [150.66.78.51])
2021/08/31(火) 15:50:48.02ID:j/ruVWceM 1と∞で二分探索
968デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
2021/08/31(火) 19:28:12.45ID:l6anRrPu0 無限の半分は・・・無限!!
969デフォルトの名無しさん (ワッチョイ 25dd-RulN [122.249.112.164])
2021/08/31(火) 19:30:49.23ID:IiAPjlBZ0 >>966
無限大に発散するような関数はまずないはずだけどどういう式?
無限大に発散するような関数はまずないはずだけどどういう式?
970id:ignore (オッペケ Sr99-BJ4f [126.255.84.77 [上級国民]])
2021/08/31(火) 20:06:05.81ID:Yj2FMtNrr exp
971デフォルトの名無しさん (ワッチョイ 7b89-U7Lh [39.111.228.181])
2021/08/31(火) 20:07:05.73ID:TL2gsmuJ0 表からともったら裏、裏かとと思ったら表
972デフォルトの名無しさん (ワッチョイ 856e-bRri [138.64.70.222])
2021/08/31(火) 20:56:01.05ID:Sht6cbMy0973デフォルトの名無しさん (ワッチョイ 85ca-mUqo [182.168.51.6])
2021/09/04(土) 02:49:35.61ID:9cArpdYt0974デフォルトの名無しさん (ワッチョイ 85ca-mUqo [182.168.51.6])
2021/09/04(土) 04:02:08.87ID:9cArpdYt0 >>965
いずれにしてもSeqモデルによる実装は簡単だから、要約済みの学習データさえ準備できれば
要約システムは簡単に構築可能。無料で出す分にはみんなは面白がって使うだろうけど、有料提供
となると、かなり困難に直面するんじゃないかと思っただけ。
Seqモデルは、かなり一般化してきてるので、NLP専攻の学卒者だったら、十分に構築は可能。
これが機械翻訳とかだと、かなり膨大な学習データが必要となるので、参入障壁になるが、
自動要約だと、元の学習量もしれてるので、NTTデータや富士通あたりだと多分、簡単に作れる。
また、要約の精度は学習データに依存するので、どこまで精度の高いデータを作れるかは、
最終的には開発元の資本力によって決まることになる。
いずれにしてもSeqモデルによる実装は簡単だから、要約済みの学習データさえ準備できれば
要約システムは簡単に構築可能。無料で出す分にはみんなは面白がって使うだろうけど、有料提供
となると、かなり困難に直面するんじゃないかと思っただけ。
Seqモデルは、かなり一般化してきてるので、NLP専攻の学卒者だったら、十分に構築は可能。
これが機械翻訳とかだと、かなり膨大な学習データが必要となるので、参入障壁になるが、
自動要約だと、元の学習量もしれてるので、NTTデータや富士通あたりだと多分、簡単に作れる。
また、要約の精度は学習データに依存するので、どこまで精度の高いデータを作れるかは、
最終的には開発元の資本力によって決まることになる。
975デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.155.87])
2021/09/05(日) 22:01:26.67ID:zykEaDwPr 松尾研で文章を3つの文にまとめるアプリができてましたが
これを任意の文の数にまとめられて更に
「動作を文章にするアプリ」と組み合わせることで作業手順書の自動作成ができて
ひいては行動計画に関する人工知能の開発が進むといいんですがねえ
これを任意の文の数にまとめられて更に
「動作を文章にするアプリ」と組み合わせることで作業手順書の自動作成ができて
ひいては行動計画に関する人工知能の開発が進むといいんですがねえ
976デフォルトの名無しさん (ワッチョイ 2302-KrGZ [59.138.123.33])
2021/09/05(日) 22:33:17.49ID:vgQPhGSA0 どうして文の「数」にこだわるの?
重要なことがその「数」以上あったらどうするの?
重要なことがその「数」以上あったらどうするの?
977デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.155.58])
2021/09/06(月) 01:15:14.50ID:otQfwK4Sr 3つにする、5つにする、など試して最も妥当な説明書になっているものを最終出力出来たらいいんですがねえ
978デフォルトの名無しさん (ワッチョイ 4b10-jJn5 [153.243.43.6])
2021/09/06(月) 01:21:37.13ID:owoO2Yj90 妥当な説明を定式化せよ
979デフォルトの名無しさん (テテンテンテン MM4b-8fYv [133.106.37.33])
2021/09/06(月) 08:50:13.28ID:0zGOZ0ajM >>975
できるんじゃない?
できるんじゃない?
980デフォルトの名無しさん (アウアウウー Sa69-KrGZ [106.129.21.248])
2021/09/06(月) 09:29:44.52ID:fsHJbGHja 重要な項目が5つあって、3つの文にせよ
という場合は、一つの文に2つ盛り込むとか?
なんだか本末転倒だなあ
重要な項目がいくつあるか分からなくなるじゃないの
という場合は、一つの文に2つ盛り込むとか?
なんだか本末転倒だなあ
重要な項目がいくつあるか分からなくなるじゃないの
981デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.147.134])
2021/09/06(月) 10:59:46.00ID:fK8LC2SFr 重要な項目の数に合わせて文の数も調整できたらなあ
更にはそれぞれの文の構造化まで自動化
更にはそれぞれの文の構造化まで自動化
982デフォルトの名無しさん (アウアウウー Sa69-KrGZ [106.129.21.248])
2021/09/06(月) 11:36:22.35ID:fsHJbGHja 例えば、裁判所の判決文とかは全部重要なのだそうで
要約できないらしい。法曹関係者が要約が下手なのは
そういう理由もあるらしい
要約できないらしい。法曹関係者が要約が下手なのは
そういう理由もあるらしい
983デフォルトの名無しさん (テテンテンテン MM4b-8fYv [133.106.60.110])
2021/09/06(月) 16:50:04.99ID:XuYnRkl0M ほう、そうかい
984デフォルトの名無しさん (ワッチョイ 2302-KrGZ [59.138.123.33])
2021/09/06(月) 21:34:45.15ID:3OGE1cne0 マニュアルを要約して
手順を飛ばされてもやだな
手順を飛ばされてもやだな
985デフォルトの名無しさん (ワッチョイ 4b10-jJn5 [153.243.43.6])
2021/09/07(火) 08:21:33.30ID:QjyEMXOy0 だが待って欲しい
その手順は本当に必要だったのだろうか
その手順は本当に必要だったのだろうか
986デフォルトの名無しさん (ワッチョイ ad5f-m4tS [106.73.78.34])
2021/09/07(火) 09:23:15.96ID:IHJavDsS0 いやちょっと待って欲しい
そもそも三つの文に…
そもそも三つの文に…
987デフォルトの名無しさん (ワッチョイ 6d6e-8fYv [138.64.70.222])
2021/09/07(火) 12:15:41.45ID:X6g3xS9u0 富士通あたりがやり出しそう(笑)
988デフォルトの名無しさん (アウアウウー Sa69-KUaQ [106.130.58.63])
2021/09/07(火) 13:03:13.11ID:oZHnA/lFa 試しにここのテキスト入れてみたら
めちゃくちゃ的外れな要約が出てきた
どうやら掲示板は向いてないらしい
めちゃくちゃ的外れな要約が出てきた
どうやら掲示板は向いてないらしい
989デフォルトの名無しさん (ワッチョイ 2302-KrGZ [59.138.123.33])
2021/09/07(火) 20:01:11.19ID:Cp1uuQsT0 新聞記事も読み終わって何がなんだかわからない
という記事が多いから、要約しても無駄だな
という記事が多いから、要約しても無駄だな
990デフォルトの名無しさん (ワッチョイ 13ad-GwBl [125.12.149.140])
2021/09/12(日) 11:08:30.42ID:PNU8wIel0 > お前は毎朝起きるたびに俺に負けたことを思い出すよ^^
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!
クソチョンw
991デフォルトの名無しさん (ワッチョイ e336-qG80 [115.36.133.227])
2021/09/22(水) 19:51:03.76ID:pNoEEii80 リッジとラッソ回帰をうまく説明するためのデータセットて何かある?
勉強会の資料で探すてる
ボストンの住宅価格でやると効果わかりにくいからその他でいいのおすえて
勉強会の資料で探すてる
ボストンの住宅価格でやると効果わかりにくいからその他でいいのおすえて
992デフォルトの名無しさん (エムゾネ FF43-hED7 [49.106.174.84])
2021/09/23(木) 12:44:23.64ID:7tGJmFKPF993デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:33:41.18ID:fnXwjiVa0994デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:34:31.80ID:fnXwjiVa0 スカラー倍
995デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:36:40.35ID:fnXwjiVa0 みっつの数に意味はない
ただの経験則
ただの経験則
996デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:41:50.83ID:fnXwjiVa0 アルタナティブ
997デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:42:53.67ID:fnXwjiVa0 🉑
998デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:44:07.46ID:fnXwjiVa0 (*´∀`*)
999デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:44:53.74ID:fnXwjiVa0 (*´∀`*)
1000デフォルトの名無しさん (ワッチョイ 8310-4VFp [114.163.141.1])
2021/09/26(日) 01:45:22.39ID:fnXwjiVa0 (*´∀`*)
10011001
Over 1000Thread このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 267日 16時間 34分 27秒
新しいスレッドを立ててください。
life time: 267日 16時間 34分 27秒
10021002
Over 1000Thread 5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
運営にご協力お願いいたします。
───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────
会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。
▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/
▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。
ニュース
- 【工作員】「X」のアカウント所在地公開機能が暴いた世論操作の実態 MAGA支持著名アカウントの多くが米国外から運営 日本にも波及 ★2 [ごまカンパチ★]
- 【大阪】日本一高い観覧車が落雷で緊急停止 約20人乗客が閉じ込められ9時間にわたり救助活動 [七波羅探題★]
- 【・(ェ)・】「くまちゃんがいた」散歩中の2歳園児が発見 クリ林に1頭のクマ…保育士「ワンちゃんだね…」と声かけて移動 [Ailuropoda melanoleuca★]
- ラピダス、第2工場建設でも見えぬ顧客 技術開発も難題山積 [蚤の市★]
- 【芸能】安達祐実 44歳の最新姿「ぇーーーーー!!!」「声出た」「なんなの」「まって」「ワオ」 [湛然★]
- 【大阪】「もっとこっち来てよ」女子高校生を電車内に連れ込み 小学校教諭再逮捕「話をしたかっただけ [七波羅探題★]
- 【悲報】小野田紀美「私のドレスは日本の正礼装なんだが?ダサいと言ってるやつは日本文化を否定し国内ブランドを貶したいのか?」 [802034645]
- 田中みな実(39)「弘中ちゃんは泣いてる時も近くにいてくれるから友達」
- 【📦】Amazonブラックフライデー、まだ熱い!体温程度の3日目(水曜日)突入!!!
- 高市ジャパン、核融合開発に1千億円の超大規模投資!これで日本の未来は安泰だね [668970678]
- 日経「ギャー!中国がおやびんと高市さんの仲を引き裂こうとしてる!」中国、台湾問題で日米の分断狙う [834922174]
- 【悲報】『たぬかな』ファンのホビット、絶望「こうして36歳年収650万円身長155cmの底辺独身男性が残りましたとさ…どうすればいいんだよ [257926174]
