X



【統計分析】機械学習・データマイニング30
レス数が1000を超えています。これ以上書き込みはできません。
0001デフォルトの名無しさん (ワッチョイ db01-G7ci [60.86.178.93])
垢版 |
2021/01/01(金) 09:10:55.46ID:a+OQlEaa0
!extend:on:vvvvvv:1000:512
!extend:on:vvvvvv:1000:512
↑すれたてる毎に1つずつ減るので、減ってたら3回に増やしてたてること。

機械学習とデータマイニングについて語れ若人

*機械学習に意識・知能は存在しません。
  人の意識に触れたい方はスレ違いです。

■前スレ
【統計分析】機械学習・データマイニング29
https://mevius.5ch.net/test/read.cgi/tech/1597882603/
-EOF-
VIPQ2_EXTDAT: default:vvvvvv:1000:512:: EXT was configured
0952デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
垢版 |
2021/08/30(月) 11:41:39.31ID:D5v3tNv00
sudachi
0956デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
垢版 |
2021/08/30(月) 20:58:58.02ID:D5v3tNv00
バイトペアエンコーディング全盛の今、形態素解析なんて時代遅れだよねと思いきや、Whole Wordなんて手法も出てきてやっぱり重要だっていうね
0961デフォルトの名無しさん (ワッチョイ 25dd-RulN [122.249.112.164])
垢版 |
2021/08/30(月) 22:23:27.16ID:6Ldth3Lh0
愚痴みたいになるけど形態素解析とかIMEみたいな古典的な分野ばっかやりすぎて
統計的機械学習やディープラーニングへの対応が遅れて
世界に取り残されたのが日本の自然言語処理のアカデミアってイメージ
アテンションやトランスフォーマーみたいな仕組みが
日本から出てこなかったのは悲しい
0963デフォルトの名無しさん (ワッチョイ 3dca-yDFm [182.168.51.6])
垢版 |
2021/08/31(火) 04:15:10.73ID:D+Jl3XmV0
>>950
spaCyかな。利点はGPUを使えるので圧倒的に早いこと。欠点はPython依存。
0964デフォルトの名無しさん (ワッチョイ 3dca-yDFm [182.168.51.6])
垢版 |
2021/08/31(火) 04:39:38.87ID:D+Jl3XmV0
>>958
個人的にはあれはよくできてると思う。
まず、要約はextraction法とabstraction法の2種類がある。
extractionはbowを作って単語の頻出度で統計処理することでウェイトの高いセンテンスを抽出する。
一方、abstractionは要約済みの学習データをseq2seqで機械学習させることで、要約エンジンを作る。
松尾研のベンチャーが作ったのは、後者のabstractionの方で、日本語でabstractiono方式の要約エンジン
というのはほとんど見たことがない。
ただ、実際に売れるかどうかは別。
この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
企業は内部情報が外部に流出することになるのでまず100%導入はしない。
一般的なのは、企業が利用してるクラウドの中にシステム用のサーバーを立ち上げるか、
企業のイントラネットの中に専用サーバーを立ち上げることなんだが、
これをやるとSI業者には勝てない。
また、下手にこの領域に踏み込むとSI 業者が海外製の要約エンジンを日本語化して販売
を始めたりするので、敵を誘い込むことになる。
0965デフォルトの名無しさん (ワッチョイ 4db0-Y/PZ [180.46.85.8])
垢版 |
2021/08/31(火) 07:41:34.77ID:vHl4DeHq0
>この種のシステムは、を企業向けに販売しようと思ってもクラウドでAPIで提供する方式の場合だと
>企業は内部情報が外部に流出することになるのでまず100%導入はしない。

用途で言えば内部情報より外部の公開情報を要約してリサーチ等に使う方が多そうな気がするが。
そうでなくても、契約文書をチェックするサービスなんてのも商売になっているくらいだし。
0968デフォルトの名無しさん (ワッチョイ 6b10-VSBu [153.243.43.6])
垢版 |
2021/08/31(火) 19:28:12.45ID:l6anRrPu0
無限の半分は・・・無限!!
0973デフォルトの名無しさん (ワッチョイ 85ca-mUqo [182.168.51.6])
垢版 |
2021/09/04(土) 02:49:35.61ID:9cArpdYt0
>>877
Rejected internal applicants twice as likely to quit
doi.org/10.5465/amj.2018.1015
0974デフォルトの名無しさん (ワッチョイ 85ca-mUqo [182.168.51.6])
垢版 |
2021/09/04(土) 04:02:08.87ID:9cArpdYt0
>>965
いずれにしてもSeqモデルによる実装は簡単だから、要約済みの学習データさえ準備できれば
要約システムは簡単に構築可能。無料で出す分にはみんなは面白がって使うだろうけど、有料提供
となると、かなり困難に直面するんじゃないかと思っただけ。
Seqモデルは、かなり一般化してきてるので、NLP専攻の学卒者だったら、十分に構築は可能。
これが機械翻訳とかだと、かなり膨大な学習データが必要となるので、参入障壁になるが、
自動要約だと、元の学習量もしれてるので、NTTデータや富士通あたりだと多分、簡単に作れる。
また、要約の精度は学習データに依存するので、どこまで精度の高いデータを作れるかは、
最終的には開発元の資本力によって決まることになる。
0975デフォルトの名無しさん (オッペケ Sr81-T5eM [126.166.155.87])
垢版 |
2021/09/05(日) 22:01:26.67ID:zykEaDwPr
松尾研で文章を3つの文にまとめるアプリができてましたが
これを任意の文の数にまとめられて更に
「動作を文章にするアプリ」と組み合わせることで作業手順書の自動作成ができて
ひいては行動計画に関する人工知能の開発が進むといいんですがねえ
0978デフォルトの名無しさん (ワッチョイ 4b10-jJn5 [153.243.43.6])
垢版 |
2021/09/06(月) 01:21:37.13ID:owoO2Yj90
妥当な説明を定式化せよ
0985デフォルトの名無しさん (ワッチョイ 4b10-jJn5 [153.243.43.6])
垢版 |
2021/09/07(火) 08:21:33.30ID:QjyEMXOy0
だが待って欲しい
その手順は本当に必要だったのだろうか
0986デフォルトの名無しさん (ワッチョイ ad5f-m4tS [106.73.78.34])
垢版 |
2021/09/07(火) 09:23:15.96ID:IHJavDsS0
いやちょっと待って欲しい
そもそも三つの文に…
0990デフォルトの名無しさん (ワッチョイ 13ad-GwBl [125.12.149.140])
垢版 |
2021/09/12(日) 11:08:30.42ID:PNU8wIel0
> お前は毎朝起きるたびに俺に負けたことを思い出すよ^^

あー、ホンッとに思い出すなあ(笑)
キチガイの嘘つきの低レベルFランの、
朝鮮ゴキブリBot君は、
チョン独特の「なにもできないけど俺のほうがジャップより偉い!」的な
ことはよーくわかったよ。
ホントなにもできない朝鮮ゴキブリBot君!

クソチョンw
0991デフォルトの名無しさん (ワッチョイ e336-qG80 [115.36.133.227])
垢版 |
2021/09/22(水) 19:51:03.76ID:pNoEEii80
リッジとラッソ回帰をうまく説明するためのデータセットて何かある?

勉強会の資料で探すてる
ボストンの住宅価格でやると効果わかりにくいからその他でいいのおすえて
10011001
垢版 |
Over 1000Thread
このスレッドは1000を超えました。
新しいスレッドを立ててください。
life time: 267日 16時間 34分 27秒
10021002
垢版 |
Over 1000Thread
5ちゃんねるの運営はプレミアム会員の皆さまに支えられています。
運営にご協力お願いいたします。


───────────────────
《プレミアム会員の主な特典》
★ 5ちゃんねる専用ブラウザからの広告除去
★ 5ちゃんねるの過去ログを取得
★ 書き込み規制の緩和
───────────────────

会員登録には個人情報は一切必要ありません。
月300円から匿名でご購入いただけます。

▼ プレミアム会員登録はこちら ▼
https://premium.5ch.net/

▼ 浪人ログインはこちら ▼
https://login.5ch.net/login.php
レス数が1000を超えています。これ以上書き込みはできません。

ニューススポーツなんでも実況