データ量についてもう一回説明してみます。
【仕様】
・人工無脳
・BDに質問と返事を一対で登録
・質問に対して手作業で返事を登録(つまり教育している)
【データの使用頻度と数量の関係】
http://www.chat-game.net/chart.html
質問の特徴を3つにわけて、語群A、B、Cとします。
【質問の数量】
・語群Aー10万?
・語群Bー90万?
・語群Cー取り合えず100億以上
【各語群の質問の出現率】
・語群Aー30%?
・語群Bー50%?
・語群Cー20%?
【人工無脳に登録してある数量と各登録率】
総登録数約90万(これだけでも手作業で登録するのは大変でした。)
・語群Aー90%カバーできたかな?
・語群Bー50%カバーできたかな?
・語群Cー1%カバーできたくらいかな?
【自己分析】
・仮に語群A、Bを100%登録しても、語群Cが残っているので、会話のマッチ率は80%ぐらい?
・語群Cを100%登録するのは無理かな?
ニュース
- 【米FRB】0.25%利下げ決定 3会合連続、雇用下支え [蚤の市★]
- テレビ朝日本社から20~30代の関連会社社員とみられる男性が転落し死亡 六本木けやき坂通りの通行人にはけが人なし [少考さん★]
- テレビ朝日 本社から男性が転落し死亡。関連会社社員か 当たった通行人が左肩軽傷 [阿弥陀ヶ峰★]
- 「残クレ」でマイホーム、国が銀行向け保険 新型住宅ローン普及促す -日経 ★3 [少考さん★]
- 小島瑠璃子さん、代表取締役を務める会社を破産申請 [牛丼★]
- 【ジャイアンツ】ファン感謝祭で阿部監督に「お前がやめろ!」とヤジが飛ぶ巨人の異常事態… [鉄チーズ烏★]
- 【朗報】VTuber、とうとうスパロボに参戦する
- 高橋洋一、終わる [523957489]
- 毎日菊花茶飲んでたら美肌になったよ
- 🏡ダブパン本仕込み~🍞🍞😅🍞🍞🏡
- 朝雑談
- 粗品「南原が3億も貰えんの?」 [279254606]
