音声合成プログラムを作りる

**デフォルトの名無しさん** · 2007/06/14(木) 09:48:48

ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

**デフォルトの名無しさん** · 2007/06/14(木) 09:52:04

じゃあ、一緒に作るれ

**デフォルトの名無しさん** · 2007/06/14(木) 09:54:14

しゃべた

**デフォルトの名無しさん** · 2007/06/14(木) 10:08:17

ネトラジリソース多いのんって誰かな
ＢＧＭとかあんまなくって、高音質なの

**デフォルトの名無しさん** · 2007/06/14(木) 10:33:17

よし、みんなで作れろ

**デフォルトの名無しさん** · 2007/06/14(木) 12:27:51

中原小麦が多いるれ

**デフォルトの名無しさん** · 2007/06/14(木) 14:18:18

音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。

**デフォルトの名無しさん** · 2007/06/14(木) 14:39:22

音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。

7 · 2007/06/14(木) 14:57:22

シミュレーションやるより、模型？を作った方が楽なんだなー

**デフォルトの名無しさん** · 2007/06/14(木) 14:58:35

でも、模型はメンテナンスが

**デフォルトの名無しさん** · 2007/06/14(木) 16:22:28

>>7 に期待

7 · 2007/06/14(木) 20:44:39

いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ？
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。

**デフォルトの名無しさん** · 2007/06/14(木) 21:11:40

　　　　　 |
　　＼　　__　　／
　　＿　（ｍ）　＿ﾋﾟｺｰﾝ
　　　　　|ミ|
　　／　｀´　＼
　　　　　('A`)　　　　　そうだ！　自分で喋ればいいんだ！
　　　　　ノヽノヽ
　　　　　　　くく

**デフォルトの名無しさん** · 2007/06/15(金) 00:03:29

>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。

1 · 2007/06/15(金) 01:58:54

まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな

7 · 2007/06/15(金) 02:42:52

ツールならHTKにいいのがあるんじゃね？

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな？
しかし懐かしすぎ・・・

1 · 2007/06/15(金) 02:48:21

>>16
HTKおｋ、しらべる
ｔｈｘ

**デフォルトの名無しさん** · 2007/06/15(金) 16:35:47

垚

**デフォルトの名無しさん** · 2007/06/16(土) 16:15:14

1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる

1 · 2007/06/17(日) 14:53:48

ＨＴＫ登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声ｄｂ作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの？
０から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな

**デフォルトの名無しさん** · 2007/06/19(火) 02:06:23

http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ！

1 · 2007/06/20(水) 03:00:36

86時間て正味？ネトラジから集めよう思たら数年分必要だなー
ところでこれＮＨＫの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん？

**デフォルトの名無しさん** · 2007/07/08(日) 20:38:20

http://pc11.2ch.net/test/read.cgi/software/1119069271/

**デフォルトの名無しさん** · 2007/07/10(火) 17:10:43

理系大学院って工学部と理学部でだいぶ違うよな

1 · 2007/07/10(火) 23:29:09

>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな

**デフォルトの名無しさん** · 2007/07/13(金) 14:22:49

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:27:35

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:29:44

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:40:43

ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php

**デフォルトの名無しさん** · 2007/07/13(金) 18:29:39

同じ金額で声優雇った方が早くね？

1 · 2007/07/14(土) 00:03:56

>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で２ちゃんログとかメールとか
読んでもらったら面白くなくね？

**デフォルトの名無しさん** · 2007/07/19(木) 21:26:09

音（声）の切り張りと云うと、コナミがときメモ3でやってなかったっけ？
未プレイ（体験版触っただけ）だから、詳しくは解らんけど。

**名無しさん＠そうだ選挙に行こう** · 2007/07/29(日) 04:01:34

イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。

1 · 2007/07/30(月) 00:14:46

>>32
ときめも２と３でプレーヤの名前を呼んでくれる
ＥＶＳという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html

1 · 2007/07/30(月) 00:22:44

"音声合成ゲーム"で検索すると
ＰＳ２　モジブリボンにＮＴＴ
ＰＳ２　ダビつく３に東芝
ＤＳ　お料理ナビは？
ＤＳ　日本史・世界史に日立
なんてのが見つかったよ
どうなん？

1 · 2007/07/30(月) 00:26:22

>>33
イントネーションって網羅できるもんなの？
ＡｑｕｅｓＴａｌｋってあんまりきれいな声とは思えない

**デフォルトの名無しさん** · 2007/07/31(火) 01:27:57

以前でてた音声コーパスっていうのがそういうものじゃないのか？

**デフォルトの名無しさん** · 2007/07/31(火) 04:55:00

同じ単語でもどう使われるかでイントネーションって変わるからな。

**デフォルトの名無しさん** · 2007/08/01(水) 00:48:55

>>38
例えば？

**デフォルトの名無しさん** · 2007/08/06(月) 10:44:13

彼氏↑、彼氏↓

**デフォルトの名無しさん** · 2007/08/06(月) 16:39:36

箸　端　橋　嘴　波子　梯
頑張って聞き分けてください。

**デフォルトの名無しさん** · 2007/08/06(月) 17:10:09

無理ッス絶対無理ッス自分無理ッス

**デフォルトの名無しさん** · 2007/08/06(月) 20:17:36

>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。

**デフォルトの名無しさん** · 2007/08/06(月) 20:32:17

どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw

**デフォルトの名無しさん** · 2007/08/06(月) 20:33:20

>>35
くまうたも忘れないでくれ

**デフォルトの名無しさん** · 2007/08/08(水) 01:18:40

早く作りろ

**デフォルトの名無しさん** · 2007/08/08(水) 01:58:32

「あ」の波形と「い」の波形を足して２で割ったら、「あ」と「い」の中間の声ができるってわけか！

**デフォルトの名無しさん** · 2007/08/08(水) 01:59:27

ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン

**デフォルトの名無しさん** · 2007/08/08(水) 02:11:22

じゃ期限は明日の０時だ。よろしく。

**デフォルトの名無しさん** · 2007/08/08(水) 04:15:54

オーケーベイビー
首洗って待ってな。

**デフォルトの名無しさん** · 2007/08/09(木) 01:17:32

まだぁー？
もう全身洗って待ってるんだけど。

**デフォルトの名無しさん** · 2007/08/09(木) 06:52:26

声帯って振動するだけ？声によって（高さじゃなく「あ」とか「い」）振動の仕方が異なることはないよね？
音が高くなると振動数が増えるだけだよね？
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの？
舌のシミュレーションが大変そう(><;)

**デフォルトの名無しさん** · 2007/08/09(木) 10:39:18

音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。

**デフォルトの名無しさん** · 2007/08/10(金) 14:06:39

必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ

1 · 2007/08/10(金) 16:14:15

>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ

**デフォルトの名無しさん** · 2007/08/11(土) 18:40:21

どっちかっつーと話者変換のほうに興味があるんだが

**デフォルトの名無しさん** · 2007/08/16(木) 22:59:34

その声優の音声ファイルはSNいいのか？

1 · 2007/08/16(木) 23:48:39

>>56
話者変換って何に使うん？
自分のしゃべった声を誰かの声に似せるとかな？

1 · 2007/08/17(金) 00:13:19

>>57
ＳＮは分かんねが、音は良さげ（６４ｋｂｐｓの４４ｋＨｚ）
一人しゃべりでＢＧＭなしなんじょ

**デフォルトの名無しさん** · 2007/08/17(金) 01:07:05

BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。

**デフォルトの名無しさん** · 2007/08/17(金) 20:59:04

俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい

**デフォルトの名無しさん** · 2007/08/24(金) 21:36:59

エロゲの音声使えば？
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ

**デフォルトの名無しさん** · 2007/08/28(火) 07:41:37

北都さんの声でお願いします

**デフォルトの名無しさん** · 2007/09/06(木) 14:16:39

結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF

**デフォルトの名無しさん** · 2007/09/06(木) 20:14:37

>>64
藤田咲はまなストのモモ役が良かったなぁ

**デフォルトの名無しさん** · 2007/09/21(金) 10:48:08

ときめも２以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて

**デフォルトの名無しさん** · 2007/12/17(月) 22:51:47

>>66
overlap add