音声合成プログラムを作りる

**デフォルトの名無しさん** · 2007/06/14(木) 09:48:48

ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

**デフォルトの名無しさん** · 2007/06/14(木) 09:52:04

じゃあ、一緒に作るれ

**デフォルトの名無しさん** · 2007/06/14(木) 09:54:14

しゃべた

**デフォルトの名無しさん** · 2007/06/14(木) 10:08:17

ネトラジリソース多いのんって誰かな
ＢＧＭとかあんまなくって、高音質なの

**デフォルトの名無しさん** · 2007/06/14(木) 10:33:17

よし、みんなで作れろ

**デフォルトの名無しさん** · 2007/06/14(木) 12:27:51

中原小麦が多いるれ

**デフォルトの名無しさん** · 2007/06/14(木) 14:18:18

音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。

**デフォルトの名無しさん** · 2007/06/14(木) 14:39:22

音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。

7 · 2007/06/14(木) 14:57:22

シミュレーションやるより、模型？を作った方が楽なんだなー

**デフォルトの名無しさん** · 2007/06/14(木) 14:58:35

でも、模型はメンテナンスが

**デフォルトの名無しさん** · 2007/06/14(木) 16:22:28

>>7 に期待

7 · 2007/06/14(木) 20:44:39

いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ？
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。

**デフォルトの名無しさん** · 2007/06/14(木) 21:11:40

　　　　　 |
　　＼　　__　　／
　　＿　（ｍ）　＿ﾋﾟｺｰﾝ
　　　　　|ミ|
　　／　｀´　＼
　　　　　('A`)　　　　　そうだ！　自分で喋ればいいんだ！
　　　　　ノヽノヽ
　　　　　　　くく

**デフォルトの名無しさん** · 2007/06/15(金) 00:03:29

>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。

1 · 2007/06/15(金) 01:58:54

まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな

7 · 2007/06/15(金) 02:42:52

ツールならHTKにいいのがあるんじゃね？

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな？
しかし懐かしすぎ・・・

1 · 2007/06/15(金) 02:48:21

>>16
HTKおｋ、しらべる
ｔｈｘ

**デフォルトの名無しさん** · 2007/06/15(金) 16:35:47

垚

**デフォルトの名無しさん** · 2007/06/16(土) 16:15:14

1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる

1 · 2007/06/17(日) 14:53:48

ＨＴＫ登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声ｄｂ作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの？
０から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな

**デフォルトの名無しさん** · 2007/06/19(火) 02:06:23

http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ！

1 · 2007/06/20(水) 03:00:36

86時間て正味？ネトラジから集めよう思たら数年分必要だなー
ところでこれＮＨＫの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん？

**デフォルトの名無しさん** · 2007/07/08(日) 20:38:20

http://pc11.2ch.net/test/read.cgi/software/1119069271/

**デフォルトの名無しさん** · 2007/07/10(火) 17:10:43

理系大学院って工学部と理学部でだいぶ違うよな

1 · 2007/07/10(火) 23:29:09

>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな

**デフォルトの名無しさん** · 2007/07/13(金) 14:22:49

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:27:35

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:29:44

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:40:43

ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php

**デフォルトの名無しさん** · 2007/07/13(金) 18:29:39

同じ金額で声優雇った方が早くね？

1 · 2007/07/14(土) 00:03:56

>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で２ちゃんログとかメールとか
読んでもらったら面白くなくね？

**デフォルトの名無しさん** · 2007/07/19(木) 21:26:09

音（声）の切り張りと云うと、コナミがときメモ3でやってなかったっけ？
未プレイ（体験版触っただけ）だから、詳しくは解らんけど。

**名無しさん＠そうだ選挙に行こう** · 2007/07/29(日) 04:01:34

イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。

1 · 2007/07/30(月) 00:14:46

>>32
ときめも２と３でプレーヤの名前を呼んでくれる
ＥＶＳという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html

1 · 2007/07/30(月) 00:22:44

"音声合成ゲーム"で検索すると
ＰＳ２　モジブリボンにＮＴＴ
ＰＳ２　ダビつく３に東芝
ＤＳ　お料理ナビは？
ＤＳ　日本史・世界史に日立
なんてのが見つかったよ
どうなん？

1 · 2007/07/30(月) 00:26:22

>>33
イントネーションって網羅できるもんなの？
ＡｑｕｅｓＴａｌｋってあんまりきれいな声とは思えない

**デフォルトの名無しさん** · 2007/07/31(火) 01:27:57

以前でてた音声コーパスっていうのがそういうものじゃないのか？

**デフォルトの名無しさん** · 2007/07/31(火) 04:55:00

同じ単語でもどう使われるかでイントネーションって変わるからな。

**デフォルトの名無しさん** · 2007/08/01(水) 00:48:55

>>38
例えば？

**デフォルトの名無しさん** · 2007/08/06(月) 10:44:13

彼氏↑、彼氏↓

**デフォルトの名無しさん** · 2007/08/06(月) 16:39:36

箸　端　橋　嘴　波子　梯
頑張って聞き分けてください。

**デフォルトの名無しさん** · 2007/08/06(月) 17:10:09

無理ッス絶対無理ッス自分無理ッス

**デフォルトの名無しさん** · 2007/08/06(月) 20:17:36

>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。

**デフォルトの名無しさん** · 2007/08/06(月) 20:32:17

どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw

**デフォルトの名無しさん** · 2007/08/06(月) 20:33:20

>>35
くまうたも忘れないでくれ

**デフォルトの名無しさん** · 2007/08/08(水) 01:18:40

早く作りろ

**デフォルトの名無しさん** · 2007/08/08(水) 01:58:32

「あ」の波形と「い」の波形を足して２で割ったら、「あ」と「い」の中間の声ができるってわけか！

**デフォルトの名無しさん** · 2007/08/08(水) 01:59:27

ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン

**デフォルトの名無しさん** · 2007/08/08(水) 02:11:22

じゃ期限は明日の０時だ。よろしく。

**デフォルトの名無しさん** · 2007/08/08(水) 04:15:54

オーケーベイビー
首洗って待ってな。

**デフォルトの名無しさん** · 2007/08/09(木) 01:17:32

まだぁー？
もう全身洗って待ってるんだけど。

**デフォルトの名無しさん** · 2007/08/09(木) 06:52:26

声帯って振動するだけ？声によって（高さじゃなく「あ」とか「い」）振動の仕方が異なることはないよね？
音が高くなると振動数が増えるだけだよね？
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの？
舌のシミュレーションが大変そう(><;)

**デフォルトの名無しさん** · 2007/08/09(木) 10:39:18

音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。

**デフォルトの名無しさん** · 2007/08/10(金) 14:06:39

必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ

1 · 2007/08/10(金) 16:14:15

>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ

**デフォルトの名無しさん** · 2007/08/11(土) 18:40:21

どっちかっつーと話者変換のほうに興味があるんだが

**デフォルトの名無しさん** · 2007/08/16(木) 22:59:34

その声優の音声ファイルはSNいいのか？

1 · 2007/08/16(木) 23:48:39

>>56
話者変換って何に使うん？
自分のしゃべった声を誰かの声に似せるとかな？

1 · 2007/08/17(金) 00:13:19

>>57
ＳＮは分かんねが、音は良さげ（６４ｋｂｐｓの４４ｋＨｚ）
一人しゃべりでＢＧＭなしなんじょ

**デフォルトの名無しさん** · 2007/08/17(金) 01:07:05

BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。

**デフォルトの名無しさん** · 2007/08/17(金) 20:59:04

俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい

**デフォルトの名無しさん** · 2007/08/24(金) 21:36:59

エロゲの音声使えば？
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ

**デフォルトの名無しさん** · 2007/08/28(火) 07:41:37

北都さんの声でお願いします

**デフォルトの名無しさん** · 2007/09/06(木) 14:16:39

結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF

**デフォルトの名無しさん** · 2007/09/06(木) 20:14:37

>>64
藤田咲はまなストのモモ役が良かったなぁ

**デフォルトの名無しさん** · 2007/09/21(金) 10:48:08

ときめも２以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて

**デフォルトの名無しさん** · 2007/12/17(月) 22:51:47

>>66
overlap add

**デフォルトの名無しさん** · 2007/12/19(水) 12:23:36

――
学校

￣￣￣＼
専門学校

**デフォルトの名無しさん** · 2007/12/20(木) 23:14:24

>>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい

**デフォルトの名無しさん** · 2007/12/21(金) 01:38:07

Alice Project

**デフォルトの名無しさん** · 2007/12/24(月) 09:25:18

2007/12/19(Wed.) ◆ Julius-4.0 リリース

**デフォルトの名無しさん** · 2007/12/29(土) 18:28:29

初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。

そんな、俺に、お勧めはこれ。

「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1

**デフォルトの名無しさん** · 2007/12/30(日) 12:03:36

音声合成というより、台詞合成だな

**デフォルトの名無しさん** · 2007/12/30(日) 13:55:26

>>72
ワロタ

**デフォルトの名無しさん** · 2008/01/06(日) 13:05:04

れこーどうえーぶ
http://recwav.dip.jp/

音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222

**デフォルトの名無しさん** · 2008/01/10(木) 21:52:09

この板の住人じゃないんだけどＡｑｕｅｓＴａｌｋでwav保存できるソフト
あるのかな？
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしｗ

**デフォルトの名無しさん** · 2008/01/11(金) 06:44:14

全二十じゃないの？

**デフォルトの名無しさん** · 2008/01/11(金) 13:26:54

全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば？ということかな？
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。

**デフォルトの名無しさん** · 2008/01/13(日) 09:32:40

普通に、ライン出力を録画するんではダメなのか？

**デフォルトの名無しさん** · 2008/01/18(金) 02:45:43

>>78
スマンスマンｗ
二十って書いたの俺かもｗ

**デフォルトの名無しさん** · 2008/01/19(土) 00:36:30

>>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか？
ほとんどの人がライセンスがないから試せないと思われ。

**デフォルトの名無しさん** · 2008/01/26(土) 02:02:50

>>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない

**デフォルトの名無しさん** · 2008/01/26(土) 02:53:10

全二重に温室関係案のカナ？

**デフォルトの名無しさん** · 2008/02/07(木) 12:56:18

いまどこまで進んでいるんだ？

**デフォルトの名無しさん** · 2008/03/24(月) 13:24:15

age

**デフォルトの名無しさん** · 2008/04/06(日) 12:19:17

>>1
おーい！いまどこまで進んでいるんだ？

**デフォルトの名無しさん** · 2008/04/07(月) 01:29:34

age

**デフォルトの名無しさん** · 2008/04/07(月) 04:01:19

「あ」の波形と「う」の波形を足して２で割ったら「い」の波形ができるのを発見して特許取った

**デフォルトの名無しさん** · 2008/04/07(月) 08:54:58

特許番号は？

**デフォルトの名無しさん** · 2008/04/07(月) 21:51:13

どのくらい「い」と区別が付かないんだ？
不自然感０？

**デフォルトの名無しさん** · 2008/04/07(月) 21:54:23

じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん

**デフォルトの名無しさん** · 2008/04/23(水) 18:22:12

>>88-91
もうちょっとでアヘ声が実現するな

**デフォルトの名無しさん** · 2008/04/29(火) 23:32:40

>>88　特許番号は？

**デフォルトの名無しさん** · 2008/05/01(木) 14:02:57

juliusで音素列を指定して、
強制アライメント取れますか？

**デフォルトの名無しさん** · 2008/05/02(金) 23:24:08

>>94
つ単語・音素セグメンテーションキット＆Julian