音声合成プログラムを作りる

■ このスレッドは過去ログ倉庫に格納されています
2007/06/14(木) 09:48:48
ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

2007/06/14(木) 09:52:04
じゃあ、一緒に作るれ
2007/06/14(木) 09:54:14
しゃべた
2007/06/14(木) 10:08:17
ネトラジリソース多いのんって誰かな
BGMとかあんまなくって、高音質なの
2007/06/14(木) 10:33:17
よし、みんなで作れろ
2007/06/14(木) 12:27:51
中原小麦が多いるれ
2007/06/14(木) 14:18:18
音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。
2007/06/14(木) 14:39:22
音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。
97
垢版 |
2007/06/14(木) 14:57:22
シミュレーションやるより、模型?を作った方が楽なんだなー
2007/06/14(木) 14:58:35
でも、模型はメンテナンスが
2007/06/14(木) 16:22:28
>>7 に期待
127
垢版 |
2007/06/14(木) 20:44:39
いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ?
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。
2007/06/14(木) 21:11:40
       |
   \  __  /
   _ (m) _ピコーン
      |ミ|
    /  `´  \
     ('A`)     そうだ! 自分で喋ればいいんだ!
     ノヽノヽ
       くく
2007/06/15(金) 00:03:29
>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。
151
垢版 |
2007/06/15(金) 01:58:54
まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな
167
垢版 |
2007/06/15(金) 02:42:52
ツールならHTKにいいのがあるんじゃね?

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな?
しかし懐かしすぎ・・・
171
垢版 |
2007/06/15(金) 02:48:21
>>16
HTKおk、しらべる
thx
2007/06/15(金) 16:35:47
2007/06/16(土) 16:15:14
1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる
201
垢版 |
2007/06/17(日) 14:53:48
HTK登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声db作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの?
0から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな
2007/06/19(火) 02:06:23
http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ!
221
垢版 |
2007/06/20(水) 03:00:36
86時間て正味?ネトラジから集めよう思たら数年分必要だなー
ところでこれNHKの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん?
2007/07/08(日) 20:38:20
http://pc11.2ch.net/test/read.cgi/software/1119069271/
2007/07/10(火) 17:10:43
理系大学院って工学部と理学部でだいぶ違うよな
251
垢版 |
2007/07/10(火) 23:29:09
>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな
2007/07/13(金) 14:22:49
age
2007/07/13(金) 14:27:35
age
28デフォルトの名無しさん
垢版 |
2007/07/13(金) 14:29:44
age
29デフォルトの名無しさん
垢版 |
2007/07/13(金) 14:40:43
ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php
2007/07/13(金) 18:29:39
同じ金額で声優雇った方が早くね?
311
垢版 |
2007/07/14(土) 00:03:56
>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で2ちゃんログとかメールとか
読んでもらったら面白くなくね?
2007/07/19(木) 21:26:09
音(声)の切り張りと云うと、コナミがときメモ3でやってなかったっけ?
未プレイ(体験版触っただけ)だから、詳しくは解らんけど。
2007/07/29(日) 04:01:34
イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。
341
垢版 |
2007/07/30(月) 00:14:46
>>32
ときめも2と3でプレーヤの名前を呼んでくれる
EVSという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html
351
垢版 |
2007/07/30(月) 00:22:44
"音声合成 ゲーム"で検索すると
PS2 モジブリボンにNTT
PS2 ダビつく3に東芝
DS お料理ナビは?
DS 日本史・世界史に日立
なんてのが見つかったよ
どうなん?
361
垢版 |
2007/07/30(月) 00:26:22
>>33
イントネーションって網羅できるもんなの?
AquesTalkってあんまりきれいな声とは思えない
2007/07/31(火) 01:27:57
以前でてた音声コーパスっていうのがそういうものじゃないのか?
2007/07/31(火) 04:55:00
同じ単語でもどう使われるかでイントネーションって変わるからな。
2007/08/01(水) 00:48:55
>>38
例えば?
2007/08/06(月) 10:44:13
彼氏↑、彼氏↓
41デフォルトの名無しさん
垢版 |
2007/08/06(月) 16:39:36
箸 端 橋 嘴 波子 梯
頑張って聞き分けてください。
42デフォルトの名無しさん
垢版 |
2007/08/06(月) 17:10:09
無理ッス絶対無理ッス自分無理ッス
2007/08/06(月) 20:17:36
>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。
2007/08/06(月) 20:32:17
どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw
2007/08/06(月) 20:33:20
>>35
くまうたも忘れないでくれ
2007/08/08(水) 01:18:40
早く作りろ
2007/08/08(水) 01:58:32
「あ」の波形と「い」の波形を足して2で割ったら、「あ」と「い」の中間の声ができるってわけか!
2007/08/08(水) 01:59:27
ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン
2007/08/08(水) 02:11:22
じゃ期限は明日の0時だ。よろしく。
2007/08/08(水) 04:15:54
オーケーベイビー
首洗って待ってな。
2007/08/09(木) 01:17:32
まだぁー?
もう全身洗って待ってるんだけど。
2007/08/09(木) 06:52:26
声帯って振動するだけ?声によって(高さじゃなく「あ」とか「い」)振動の仕方が異なることはないよね?
音が高くなると振動数が増えるだけだよね?
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの?
舌のシミュレーションが大変そう(><;)
2007/08/09(木) 10:39:18
音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。
2007/08/10(金) 14:06:39
必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ
551
垢版 |
2007/08/10(金) 16:14:15
>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ
2007/08/11(土) 18:40:21
どっちかっつーと話者変換のほうに興味があるんだが
2007/08/16(木) 22:59:34
その声優の音声ファイルはSNいいのか?
581
垢版 |
2007/08/16(木) 23:48:39
>>56
話者変換って何に使うん?
自分のしゃべった声を誰かの声に似せるとかな?
591
垢版 |
2007/08/17(金) 00:13:19
>>57
SNは分かんねが、音は良さげ(64kbpsの44kHz)
一人しゃべりでBGMなしなんじょ
2007/08/17(金) 01:07:05
BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。
2007/08/17(金) 20:59:04
俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい
2007/08/24(金) 21:36:59
エロゲの音声使えば?
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ
2007/08/28(火) 07:41:37
北都さんの声でお願いします
2007/09/06(木) 14:16:39
結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF
2007/09/06(木) 20:14:37
>>64
藤田咲はまなストのモモ役が良かったなぁ
2007/09/21(金) 10:48:08
ときめも2以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて
2007/12/17(月) 22:51:47
>>66
overlap add
2007/12/19(水) 12:23:36
――
学校

 ̄ ̄ ̄\
専門学校
2007/12/20(木) 23:14:24
>>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい
2007/12/21(金) 01:38:07
Alice Project
2007/12/24(月) 09:25:18
2007/12/19(Wed.) ◆ Julius-4.0 リリース
72デフォルトの名無しさん
垢版 |
2007/12/29(土) 18:28:29
初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。

そんな、俺に、お勧めはこれ。

「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1
2007/12/30(日) 12:03:36
音声合成というより、台詞合成だな
2007/12/30(日) 13:55:26
>>72
ワロタ
2008/01/06(日) 13:05:04
れこーどうえーぶ
http://recwav.dip.jp/

音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222
2008/01/10(木) 21:52:09
この板の住人じゃないんだけどAquesTalkでwav保存できるソフト
あるのかな?
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしw
77デフォルトの名無しさん
垢版 |
2008/01/11(金) 06:44:14
全二十じゃないの?
2008/01/11(金) 13:26:54
全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば?ということかな?
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。
2008/01/13(日) 09:32:40
普通に、ライン出力を録画するんではダメなのか?
80デフォルトの名無しさん
垢版 |
2008/01/18(金) 02:45:43
>>78
スマンスマンw
二十って書いたの俺かもw
2008/01/19(土) 00:36:30
>>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか?
ほとんどの人がライセンスがないから試せないと思われ。
2008/01/26(土) 02:02:50
>>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない
83デフォルトの名無しさん
垢版 |
2008/01/26(土) 02:53:10
全二重に温室関係案のカナ?
84デフォルトの名無しさん
垢版 |
2008/02/07(木) 12:56:18
いまどこまで進んでいるんだ?
85デフォルトの名無しさん
垢版 |
2008/03/24(月) 13:24:15
age
86デフォルトの名無しさん
垢版 |
2008/04/06(日) 12:19:17
>>1
おーい!いまどこまで進んでいるんだ?
87デフォルトの名無しさん
垢版 |
2008/04/07(月) 01:29:34
age
2008/04/07(月) 04:01:19
「あ」の波形と「う」の波形を足して2で割ったら「い」の波形ができるのを発見して特許取った
2008/04/07(月) 08:54:58
特許番号は?
2008/04/07(月) 21:51:13
どのくらい 「い」 と区別が付かないんだ?
不自然感0?
2008/04/07(月) 21:54:23
じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん
2008/04/23(水) 18:22:12
>>88-91
もうちょっとでアヘ声が実現するな
93デフォルトの名無しさん
垢版 |
2008/04/29(火) 23:32:40
>>88 特許番号は?
2008/05/01(木) 14:02:57
juliusで音素列を指定して、
強制アライメント取れますか?
2008/05/02(金) 23:24:08
>>94
つ 単語・音素セグメンテーションキット&Julian
■ このスレッドは過去ログ倉庫に格納されています