音声合成プログラムを作りる

**デフォルトの名無しさん** · 2007/06/14(木) 09:48:48

ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

**デフォルトの名無しさん** · 2008/07/27(日) 20:37:01

音声認識して音声合成しなおせばいいんじゃね？

**デフォルトの名無しさん** · 2008/07/29(火) 12:29:37

ところで音声合成ってどうやって作るんだい？
アルゴリズムを提案してくれ。

**デフォルトの名無しさん** · 2008/07/29(火) 17:44:36

基本は、サンプリングのツギハギ。
声帯を物理シミュレーションしてるのは、あるのかな？

**デフォルトの名無しさん** · 2008/07/30(水) 01:18:20

>>170
ttp://recognition.web.fc2.com/synthe/

>>171
党・本多

**デフォルトの名無しさん** · 2008/08/01(金) 00:14:21

94氏
この掲示板みてたら、現状を報告してくれ。

**デフォルトの名無しさん** · 2008/08/03(日) 19:07:12

変声機つくっても犯罪用途しか思いつかないなぁw

**デフォルトの名無しさん** · 2008/08/03(日) 20:42:59

マイナー分野である音声合成技術が、オレオレ詐欺に使われることで一躍世間の注目を浴びる、と。

**デフォルトの名無しさん** · 2008/08/03(日) 21:08:32

それ既にあるぞ

**デフォルトの名無しさん** · 2008/08/04(月) 19:12:59

こんなんみつけた
ttp://d.hatena.ne.jp/shoozhoo/20080712

やっぱ英語用の音声合成は日本語じゃ役立たずなのか？

**デフォルトの名無しさん** · 2008/08/06(水) 22:21:13

ところで誰か音声合成プログラムを作っている人いるかね？

**デフォルトの名無しさん** · 2008/08/12(火) 00:25:48

ﾎﾞｲｰﾝ

**デフォルトの名無しさん** · 2008/09/04(木) 03:02:37

>>171
面白い特許を見つけました。シンセサイザーの方では表現力が高いとして
９０年代に研究され尽くされた物理モデリングアルゴリズムDWGを
音声シンセサイザーに応用するものです。
http://www.patentgenius.com/patent/5528726.html

**デフォルトの名無しさん** · 2008/09/08(月) 11:38:26

よく見つけたな。ちょっと読んでみるか

**デフォルトの名無しさん** · 2008/09/15(月) 06:39:06

http://prius.hitachi.co.jp/prius/pc/2005may/yomiwaza/index.html
＞※本ソフトウェアが出力する読み上げ音声の著作権は株式会社日立製作所が保有します。

これってどうなの？
ここまで著作権を主張できるもんなの？

**デフォルトの名無しさん** · 2008/09/15(月) 10:37:50

フォントの著作権の問題に似てるな

**デフォルトの名無しさん** · 2008/10/14(火) 11:10:46

そろそろ何か作りれたか？

**デフォルトの名無しさん** · 2008/10/14(火) 21:24:36

日本語でおｋ

**デフォルトの名無しさん** · 2008/10/18(土) 15:12:50

>>94氏へ
この掲示板みてたら、なんでもいいから報告をしてくれ。

**デフォルトの名無しさん** · 2008/12/24(水) 02:45:19

http://iwasete.net/

**デフォルトの名無しさん** · 2009/01/03(土) 11:49:06

age

**デフォルトの名無しさん** · 2009/02/05(木) 07:16:16

保守

**デフォルトの名無しさん** · 2009/02/05(木) 11:09:11

>>182
しかし読み上げた結果の音声を自由に使えなきゃ意味ないよな。

**デフォルトの名無しさん** · 2009/02/05(木) 11:11:41

そういえば、ちょっと前にアニメのキャラクターで音声合成するのがあったけど、あのベースになっているアルゴリズムはなんなんだろ。
藤崎モデルだっけ、あれとはちょっと違うでしょ？

**デフォルトの名無しさん** · 2009/02/08(日) 10:49:41

波形接続だろ

**デフォルトの名無しさん** · 2009/02/08(日) 11:15:27

でも、通常の波形接続リソースとは変えないとキャラっぽいしゃべりは無理だろ？

**デフォルトの名無しさん** · 2009/02/09(月) 00:16:52

キャラ声でキャラせりふを録音しておくんだからＯＫだろ？

**デフォルトの名無しさん** · 2009/02/09(月) 09:26:51

それじゃうまくいかないんじゃないか？
とはいえ、音声リソースに手作業で情報追加すれば何とかなるのかや。

**デフォルトの名無しさん** · 2009/02/09(月) 10:49:52

量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。

**デフォルトの名無しさん** · 2009/02/10(火) 23:16:28

>>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。

**デフォルトの名無しさん** · 2009/02/14(土) 04:41:05

overlap add

**デフォルトの名無しさん** · 2009/02/17(火) 14:31:50

>>198
わからんな、単語並べられてもさ。

**デフォルトの名無しさん** · 2009/02/17(火) 20:41:36

>>191 のアルゴリズムがoverlap additionだと言いたいんだろうな

**デフォルトの名無しさん** · 2009/02/23(月) 11:31:09

簡単な波形接続プログラム作ってみた
Ne_46114
makaron

**デフォルトの名無しさん** · 2009/02/23(月) 18:17:57

ttp://www1.axfc.net/uploader/Ne/so/46114
みんながみんなお前や俺のようなワレザーじゃないんだからURLを併記するべき
それはそうと入力した語句がwavに反映されない。

buliding database
done
input text

こんにちわ。

1 sp /*/ 614 400 242

**デフォルトの名無しさん** · 2009/02/24(火) 08:14:40

申し訳ない。上でそこ使ってたから、デフォかと思ったよ。

で、音が出ないってのだけど、dataフォルダの中にポッドキャストの
wavファイルは作ってあるんだよね？んー、なんでだろう。

**デフォルトの名無しさん** · 2009/02/24(火) 21:59:55

もちろん
全てREADMEの通りに行った
原因が思いつかないなら結構場所食うし消すわ

**デフォルトの名無しさん** · 2009/03/09(月) 12:22:15

>>202
すいません。それをもう一度うｐしてくれませんか？

後このソフトはオープンソースですか？

**デフォルトの名無しさん** · 2009/03/09(月) 20:05:03

おっと盗賊が現れた。

**デフォルトの名無しさん** · 2009/03/11(水) 12:26:04

>>201
>>202のURLからダウンロードできないんだが・・・
もう一度うｐしてくれるか？

**デフォルトの名無しさん** · 2009/03/11(水) 12:44:47

もうなくなっているようだな。

**デフォルトの名無しさん** · 2009/03/11(水) 15:14:17

だれでもいいからうｐしてくれ

**デフォルトの名無しさん** · 2009/03/26(木) 11:58:27

そういえば、声を好きな人の声に変換するものがあったけど、あのアルゴリズムはどうなっているんだろう？

**デフォルトの名無しさん** · 2009/03/31(火) 09:09:02

好きな人の声ってなんだよ？

**デフォルトの名無しさん** · 2009/03/31(火) 11:13:33

俺で言えば佐伯香織ちゃんの声だよ

**デフォルトの名無しさん** · 2009/03/31(火) 17:26:09

音声認識して音声再生してるだけじゃないの？

**デフォルトの名無しさん** · 2009/04/03(金) 15:48:54

>>210
それって声質変換のことじゃないの？
声質変換って声の周波数で他人の声に変えることかな？

**デフォルトの名無しさん** · 2009/04/04(土) 00:09:17

ふぉるまんと0の成分を上げ下げすればいいんじゃね？

**デフォルトの名無しさん** · 2009/04/04(土) 20:24:59

>>215
それで本当に他人の声に変えることができるの？
だれか詳しい人教えて

**デフォルトの名無しさん** · 2009/04/05(日) 02:42:50

>>216
おとこ、おんな、こども、
っぽく変換はできる。

でも、20年前の技術だぞ？

**デフォルトの名無しさん** · 2009/04/11(土) 16:55:30

声質変換技術で他人の声の変換するにはどのようにすればいいのかな？

**デフォルトの名無しさん** · 2009/04/11(土) 20:22:18

んなの英語の論文調べなよ。

**デフォルトの名無しさん** · 2009/05/25(月) 22:41:33

声優いわく、BIGLOBEのコエラボは５日間の収録だそうだぞ

**デフォルトの名無しさん** · 2009/05/26(火) 22:16:46

ttp://pinpon.okilab.jp/potential.html
ワロタｗｗ

**デフォルトの名無しさん** · 2009/05/27(水) 00:07:24

>>221
ちょーやばくねー。

**デフォルトの名無しさん** · 2009/05/31(日) 03:43:40

>>221
なんかムカつく。でもそれがいい

**デフォルトの名無しさん** · 2009/06/30(火) 15:03:16

age

**デフォルトの名無しさん** · 2009/07/02(木) 08:08:16

なぜ、VOICE TEXTがでてこない・・・
市販の音声合成ではあれの出来がかなりよい

**デフォルトの名無しさん** · 2009/07/02(木) 21:18:35

Harukaってコメント程度ならいいけど、
聞き続けるとムカつきそうｗ

**デフォルトの名無しさん** · 2009/07/03(金) 08:01:09

>>226
確かにw
最初は可愛いと思うがだんだんゆとりの女子高生に思えてきたw

**デフォルトの名無しさん** · 2009/08/13(木) 20:00:14

声質を変換できる方法ってあるのかな？

**デフォルトの名無しさん** · 2009/08/13(木) 20:17:19

うん

222.248.109.70 · 2009/08/17(月) 17:45:20

Q. 自動保守#K9K?_D[L　とは一体何なのか？
A. 外部サイトへの突撃大好きな真性厨房

韓国突撃でお馴染みの自動保守
最近は自動焼人 ★として２ちゃんねるのボランティアにも精を出す日々
だがそんな彼にも、人間らしい部分はあったのだ…

名言集
『アパッチ砲はワシが作った』
『お前が規制系キャップ取れるか審査してやるよ』
『いつもサボってばかりのキャップがウゼえ』
『俺、100人規模の集団サイバーテロの主犯だったこともあるんだぜ』
『俺の経歴カックイイだろ？』

最近のニュース
　8月15日の韓国突撃の際に歴史的大敗を喫する。ラジオでの敗戦宣言のときに声が震えていた
　本人は体調不良と言っているが…

----------------------------------------------
この自動焼人 ★メールマガジンの配信停止をご希望される方は
http://qb5.2ch.net/test/read.cgi/sec2chd/1250169591/
にて自動焼人 ★までご連絡ください

**デフォルトの名無しさん** · 2009/08/31(月) 22:39:57

声質を変換できる方法ってあるの？

**デフォルトの名無しさん** · 2009/08/31(月) 22:42:46

うん

**デフォルトの名無しさん** · 2009/10/03(土) 16:56:55

ほしゅ

**デフォルトの名無しさん** · 2009/10/04(日) 11:19:20

VOCALOID2 シーケンス (VSQ) ファイルのフォーマット (推定)
ttp://www5d.biglobe.ne.jp/~noocyte/Programming/FileFormat/VSQ.html

**デフォルトの名無しさん** · 2010/02/11(木) 11:05:27

つOpenJtalk

**デフォルトの名無しさん** · 2010/02/14(日) 19:22:47

肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう？
誰か教えて

**デフォルトの名無しさん** · 2010/02/15(月) 07:51:28

あったね

**デフォルトの名無しさん** · 2010/02/16(火) 14:06:08

>>237
どうやるの？

**デフォルトの名無しさん** · 2010/02/16(火) 21:04:17

やっぱり音響モデルじゃないのかな

**デフォルトの名無しさん** · 2010/02/16(火) 23:34:34

>>239
音響モデル？
詳しく教えて

**デフォルトの名無しさん** · 2010/02/27(土) 20:30:27

肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう？
誰か教えて

**デフォルトの名無しさん** · 2010/02/27(土) 23:15:36

あったね

**デフォルトの名無しさん** · 2010/02/27(土) 23:24:51

>>242
どうやるの？

**デフォルトの名無しさん** · 2010/02/28(日) 13:02:52

やっぱり音響モデルじゃないのかな

**デフォルトの名無しさん** · 2010/02/28(日) 16:19:26

>>244
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの？

**デフォルトの名無しさん** · 2010/02/28(日) 17:41:40

肖像画からCGを作成するのは六角大王の手法でできるんじゃね

**デフォルトの名無しさん** · 2010/02/28(日) 18:38:51

涼宮ハルヒのエンドレス夏休みを見ている気分ですねわかります

**デフォルトの名無しさん** · 2010/03/02(火) 23:08:24

>>246
どうやってやる？

**デフォルトの名無しさん** · 2010/03/21(日) 23:17:01

マジレスすると、頭蓋のサイズから声道長を推定して、
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。

**デフォルトの名無しさん** · 2010/04/12(月) 00:29:58

>>249
肖像画からどうやって頭蓋のサイズを出してるの？

**デフォルトの名無しさん** · 2010/04/12(月) 19:11:06

俺の写真から声を復元したとして、
俺の声にどこまで近くなるんだろうか？

**デフォルトの名無しさん** · 2010/04/12(月) 23:10:15

>>251
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの？

**デフォルトの名無しさん** · 2010/04/15(木) 12:59:30

その写真に写りこんでいる、寸法の判っているものを基準にすればいいんじゃね

**デフォルトの名無しさん** · 2010/04/15(木) 17:26:26

ネッシーの捏造写真だってサイズ割り出されてたもんな

**デフォルトの名無しさん** · 2010/04/15(木) 17:34:19

波紋の伝播周期からサイズが決定できるってことかな。

**デフォルトの名無しさん** · 2010/04/15(木) 19:19:57

**デフォルトの名無しさん** · 2010/04/15(木) 22:31:48

**デフォルトの名無しさん** · 2010/04/17(土) 18:26:20

>>253
でも肖像画に寸法の判っているものがなかったらどうするの？

**デフォルトの名無しさん** · 2010/04/17(土) 20:29:56

何でお前らそんなに世話焼きなの？

**デフォルトの名無しさん** · 2010/04/19(月) 11:43:36

>>258
そんときは、目玉の大きさとか目の感覚とか、統計的手法に頼ればいいんじゃね

>>259
暇なんじゃね?

**デフォルトの名無しさん** · 2010/04/19(月) 13:10:40

>>258
声のキャラクタってのは体格以外の要素も絡むわけで、
例えば故人の歌声を再現、とかやりたい場合は大抵残念な結果になるよ。
そもそもここで聞くより元の論文探して見当つけたほうが早くね？

>>260
こういうのも頭部画像だけで測れちゃったり？
ttp://m.onet.pl/_m/94cfc8bff0ea6227e4a8547781d30f45,35,1.jpg
ttp://image.blog.livedoor.jp/laba_q/imgs/1/9/19f92fc1.jpg

**デフォルトの名無しさん** · 2010/04/19(月) 19:22:54

サイズはパラメータにしておいて、
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない

**デフォルトの名無しさん** · 2010/04/20(火) 17:55:12

>>261
ググッても見つからないんだが・・・

**デフォルトの名無しさん** · 2010/04/21(水) 19:02:15

>>261
探しても見つからないよ

**デフォルトの名無しさん** · 2010/04/22(木) 22:39:13

一卵性双生児の場合、声（歌声も）は全く同じではないだろ
だから頭部の数値だけでは不十分な気がする

**デフォルトの名無しさん** · 2010/04/22(木) 22:56:07

>>265
でも↓を見ると
http://www.onkyo-lab.com/mv.html

>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。

って書かれているんだが・・・・

てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？

**デフォルトの名無しさん** · 2010/04/22(木) 22:58:41

声を合成できる事と
その声が実際の声と一致している事とは別だよ

**デフォルトの名無しさん** · 2010/04/23(金) 13:27:11

>>267
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの？

**デフォルトの名無しさん** · 2010/04/23(金) 23:17:59

日本音響研究所に不可能はない