音声合成プログラムを作りる

■ このスレッドは過去ログ倉庫に格納されています
2007/06/14(木) 09:48:48
ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

2009/02/09(月) 10:49:52
量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。
2009/02/10(火) 23:16:28
>>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。
2009/02/14(土) 04:41:05
overlap add
2009/02/17(火) 14:31:50
>>198
わからんな、単語並べられてもさ。
2009/02/17(火) 20:41:36
>>191 のアルゴリズムがoverlap additionだと言いたいんだろうな
2009/02/23(月) 11:31:09
簡単な波形接続プログラム作ってみた
Ne_46114
makaron
2009/02/23(月) 18:17:57
ttp://www1.axfc.net/uploader/Ne/so/46114
みんながみんなお前や俺のようなワレザーじゃないんだからURLを併記するべき
それはそうと入力した語句がwavに反映されない。

buliding database
done
input text


こんにちわ。

1 sp /*/ 614 400 242
2009/02/24(火) 08:14:40
申し訳ない。上でそこ使ってたから、デフォかと思ったよ。

で、音が出ないってのだけど、dataフォルダの中にポッドキャストの
wavファイルは作ってあるんだよね?んー、なんでだろう。
2009/02/24(火) 21:59:55
もちろん
全てREADMEの通りに行った
原因が思いつかないなら結構場所食うし消すわ
2009/03/09(月) 12:22:15
>>202
すいません。それをもう一度うpしてくれませんか?

後このソフトはオープンソースですか?
2009/03/09(月) 20:05:03
おっと盗賊が現れた。
2009/03/11(水) 12:26:04
>>201
>>202のURLからダウンロードできないんだが・・・
もう一度うpしてくれるか?
2009/03/11(水) 12:44:47
もうなくなっているようだな。
2009/03/11(水) 15:14:17
だれでもいいからうpしてくれ
2009/03/26(木) 11:58:27
そういえば、声を好きな人の声に変換するものがあったけど、あのアルゴリズムはどうなっているんだろう?
2009/03/31(火) 09:09:02
好きな人の声ってなんだよ?
2009/03/31(火) 11:13:33
俺で言えば佐伯香織ちゃんの声だよ
2009/03/31(火) 17:26:09
音声認識して音声再生してるだけじゃないの?
2009/04/03(金) 15:48:54
>>210
それって声質変換のことじゃないの?
声質変換って声の周波数で他人の声に変えることかな?
2009/04/04(土) 00:09:17
ふぉるまんと0の成分を上げ下げすればいいんじゃね?
216デフォルトの名無しさん
垢版 |
2009/04/04(土) 20:24:59
>>215
それで本当に他人の声に変えることができるの?
だれか詳しい人教えて
2009/04/05(日) 02:42:50
>>216
おとこ、おんな、こども、
っぽく変換はできる。

でも、20年前の技術だぞ?
218デフォルトの名無しさん
垢版 |
2009/04/11(土) 16:55:30
声質変換技術で他人の声の変換するにはどのようにすればいいのかな?
2009/04/11(土) 20:22:18
んなの英語の論文調べなよ。
2009/05/25(月) 22:41:33
声優いわく、BIGLOBEのコエラボは5日間の収録だそうだぞ
2009/05/26(火) 22:16:46
ttp://pinpon.okilab.jp/potential.html
ワロタww
2009/05/27(水) 00:07:24
>>221
ちょーやばくねー。
2009/05/31(日) 03:43:40
>>221
なんかムカつく。でもそれがいい
224デフォルトの名無しさん
垢版 |
2009/06/30(火) 15:03:16
age
2009/07/02(木) 08:08:16
なぜ、VOICE TEXTがでてこない・・・
市販の音声合成ではあれの出来がかなりよい
2009/07/02(木) 21:18:35
Harukaってコメント程度ならいいけど、
聞き続けるとムカつきそうw
2009/07/03(金) 08:01:09
>>226
確かにw
最初は可愛いと思うがだんだんゆとりの女子高生に思えてきたw
2009/08/13(木) 20:00:14
声質を変換できる方法ってあるのかな?
2009/08/13(木) 20:17:19
うん
2009/08/17(月) 17:45:20
Q. 自動保守#K9K?_D[L とは一体何なのか?
A. 外部サイトへの突撃大好きな真性厨房

韓国突撃でお馴染みの自動保守
最近は自動焼人 ★として2ちゃんねるのボランティアにも精を出す日々
だがそんな彼にも、人間らしい部分はあったのだ…

名言集
『アパッチ砲はワシが作った』
『お前が規制系キャップ取れるか審査してやるよ』
『いつもサボってばかりのキャップがウゼえ』
『俺、100人規模の集団サイバーテロの主犯だったこともあるんだぜ』
『俺の経歴カックイイだろ?』

最近のニュース
 8月15日の韓国突撃の際に歴史的大敗を喫する。ラジオでの敗戦宣言のときに声が震えていた
 本人は体調不良と言っているが…


----------------------------------------------
この自動焼人 ★メールマガジンの配信停止をご希望される方は
http://qb5.2ch.net/test/read.cgi/sec2chd/1250169591/
にて自動焼人 ★までご連絡ください
2009/08/31(月) 22:39:57
声質を変換できる方法ってあるの?
2009/08/31(月) 22:42:46
うん
233デフォルトの名無しさん
垢版 |
2009/10/03(土) 16:56:55
ほしゅ
2009/10/04(日) 11:19:20
VOCALOID2 シーケンス (VSQ) ファイルのフォーマット (推定)
ttp://www5d.biglobe.ne.jp/~noocyte/Programming/FileFormat/VSQ.html
2010/02/11(木) 11:05:27
つOpenJtalk
2010/02/14(日) 19:22:47
肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう?
誰か教えて
2010/02/15(月) 07:51:28
あったね
2010/02/16(火) 14:06:08
>>237
どうやるの?
2010/02/16(火) 21:04:17
やっぱり音響モデルじゃないのかな
2010/02/16(火) 23:34:34
>>239
音響モデル?
詳しく教えて
2010/02/27(土) 20:30:27
肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう?
誰か教えて
2010/02/27(土) 23:15:36
あったね
2010/02/27(土) 23:24:51
>>242
どうやるの?
2010/02/28(日) 13:02:52
やっぱり音響モデルじゃないのかな
2010/02/28(日) 16:19:26
>>244
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの?
2010/02/28(日) 17:41:40
肖像画からCGを作成するのは六角大王の手法でできるんじゃね
2010/02/28(日) 18:38:51
涼宮ハルヒのエンドレス夏休みを見ている気分ですねわかります
2010/03/02(火) 23:08:24
>>246
どうやってやる?
2010/03/21(日) 23:17:01
マジレスすると、頭蓋のサイズから声道長を推定して、
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。
2010/04/12(月) 00:29:58
>>249
肖像画からどうやって頭蓋のサイズを出してるの?
2010/04/12(月) 19:11:06
俺の写真から声を復元したとして、
俺の声にどこまで近くなるんだろうか?
2010/04/12(月) 23:10:15
>>251
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの?
2010/04/15(木) 12:59:30
その写真に写りこんでいる、寸法の判っているものを基準にすればいいんじゃね
2010/04/15(木) 17:26:26
ネッシーの捏造写真だってサイズ割り出されてたもんな
2010/04/15(木) 17:34:19
波紋の伝播周期からサイズが決定できるってことかな。
256デフォルトの名無しさん
垢版 |
2010/04/15(木) 19:19:57
2010/04/15(木) 22:31:48
w
2010/04/17(土) 18:26:20
>>253
でも肖像画に寸法の判っているものがなかったらどうするの?
2010/04/17(土) 20:29:56
何でお前らそんなに世話焼きなの?
2010/04/19(月) 11:43:36
>>258
そんときは、目玉の大きさとか目の感覚とか、統計的手法に頼ればいいんじゃね

>>259
暇なんじゃね?
2010/04/19(月) 13:10:40
>>258
声のキャラクタってのは体格以外の要素も絡むわけで、
例えば故人の歌声を再現、とかやりたい場合は大抵残念な結果になるよ。
そもそもここで聞くより元の論文探して見当つけたほうが早くね?

>>260
こういうのも頭部画像だけで測れちゃったり?
ttp://m.onet.pl/_m/94cfc8bff0ea6227e4a8547781d30f45,35,1.jpg
ttp://image.blog.livedoor.jp/laba_q/imgs/1/9/19f92fc1.jpg
2010/04/19(月) 19:22:54
サイズはパラメータにしておいて、
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない
2010/04/20(火) 17:55:12
>>261
ググッても見つからないんだが・・・
2010/04/21(水) 19:02:15
>>261
探しても見つからないよ
2010/04/22(木) 22:39:13
一卵性双生児の場合、声(歌声も)は全く同じではないだろ
だから頭部の数値だけでは不十分な気がする
2010/04/22(木) 22:56:07
>>265
でも↓を見ると
http://www.onkyo-lab.com/mv.html

>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。

って書かれているんだが・・・・

てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/04/22(木) 22:58:41
声を合成できる事と
その声が実際の声と一致している事とは別だよ
2010/04/23(金) 13:27:11
>>267
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
2010/04/23(金) 23:17:59
日本音響研究所に不可能はない
2010/04/24(土) 00:03:36
>>269
だからどうやってやったの?
2010/04/24(土) 00:15:07
日本音響研究所のおっさんに直接聞けよ
2010/04/24(土) 23:13:48
>>271
直接聞いても企業秘密で答えてくれない
おまえらの力で考えるしかない
2010/04/25(日) 09:48:56
>>266
肖像画が残るような人物なら性別は記録からすぐ分かるだろ
低脳

顔の各部分の寸法に関しては、
肖像画とその人物の民族平均を比較するんだよ。
低脳
274デフォルトの名無しさん
垢版 |
2010/04/27(火) 23:30:32
【歴史】169センチ、62キロだった龍馬 大男伝説に一石 山梨
http://tsushima.2ch.net/test/read.cgi/newsplus/1272325001/
甲州の研究家襟幅から算出
甲州市塩山上井尻の郷土史研究家、矢崎勝巳さんが写真から体格を測定する方法を
考案し、幕末の志士・坂本龍馬(1835〜67年)の身長を169センチ、体重を62・1キロと
算出した。平均身長が150センチ台だった幕末当時、龍馬の身長は5尺7寸(173センチ)
とも6尺(182センチ)とも伝えられ、長い間大男だったとされてきたが、一石を投じそうだ。

矢崎さんは、当時の着物の襟幅が6センチか6・5センチの2種類しかないことに着目した。
6センチとすると背が低くなりすぎるため、6・5センチとして龍馬の立位の肖像写真で算出した。
2007年10月の日本人類学会で、龍馬の身長は170センチに満たなかったとの試算を
紹介したのに続き、昨年10月の同学会では体格指数BMIで体重を試算する方法も発表した。

このほど、龍馬のBMI指数を標準体形の「18・5以上25未満」と仮定し、標準値の
(以下省略)

ソース:読売新聞
http://www.yomiuri.co.jp/e-japan/yamanashi/news/20100426-OYT8T01349.htm
画像:坂本龍馬の肖像写真
http://www.yomiuri.co.jp/photo/20100426-932069-1-L.jpg
2010/04/27(火) 23:58:20
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/04/28(水) 18:02:44
おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/04/28(水) 18:36:50
ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
2010/04/28(水) 20:13:21
そして誰もいなくなった
2010/04/29(木) 23:02:27
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/04/30(金) 01:37:52
男の声をピッチ上げるだけだと、女っぽくならないのは何故だろう
2010/04/30(金) 01:50:08
ボカロで言うGENとかUTAUでいうgフラグを調整する必要がある
2010/05/01(土) 14:24:27
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/05/01(土) 19:24:01
ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/05/04(火) 18:39:42
おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
2010/05/04(火) 23:25:22
発声時における声帯から口までの空気の流れを粒子法でモデル化して
音声合成を作ってみたいと急に思い立ったんだが、右も左も分からない。

とりあえず、これは圧縮性流れと見なしてシミュレートすればいいのか
2010/05/06(木) 23:04:54
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
2010/05/07(金) 00:23:20
>>286
一般的には統計を利用する。
2010/05/07(金) 16:24:45
>>287
どうやってやるの?
具体的に教えてくれる?
2010/05/07(金) 16:57:59
てかそもそも証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
2010/05/20(木) 15:00:33
証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
2010/06/08(火) 23:57:00
ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
2010/06/11(金) 13:49:50
>>291
とりあえず証明写真見て性別を5割以上の確率で当てられないバカはお前くらいじゃねーの
2010/06/12(土) 22:08:09
ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
2010/06/12(土) 23:22:47
きっと後ろの壁に横線が並んでるんだよ。
2010/06/13(日) 15:05:51
うん。だけど証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
■ このスレッドは過去ログ倉庫に格納されています