ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ
探検
音声合成プログラムを作りる
■ このスレッドは過去ログ倉庫に格納されています
2007/06/14(木) 09:48:48
243デフォルトの名無しさん
2010/02/27(土) 23:24:51 >>242
どうやるの?
どうやるの?
244デフォルトの名無しさん
2010/02/28(日) 13:02:52 やっぱり音響モデルじゃないのかな
245デフォルトの名無しさん
2010/02/28(日) 16:19:26 >>244
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの?
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの?
246デフォルトの名無しさん
2010/02/28(日) 17:41:40 肖像画からCGを作成するのは六角大王の手法でできるんじゃね
247デフォルトの名無しさん
2010/02/28(日) 18:38:51 涼宮ハルヒのエンドレス夏休みを見ている気分ですねわかります
248デフォルトの名無しさん
2010/03/02(火) 23:08:24 >>246
どうやってやる?
どうやってやる?
249デフォルトの名無しさん
2010/03/21(日) 23:17:01 マジレスすると、頭蓋のサイズから声道長を推定して、
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。
250デフォルトの名無しさん
2010/04/12(月) 00:29:58 >>249
肖像画からどうやって頭蓋のサイズを出してるの?
肖像画からどうやって頭蓋のサイズを出してるの?
251デフォルトの名無しさん
2010/04/12(月) 19:11:06 俺の写真から声を復元したとして、
俺の声にどこまで近くなるんだろうか?
俺の声にどこまで近くなるんだろうか?
252デフォルトの名無しさん
2010/04/12(月) 23:10:15 >>251
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの?
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの?
253デフォルトの名無しさん
2010/04/15(木) 12:59:30 その写真に写りこんでいる、寸法の判っているものを基準にすればいいんじゃね
254デフォルトの名無しさん
2010/04/15(木) 17:26:26 ネッシーの捏造写真だってサイズ割り出されてたもんな
255デフォルトの名無しさん
2010/04/15(木) 17:34:19 波紋の伝播周期からサイズが決定できるってことかな。
256デフォルトの名無しさん
2010/04/15(木) 19:19:57257デフォルトの名無しさん
2010/04/15(木) 22:31:48 w
258デフォルトの名無しさん
2010/04/17(土) 18:26:20 >>253
でも肖像画に寸法の判っているものがなかったらどうするの?
でも肖像画に寸法の判っているものがなかったらどうするの?
259デフォルトの名無しさん
2010/04/17(土) 20:29:56 何でお前らそんなに世話焼きなの?
260デフォルトの名無しさん
2010/04/19(月) 11:43:36261デフォルトの名無しさん
2010/04/19(月) 13:10:40262デフォルトの名無しさん
2010/04/19(月) 19:22:54 サイズはパラメータにしておいて、
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない
263デフォルトの名無しさん
2010/04/20(火) 17:55:12 >>261
ググッても見つからないんだが・・・
ググッても見つからないんだが・・・
264デフォルトの名無しさん
2010/04/21(水) 19:02:15 >>261
探しても見つからないよ
探しても見つからないよ
265デフォルトの名無しさん
2010/04/22(木) 22:39:13 一卵性双生児の場合、声(歌声も)は全く同じではないだろ
だから頭部の数値だけでは不十分な気がする
だから頭部の数値だけでは不十分な気がする
266デフォルトの名無しさん
2010/04/22(木) 22:56:07 >>265
でも↓を見ると
http://www.onkyo-lab.com/mv.html
>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。
って書かれているんだが・・・・
てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
でも↓を見ると
http://www.onkyo-lab.com/mv.html
>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。
って書かれているんだが・・・・
てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
267デフォルトの名無しさん
2010/04/22(木) 22:58:41 声を合成できる事と
その声が実際の声と一致している事とは別だよ
その声が実際の声と一致している事とは別だよ
268デフォルトの名無しさん
2010/04/23(金) 13:27:11 >>267
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
269デフォルトの名無しさん
2010/04/23(金) 23:17:59 日本音響研究所に不可能はない
270デフォルトの名無しさん
2010/04/24(土) 00:03:36 >>269
だからどうやってやったの?
だからどうやってやったの?
271デフォルトの名無しさん
2010/04/24(土) 00:15:07 日本音響研究所のおっさんに直接聞けよ
272デフォルトの名無しさん
2010/04/24(土) 23:13:48273デフォルトの名無しさん
2010/04/25(日) 09:48:56274デフォルトの名無しさん
2010/04/27(火) 23:30:32 【歴史】169センチ、62キロだった龍馬 大男伝説に一石 山梨
http://tsushima.2ch.net/test/read.cgi/newsplus/1272325001/
甲州の研究家襟幅から算出
甲州市塩山上井尻の郷土史研究家、矢崎勝巳さんが写真から体格を測定する方法を
考案し、幕末の志士・坂本龍馬(1835〜67年)の身長を169センチ、体重を62・1キロと
算出した。平均身長が150センチ台だった幕末当時、龍馬の身長は5尺7寸(173センチ)
とも6尺(182センチ)とも伝えられ、長い間大男だったとされてきたが、一石を投じそうだ。
矢崎さんは、当時の着物の襟幅が6センチか6・5センチの2種類しかないことに着目した。
6センチとすると背が低くなりすぎるため、6・5センチとして龍馬の立位の肖像写真で算出した。
2007年10月の日本人類学会で、龍馬の身長は170センチに満たなかったとの試算を
紹介したのに続き、昨年10月の同学会では体格指数BMIで体重を試算する方法も発表した。
このほど、龍馬のBMI指数を標準体形の「18・5以上25未満」と仮定し、標準値の
(以下省略)
ソース:読売新聞
http://www.yomiuri.co.jp/e-japan/yamanashi/news/20100426-OYT8T01349.htm
画像:坂本龍馬の肖像写真
http://www.yomiuri.co.jp/photo/20100426-932069-1-L.jpg
http://tsushima.2ch.net/test/read.cgi/newsplus/1272325001/
甲州の研究家襟幅から算出
甲州市塩山上井尻の郷土史研究家、矢崎勝巳さんが写真から体格を測定する方法を
考案し、幕末の志士・坂本龍馬(1835〜67年)の身長を169センチ、体重を62・1キロと
算出した。平均身長が150センチ台だった幕末当時、龍馬の身長は5尺7寸(173センチ)
とも6尺(182センチ)とも伝えられ、長い間大男だったとされてきたが、一石を投じそうだ。
矢崎さんは、当時の着物の襟幅が6センチか6・5センチの2種類しかないことに着目した。
6センチとすると背が低くなりすぎるため、6・5センチとして龍馬の立位の肖像写真で算出した。
2007年10月の日本人類学会で、龍馬の身長は170センチに満たなかったとの試算を
紹介したのに続き、昨年10月の同学会では体格指数BMIで体重を試算する方法も発表した。
このほど、龍馬のBMI指数を標準体形の「18・5以上25未満」と仮定し、標準値の
(以下省略)
ソース:読売新聞
http://www.yomiuri.co.jp/e-japan/yamanashi/news/20100426-OYT8T01349.htm
画像:坂本龍馬の肖像写真
http://www.yomiuri.co.jp/photo/20100426-932069-1-L.jpg
275デフォルトの名無しさん
2010/04/27(火) 23:58:20 ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
276デフォルトの名無しさん
2010/04/28(水) 18:02:44 おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
277デフォルトの名無しさん
2010/04/28(水) 18:36:50 ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?
278デフォルトの名無しさん
2010/04/28(水) 20:13:21 そして誰もいなくなった
279デフォルトの名無しさん
2010/04/29(木) 23:02:27 ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
280デフォルトの名無しさん
2010/04/30(金) 01:37:52 男の声をピッチ上げるだけだと、女っぽくならないのは何故だろう
281デフォルトの名無しさん
2010/04/30(金) 01:50:08 ボカロで言うGENとかUTAUでいうgフラグを調整する必要がある
282デフォルトの名無しさん
2010/05/01(土) 14:24:27 ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
283デフォルトの名無しさん
2010/05/01(土) 19:24:01 ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
284デフォルトの名無しさん
2010/05/04(火) 18:39:42 おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?
285デフォルトの名無しさん
2010/05/04(火) 23:25:22 発声時における声帯から口までの空気の流れを粒子法でモデル化して
音声合成を作ってみたいと急に思い立ったんだが、右も左も分からない。
とりあえず、これは圧縮性流れと見なしてシミュレートすればいいのか
音声合成を作ってみたいと急に思い立ったんだが、右も左も分からない。
とりあえず、これは圧縮性流れと見なしてシミュレートすればいいのか
286デフォルトの名無しさん
2010/05/06(木) 23:04:54 ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
287デフォルトの名無しさん
2010/05/07(金) 00:23:20 >>286
一般的には統計を利用する。
一般的には統計を利用する。
288デフォルトの名無しさん
2010/05/07(金) 16:24:45289デフォルトの名無しさん
2010/05/07(金) 16:57:59 てかそもそも証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
290デフォルトの名無しさん
2010/05/20(木) 15:00:33 証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
291デフォルトの名無しさん
2010/06/08(火) 23:57:00 ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
292デフォルトの名無しさん
2010/06/11(金) 13:49:50 >>291
とりあえず証明写真見て性別を5割以上の確率で当てられないバカはお前くらいじゃねーの
とりあえず証明写真見て性別を5割以上の確率で当てられないバカはお前くらいじゃねーの
293デフォルトの名無しさん
2010/06/12(土) 22:08:09 ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
294デフォルトの名無しさん
2010/06/12(土) 23:22:47 きっと後ろの壁に横線が並んでるんだよ。
295デフォルトの名無しさん
2010/06/13(日) 15:05:51 うん。だけど証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?
296デフォルトの名無しさん
2010/07/06(火) 18:15:36 >>1を見て
鏡の国のレジェンドでのりぴーの声を1音ずつ喋らすことができるんだけど
それを録音してX68にADPCMで取り込んでおいて順次再生して「おまんこ」とか
「ちんちんいれて」とか喋らせて大喜びしてたのを思い出した
鏡の国のレジェンドでのりぴーの声を1音ずつ喋らすことができるんだけど
それを録音してX68にADPCMで取り込んでおいて順次再生して「おまんこ」とか
「ちんちんいれて」とか喋らせて大喜びしてたのを思い出した
297デフォルトの名無しさん
2010/12/07(火) 04:06:55 音について質問です
例で
Windows Wave 無圧縮 PCM 16 bit 44kHz サンプリング ステレオ
wav format
http://www.kk.iij4u.or.jp/~kondo/wave/#wav
http://hooktail.org/computer/index.php?Wave%A5%D5%A5%A1%A5%A4%A5%EB%A4%F2%C6%FE%BD%D0%CE%CF%A4%B7%A4%C6%A4%DF%A4%EB
波形データはステレオの場合LRLR・・ と並ぶなどの説明までは沢山の日本語サイトであるんですけど
その多くがWAV ファイルヘッダ情報ばかり詳しく述べて肝心のデータ部分の説明がおざなりで解りません。
波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 FFFF8000 〜 0 〜 7FFF
リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR ですよね。
解らないのは、リニア PCM の場合
整数16bit / リトルエンディアン
L0L1L2L3 / L3 L2 L1 L0
R0R1R2R3 / R3 R2 R1 R0
格納順番は
これ?> data (波形データのバイト数) L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0
コレ?> data (波形データのバイト数) L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0
日本語サイトでここが詳しいとリンクしている英語サイト
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
では矢印のつけ方がどちらとも受け取れるので
音が変
例で
Windows Wave 無圧縮 PCM 16 bit 44kHz サンプリング ステレオ
wav format
http://www.kk.iij4u.or.jp/~kondo/wave/#wav
http://hooktail.org/computer/index.php?Wave%A5%D5%A5%A1%A5%A4%A5%EB%A4%F2%C6%FE%BD%D0%CE%CF%A4%B7%A4%C6%A4%DF%A4%EB
波形データはステレオの場合LRLR・・ と並ぶなどの説明までは沢山の日本語サイトであるんですけど
その多くがWAV ファイルヘッダ情報ばかり詳しく述べて肝心のデータ部分の説明がおざなりで解りません。
波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 FFFF8000 〜 0 〜 7FFF
リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR ですよね。
解らないのは、リニア PCM の場合
整数16bit / リトルエンディアン
L0L1L2L3 / L3 L2 L1 L0
R0R1R2R3 / R3 R2 R1 R0
格納順番は
これ?> data (波形データのバイト数) L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0
コレ?> data (波形データのバイト数) L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0
日本語サイトでここが詳しいとリンクしている英語サイト
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
では矢印のつけ方がどちらとも受け取れるので
音が変
298デフォルトの名無しさん
2010/12/07(火) 07:51:53 >リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。
それ32bitじゃね?
それ32bitじゃね?
299デフォルトの名無しさん
2010/12/07(火) 14:18:42 >>297
16ビットは2バイトだと気がつけば格納順番も分かると思います。
波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 8000 〜 0 〜 7FFF
リトルエンディアン にすると 00 80 〜 00 00 〜 FF 7F
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR
整数16bit/リトルエンディアン
L0L1 / L1 L0
R0R1 / R1 R0
格納順番はこうなります。
data (波形データのバイト数) L1 L0 R1 R0 L1 L0 R1 R0 L1 L0 R1 R0
16ビットは2バイトだと気がつけば格納順番も分かると思います。
波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 8000 〜 0 〜 7FFF
リトルエンディアン にすると 00 80 〜 00 00 〜 FF 7F
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR
整数16bit/リトルエンディアン
L0L1 / L1 L0
R0R1 / R1 R0
格納順番はこうなります。
data (波形データのバイト数) L1 L0 R1 R0 L1 L0 R1 R0 L1 L0 R1 R0
300デフォルトの名無しさん
2010/12/07(火) 23:06:21 SAPIの話かと思ったらすれ違いみたい
301297
2010/12/08(水) 08:25:46 ありがと やっと謎がとけたよ
音声組替えで音の基本配置がわかんなかったから音声合成のこのスレにきたんですが スレ違いごめんなさい
変調なんかもドコのスレだろ?
音声組替えで音の基本配置がわかんなかったから音声合成のこのスレにきたんですが スレ違いごめんなさい
変調なんかもドコのスレだろ?
302デフォルトの名無しさん
2010/12/09(木) 02:03:55 グーグル検索
↓
念のためうぷ(´・ω・`)まわいが重要
グーグル検索
↓
やらなくてもやられるし 日本語以外話せないし
テレビやネットで説明
↓
念のためうぷ(´・ω・`)まわいが重要
グーグル検索
↓
やらなくてもやられるし 日本語以外話せないし
テレビやネットで説明
303デフォルトの名無しさん
2011/01/05(水) 18:49:53304デフォルトの名無しさん
2011/01/15(土) 16:12:14 これの話者適応とか使えそうなんだけど、具体的なやり方がわからん
http://www.sp.nitech.ac.jp/index.php?%A5%DB%A1%BC%A5%E0%2F%B8%A6%B5%E6%C6%E2%CD%C6%2F%B2%BB%C0%BC%B9%E7%C0%AE
http://www.sp.nitech.ac.jp/index.php?%A5%DB%A1%BC%A5%E0%2F%B8%A6%B5%E6%C6%E2%CD%C6%2F%B2%BB%C0%BC%B9%E7%C0%AE
305デフォルトの名無しさん
2011/01/15(土) 17:34:46 >>304
話者適応は英語で Speaker Adaptation です。
HMM音声合成ツールキット HTS 2.0以降に
その機能があるのでソースを読めばわかると思います。
HMM-based Speech Synthesis System (HTS) - History
http://hts.sp.nitech.ac.jp/?History#z5d7dda6
>December 29, 2006
> HTS version 2.0 was finally released :-)
> The new features are
> * Speaker adaptation, adaptive training, and semi-tied covariance transforms are supported for multi-stream HMMs/MSD-HMMs.
> * MLLRMEAN, MLLRCOV, and CMLLR-based adaptation.
> * CMLLR-based adaptive training.
> * Decision trees for context clustering can be used to define regression classes for adaptation.
> * HMGenS can read MLLRMEAN, MLLRCOV, CMLLR, and SEMIT transforms for adaptation.
話者適応は英語で Speaker Adaptation です。
HMM音声合成ツールキット HTS 2.0以降に
その機能があるのでソースを読めばわかると思います。
HMM-based Speech Synthesis System (HTS) - History
http://hts.sp.nitech.ac.jp/?History#z5d7dda6
>December 29, 2006
> HTS version 2.0 was finally released :-)
> The new features are
> * Speaker adaptation, adaptive training, and semi-tied covariance transforms are supported for multi-stream HMMs/MSD-HMMs.
> * MLLRMEAN, MLLRCOV, and CMLLR-based adaptation.
> * CMLLR-based adaptive training.
> * Decision trees for context clustering can be used to define regression classes for adaptation.
> * HMGenS can read MLLRMEAN, MLLRCOV, CMLLR, and SEMIT transforms for adaptation.
306デフォルトの名無しさん
2011/01/15(土) 22:00:38 >>305
サンクス。ドキュメント見ながら色々試してみようと思う
とりあえずHTSの話者適応デモ動かしてるけど、終わらないし、2〜3日かかるらしい
最終的にはwavファイルとその文章を与えたらその声で音声合成できるようにしたい
サンクス。ドキュメント見ながら色々試してみようと思う
とりあえずHTSの話者適応デモ動かしてるけど、終わらないし、2〜3日かかるらしい
最終的にはwavファイルとその文章を与えたらその声で音声合成できるようにしたい
307デフォルトの名無しさん
2011/01/24(月) 21:38:46 統計学と信号処理と音声言語処理と機械学習を
勉強すれば何とかなるかな。
勉強すれば何とかなるかな。
308デフォルトの名無しさん
2011/02/06(日) 11:25:55 >>306
できた?興味あるんだけど
できた?興味あるんだけど
309デフォルトの名無しさん
2011/02/17(木) 17:24:58 >>308
できてない
とりあえず、デモのデータを使って音響モデルを作成するところまでできた
音響モデルができたらテキストからその声で音声の再生もできる
今は、自作のデータからモデル作る途中でエラーが出てるからそれの対処中
できてない
とりあえず、デモのデータを使って音響モデルを作成するところまでできた
音響モデルができたらテキストからその声で音声の再生もできる
今は、自作のデータからモデル作る途中でエラーが出てるからそれの対処中
310天使 ◆uL5esZLBSE
2011/07/03(日) 09:38:03.37 Rubyバカにしてる子ってさ
変数に$ついてる言語触ってるって事だよね
いちいちSHIFT+4キーおして $ 打ちまくってる感触はどう?
でもお前はゴミなのにねw
変数に$ついてる言語触ってるって事だよね
いちいちSHIFT+4キーおして $ 打ちまくってる感触はどう?
でもお前はゴミなのにねw
311天使 ◆uL5esZLBSE
2011/07/06(水) 01:45:59.76 これ ; デリミタっていうんだけどさ、これをつけなきゃエラーになるような
そんな言語使ってる奴ってどうみてもゴミだと思うんだけど
もしかして「;」これ打ち忘れてコンパイルエラー出すのが楽しいの?
そうか、二度と話かけんなよ
死ねよゴミ
そんな言語使ってる奴ってどうみてもゴミだと思うんだけど
もしかして「;」これ打ち忘れてコンパイルエラー出すのが楽しいの?
そうか、二度と話かけんなよ
死ねよゴミ
312デフォルトの名無しさん
2011/08/02(火) 06:50:05.52 ゆっくり声のライブラリって規則合成ってのらしいんだけど、これは素片接続法やHMM合成とは全く違う方法なの?素片接続の一種?
313デフォルトの名無しさん
2011/08/03(水) 19:03:56.08 規則合成は、規則に基づいて音声合成することなので、合成方式が波形接続かHMM合成かとは別。というか、上の分類。
ゆっくりは、たぶん、LPCとかのパラメータからのボコーダ方式。ボコーダという点ではHMM合成と同じ。
ゆっくりは、たぶん、LPCとかのパラメータからのボコーダ方式。ボコーダという点ではHMM合成と同じ。
314デフォルトの名無しさん
2011/08/05(金) 06:51:28.40 >>313
ありがとう。勉強になります。
ありがとう。勉強になります。
315デフォルトの名無しさん
2012/04/24(火) 14:08:11.51 NHK Eテレ Rの法則という番組にて歌声合成が取り上げられるようです.
また,その企画に伴い,4/25から番組HPでUTAU音源がDL出来るようになります.
男声と女声の2音源です.その音源作りを担当させていただきました!
また,その企画に伴い,4/25から番組HPでUTAU音源がDL出来るようになります.
男声と女声の2音源です.その音源作りを担当させていただきました!
316デフォルトの名無しさん
2012/06/01(金) 11:31:32.53 UTAUよりまともな音声合成ソフトないの?
317デフォルトの名無しさん
2012/07/09(月) 20:44:26.02 日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの?
詳しく教えてくれ
詳しく教えてくれ
318デフォルトの名無しさん
2012/07/16(月) 20:36:29.06 日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの?
詳しく教えてくれ
詳しく教えてくれ
319デフォルトの名無しさん
2012/08/12(日) 22:40:26.39 誰かHMM音声合成を語れ
320デフォルトの名無しさん
2012/10/28(日) 13:39:03.63 フジテレビの杏梨ルネってどこの技術?
321デフォルトの名無しさん
2013/05/01(水) 02:28:38.09322デフォルトの名無しさん
2013/05/01(水) 02:32:16.90 なるほど
323デフォルトの名無しさん
2013/05/04(土) 21:11:27.84 おれの98は、ピポッと起動するから現在形
324デフォルトの名無しさん
2013/05/07(火) 15:12:54.26ID:qEqQNQf6O 難しいな
325デフォルトの名無しさん
2013/06/27(木) 16:17:04.80326デフォルトの名無しさん
2013/10/18(金) 09:34:37.17327デフォルトの名無しさん
2013/11/03(日) 20:36:45.88 初音ミクとか目標にしてるんだろうけど意外に奥が深いんだよ。
328デフォルトの名無しさん
2014/01/27(月) 14:18:06.62 判ります
329デフォルトの名無しさん
2014/01/27(月) 15:00:50.44 初音ミクどころか歌唱よりさらに難しいといわれる読み上げに見える
330デフォルトの名無しさん
2014/01/27(月) 15:05:33.72 へっ?
どうみても歌唱やんこれ
どうみても歌唱やんこれ
331デフォルトの名無しさん
2014/03/08(土) 16:28:12.83 帐
332デフォルトの名無しさん
2014/04/04(金) 14:07:45.36ID:Bqre4+dt 初音ミク、って専属の声優さんがいるんじゃなかったかな?
その声優さんを機械のような質感にしているだけだと思うけどな。
その声優さんを機械のような質感にしているだけだと思うけどな。
333デフォルトの名無しさん
2014/04/04(金) 14:11:49.55ID:UPfoP0f4334デフォルトの名無しさん
2014/04/07(月) 10:02:18.51ID:Eg/nEWhY335デフォルトの名無しさん
2014/04/07(月) 10:05:42.81ID:Eg/nEWhY 声優さんの合成音声をセリフから抽出するより。
お気に入りの声優さんに「あ〜ん」までを発声してもらって。
それをタイピングと連動させるツールを作ればいいんでね?
音域を解析して、ネットラジオ等で音声素材を収集して。
埋められない言葉は、これまで収集したデータから予測するのは・・・。
考えただけでかなりのコスト^^;
お気に入りの声優さんに「あ〜ん」までを発声してもらって。
それをタイピングと連動させるツールを作ればいいんでね?
音域を解析して、ネットラジオ等で音声素材を収集して。
埋められない言葉は、これまで収集したデータから予測するのは・・・。
考えただけでかなりのコスト^^;
336デフォルトの名無しさん
2014/04/07(月) 10:36:56.71ID:SBlJ2Fr+ こんなん出てたわ
https://www.youtube.com/watch?v=tUIQItrpYBE
https://www.youtube.com/watch?v=RyezC1p_pak
http://internet.watch.impress.co.jp/docs/news/20140404_642876.htm
http://game.watch.impress.co.jp/docs/news/20140221_636384.html
http://gigazine.net/news/20140404-pocket-miku/
http://nlab.itmedia.co.jp/nl/articles/1403/03/news057.html
http://japanese.engadget.com/2014/03/02/evocaloid/
http://www.amazon.co.jp/dp/4057504656/
http://www.dtmstation.com/archives/51888898.html
http://hitoriblog.com/?p=23019
http://www.otonanokagaku.net/nsx39/index.html
http://www.dtmstation.com/archives/51877546.html
http://otonanokagaku.net/nsx39/app.html
http://www.crypton.co.jp/cfm/news/2014/02/pocketmiku
歌詞モードは知らんけど
リアルタイムモードは子音がサポートされてないのが残念
リアルタイムでも子音出せるのはこちら
↓
https://www.youtube.com/watch?v=ka8-SpSkmZA
http://vocaloid.blog120.fc2.com/blog-entry-11373.html
https://www.youtube.com/watch?v=tUIQItrpYBE
https://www.youtube.com/watch?v=RyezC1p_pak
http://internet.watch.impress.co.jp/docs/news/20140404_642876.htm
http://game.watch.impress.co.jp/docs/news/20140221_636384.html
http://gigazine.net/news/20140404-pocket-miku/
http://nlab.itmedia.co.jp/nl/articles/1403/03/news057.html
http://japanese.engadget.com/2014/03/02/evocaloid/
http://www.amazon.co.jp/dp/4057504656/
http://www.dtmstation.com/archives/51888898.html
http://hitoriblog.com/?p=23019
http://www.otonanokagaku.net/nsx39/index.html
http://www.dtmstation.com/archives/51877546.html
http://otonanokagaku.net/nsx39/app.html
http://www.crypton.co.jp/cfm/news/2014/02/pocketmiku
歌詞モードは知らんけど
リアルタイムモードは子音がサポートされてないのが残念
リアルタイムでも子音出せるのはこちら
↓
https://www.youtube.com/watch?v=ka8-SpSkmZA
http://vocaloid.blog120.fc2.com/blog-entry-11373.html
337デフォルトの名無しさん
2014/04/07(月) 11:05:45.64ID:SBlJ2Fr+ ひとつURLにlついてなかったので
http://internet.watch.impress.co.jp/docs/news/20140404_642876.html
http://internet.watch.impress.co.jp/docs/news/20140404_642876.html
338デフォルトの名無しさん
2014/04/07(月) 11:50:09.04ID:ktMnCtsu また、この専用アプリでは、初期状態で「あ」、「い」、「う」、「え」、「お」と割り当てられている5つのボタンに別の文字を割り当てることができたり、この ボタン以外の文字をリアルタイムに選択して、本体のカーボンキーボードで歌わせることも可能とのことです。
発音するノートの直前に文字情報をMIDIシステム・エクスクルーシブで入力する
さらに、すべてをシーケンサ、DAWでコントロールして歌わせたという場合には、MIDIシステムエクスクルーシブを利用して歌詞を設定することも可能 です。具体的には、発音させたいノートデータの直前に
F0 43 79 09 11 0A 00 ** F7
というエクスクルーシブデータを送るのですが、この**に文字番号を設定します。その文字番号についてはポケット・ミクのマニュアルに記載されてい ますが、「み」なら「65」、「く」なら「07」(いずれも16進数表記)のように1バイトの数字が割り振られています。
子音もいけるじゃん
発音するノートの直前に文字情報をMIDIシステム・エクスクルーシブで入力する
さらに、すべてをシーケンサ、DAWでコントロールして歌わせたという場合には、MIDIシステムエクスクルーシブを利用して歌詞を設定することも可能 です。具体的には、発音させたいノートデータの直前に
F0 43 79 09 11 0A 00 ** F7
というエクスクルーシブデータを送るのですが、この**に文字番号を設定します。その文字番号についてはポケット・ミクのマニュアルに記載されてい ますが、「み」なら「65」、「く」なら「07」(いずれも16進数表記)のように1バイトの数字が割り振られています。
子音もいけるじゃん
339デフォルトの名無しさん
2014/04/07(月) 12:14:36.44ID:ktMnCtsu340デフォルトの名無しさん
2014/04/07(月) 13:32:02.94ID:ktMnCtsu341デフォルトの名無しさん
2014/04/07(月) 13:33:06.19ID:ktMnCtsu342デフォルトの名無しさん
2014/04/12(土) 13:52:39.87ID:UapBJj1i USBでmidiノート投げれば子音も普通にしゃべれるのか
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【日本人の旅行離れ】国内旅行すら行けなくなった……オーバーツーリズムだけじゃない 旅行者減少の異常事態 [ぐれ★]
- 高市首相の答弁書に「台湾有事答えない」と明記 存立危機発言当時 ★12 [蚤の市★]
- 中国の渡航自粛要請1カ月 大阪の観光バス予約ゼロ、東北にも波及 [蚤の市★]
- “ひとり焼肉”でおなじみ「焼肉ライク」が閉店ラッシュ。なぜ「コスパが悪い」と言われてしまうのか [Gecko★]
- 女性天皇「賛成」69%、将来の皇位継承「不安」68%…読売世論調査 [蚤の市★]
- 【神戸】エレベーター「かご」なく男性医師が転落死 大手「三菱電機ビルソリューションズ」の担当者、安全装置切り放置か [ぐれ★]
- 高市、メガソーラー廃止。環境破壊が社会問題化 [792147417]
- 🏡おい!返事しろ︎︎!知的障害者!
- ダイバクショウも
- 他人のリクエストで自分の癖と異なる絵を上げる絵師いるじゃん?
- クリスマスに何かする「予定なし」は54%。 過去最高水準に。ケーキの値上げもあって節約志向へ [663766621]
- ひとり暮らしの男の家に無いものと言えば
