音声合成プログラムを作りる

■ このスレッドは過去ログ倉庫に格納されています
2007/06/14(木) 09:48:48
ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

2008/05/19(月) 08:53:12
そうか
音声素材なんてわざわざ録音しないでも
ネットラジオにいくらでも転がってるんだな
面白い発想するな
2008/05/19(月) 22:39:48
これは意外な盲点。
個人(?)で使う分には十分だね。
2008/05/20(火) 12:01:59
>>99
サンプルを聞いてみたいです
2008/05/20(火) 19:25:05
周波数と最初に名づけたやつは死んでいいと思うな
10494
垢版 |
2008/05/24(土) 11:02:31
>>102
音ってどこにアップできます?
それと何話させましょ?
声優はSMです
105102
垢版 |
2008/05/24(土) 13:14:10
>>104
アップローダは↓でお願いします。
ttp://www.axfc.net/uploader/

セリフは↓のサンプル音声の「シナリオ」あたりでどうでしょう。
ttp://voice.pentax.jp/blog/64.html
2008/05/24(土) 15:20:08
ttp://www.aoni.co.jp/actress/ma/voice/minaguchi-yuko.mp3
これで
10794
垢版 |
2008/05/25(日) 10:00:48
>>105,106
ttp://www11.axfc.net/uploader/20/so/He_103620.lzh
kwdは94です
108102
垢版 |
2008/05/25(日) 11:08:17
>>107
サンプル拝聴しました。
音素や単音単位ではなく、単語単位の連結なんですね。
語のつながりがぶつ切りで、聞き取るにはちょっと辛いかなと思います。
音素単位なら、聞き取りやすくなるかもしれませんが、
抑揚やアクセントを指定できるようにしないといけないので、難しいですが。
10994
垢版 |
2008/05/25(日) 22:57:56
>>108
アドバイスありがとうございます。
使えるだけ使うので、単語より長い部分も1音素だけの部分もあります。
今はピッチ情報がないので抑揚をそろえられないです。だから最長一致。
これからはピッチをそろえられるようにしてみます。
2008/07/12(土) 13:27:35
>>109
これってオープンソースにしないの?
2008/07/13(日) 13:49:42
>>109
94さん

>>110の追加なんですがオープンソース化のメリットは・・・

開発が止まっても後を継げる。

・例えば作者が飽きたとか、あるいは交通事故にあったとかで開発が止まったとする。
 そんな場合、誰かが開発を引き継いでくれる可能性がある。

誰かが他のOSに移植してくれる。

・誰かがMacOS版を作りたいと思ったときに、ソースコードを見ずに移植した場合、どうして
 も互換性に問題が出る。
 しかし、ソースが公開されていれば、少ない手間でほぼ完全な移植ができる。
 環境に依存した部分は書き直したり、移植が難しい部分については機能を削ったりする
 必要があるけど、それでも一から書くよりはずっと楽。
 ちなみに、現在Windows以外の環境でサポート外の動いている場合、
 それは誰かが更新履歴の仕様を見て、オリジナルのコードを使わずに
 クラックして移植したものだ。ありがたいことだけど、
 もしソースが公開されていたらこの作業は不要だったはずで、その人はもっと別の作業ができた。

バグを修正できる
・誰かがバグを見つけ、それを報告したとする。
 それをみた第三者かが、ソースコードの中から原因を見つけて、
 作者に「ここを直せばいいぞ」と教えてくれる可能性がある。
 ひょっとしたら修正したソースコードをupしてくれるかもしれない。
112111
垢版 |
2008/07/13(日) 13:52:00
>>111 続き
自分で改良して、それを作者に提案できる。
・第三者ソフトウェアを見て「ここを改良したらもっと良くなるんじゃないのか?」
 もしくは「こんな機能を追加したらもっとよくなるんじゃないの?と誰かが思ったとする。
 その場合、公開されているコードを改良・追加し、作者に改良案や機能追加案を提案する
 ことができる。
 作者がその人の方がより開発に向いていると判断した人は、作者の許可を得て改良版を
 公開することができる。
 第三者が改良案や機能追加案を提案して作者がそれを見て、影響を受けて、第三者の
 改良版を使用しながら作者は更なる改良を加えることができる。
 ソースが公開されていなかったら、作者に具体的に改良案や機能追加案を
 提案することが難しい。

HDDが飛んでも即死しない
・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
  ソースがサーバ上にアップしていれば、作者のHDDが飛んでも、開発を続行することが
  できる。

とこんな感じなメリットがあります。
長文になってすいません。 ぜひご検討のほうよろしくお願いします。
2008/07/13(日) 22:37:30
でたーオプソ厨
2008/07/14(月) 12:10:04
>>110
>>111
>>112

それはいいアイディアですね。 ぜひやってもらいたいです。
2008/07/14(月) 12:14:13
反論するのも馬鹿馬鹿しいが。
>・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
これを字義通りに受け取る(或いはそのように敢えて振舞う)人がいることに驚いた。
2008/07/14(月) 22:51:41
俺が学生時代にちまちま作ってたしょぼいソフトは
まさしくその運命をたどったよ
2008/07/15(火) 01:33:45
そういや昔のプログラムはフロッピーに入れてたのでもう見れなくなったなw
2008/07/15(火) 03:56:00
実はハードごとまだ生きてる
子供の頃しこしこ打ち込んでた雑誌掲載のBASICゲームは起動メニューを作っておいたので
ファイル名すら覚えてなくても今でも遊べる
子供時代の自分の聡明さにしばし感動
今はもう駄目かもわからんね
2008/07/15(火) 21:05:07
そこで FILES
2008/07/19(土) 12:36:03
>>109
おーい。94氏 オープンソース化しないのかい?
返事をくれ。
2008/07/19(土) 13:34:24
自分の要求のために他者に負担をかけることを当然のように考えてるからオプソ「厨」って付くんだな。
2008/07/19(土) 13:55:25
某コナンの蝶ネクタイ型変声機みたいな物は作れないかなぁ
他人の声からパラメータだけ抽出して、云々
2008/07/19(土) 14:16:39
既にあるんですね...
2008/07/19(土) 17:00:43
オプソ厨って、自作自演だよw
シェア作家のなw
125デフォルトの名無しさん
垢版 |
2008/07/20(日) 10:50:58
>>124
そんなわけないだろうw
12694
垢版 |
2008/07/20(日) 12:22:06
久々に見に来たらレス増えてた。。。
オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ?
素材の音声データが無いと。それもかなりの量で。。
127デフォルトの名無しさん
垢版 |
2008/07/20(日) 14:54:58
プログラムの権利より音声データの権利のほうが問題になりがち
2008/07/20(日) 15:05:16
>>122
1.マイクの声から声帯の影響を取り除く
2.フォルマントを他人の位置に移動する
でできるかも
129デフォルトの名無しさん
垢版 |
2008/07/20(日) 23:56:23
>>126
>オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ?

それでもいいと思う。

自分の声のデータを入れて合成することもできるし。

オープンソースなら合成エンジンをもっと高性能化することもできるし。

使う側が改造できるだけでなく、作った側にも自分の技術を高める、新しい着想を得る

といった双方にメリットがあるかもしれませんし。
130デフォルトの名無しさん
垢版 |
2008/07/21(月) 01:03:03
>>129
オープンソースって勝手に改変してくれる分にはいいけどパッチとか
送ってこられるとうざくない?
正直ソースが穢れるけど、拒否するとアンチ化しそうだし。
2008/07/21(月) 02:24:44
そりゃ、コミュニケーション力がないだけだな。
適当にあしらえばいいし、ソースは参考になるなら自分で書き直して入れましたでいい。

オープンソースと、みんなで開発はまた別だよ。
2008/07/21(月) 02:29:45
すべての会話音声を録音して流せば解決
133デフォルトの名無しさん
垢版 |
2008/07/21(月) 11:45:45
>>109
>>94
このプログラムは「Alice Project」と同じようなことができるのかい?

又某コナンの蝶ネクタイ型変声機みたいな機能を追加する予定とかはあるのかい?
134デフォルトの名無しさん
垢版 |
2008/07/21(月) 20:30:25
>>131
参考になるものは送ってこないから。
これだけは断言できる。
勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
しつこくしてくるのが関の山。
いやほんとしつこくされるよ。
住所なんか当たり前のように調べてくるしね。
それなりの覚悟がないとオープンソースは無理だよ。
2008/07/21(月) 21:18:17
どうでもいいがペンタックスの合成ライブラリはかなり巧い
136デフォルトの名無しさん
垢版 |
2008/07/21(月) 22:28:41
>>134
そんなわけねえだろうよw
確かに参考になるものは送られてこないのは確かだけど、しつこくは
されないだろう。

しかもメールアドレスを公開しないでオープンソース化すればいいだけの話。
2008/07/21(月) 22:32:25
オープンソース化ってもごく一部のソフト以外はパッチが送られてくるどころか読まれることすらほとんどなさそーな悪寒。
2008/07/21(月) 23:19:57
てか、ソース見せ合うだけなら
どっかに無料のうpロダ用意してそこに勝手にソースをうpしたり、落としたりすれば良いんでは?
2008/07/22(火) 00:15:42
反オプソ厨は、言い訳が稚拙なのがなw

普通に、手柄を独り占めしたい、ソースを見せたくない、でいいんだよw
140デフォルトの名無しさん
垢版 |
2008/07/22(火) 00:48:55
>>136
じゃぁそうしてみろよ。
どっかのロダに匿名で上げて見れ。
おれの創作物を勝手にオープンソースにしやがったってやつが3人は
出てくるから。
そうすればオープンソース厨の怖さが少しは理解できるだろ。
奴らは(無料も含めた)金のためなら何でもするからな。
2008/07/22(火) 01:16:48
>>139
バカなオプソ厨を装った釣りとかネタか?
作った人間が手柄を独り占めできるのは当然の権利で言い訳とかいらんだろ?
むしろオプソ厨のほうが「あなたの手柄をタダ取りしたいんでソース見せてください」ってのを
いかにオブラートにくるんでうまく言えるか工夫しなきゃいけない立場なのに。
2008/07/22(火) 01:24:19
>>141
だったら言い訳しなくていいよw 言い訳するってのは、何らかの心の働きだから。
いちいち、オプソ厨がウザイとか、ソースが汚いから見せるのが嫌だとか、しょうもない言い訳はいらんから。

まぁ、他の人のソースパクってて本当に見せられない奴も中にはいるだろうけどw
2008/07/22(火) 01:37:40
>>142
え?マジなの?本当はオプソ厨のふりしたネガキャンだよな?
2008/07/22(火) 23:53:47
>>140
だったらGPLもしくはGNU等のライセンスで公開すれば?
ちなみに、俺もオープンソースで公開したんたが、そんなことはなかったと思うな。
2008/07/23(水) 00:00:43
誰か再うpしてくれないか
間違えて削除してしまった
146デフォルトの名無しさん
垢版 |
2008/07/23(水) 00:23:13
>>144
匿名でGPL等でうぷした場合の話だろ。
おまえは都合の悪い話は一切読めないのか?

クレクレ言ってる時点でオプソ厨のニオイがプンプンしてるんだよ。

匿名じゃない場合は過去ログ参照。
2008/07/23(水) 01:01:07
こういう流れを作ってグダグダにするのがオプソ厨の狙いなんだから相手するなよw
2008/07/23(水) 03:23:34
嫌なら嫌だって言えば良いだけだしな。
つーか、厨はクローズドの方がよってくると思うがw
あれしてくれ、これしてくれってw

オープンソース・フリーソフトなら、自分でやれ!で終わるw
2008/07/23(水) 08:28:05
もし公開するならある程度完成度をあげてからの方がいいよ。オリジナルは俺だと主張できるくらいにね。
中途半端なソースを公開する必要なんて無い。
2008/07/23(水) 13:10:13
実際の声からサンプリングするんじゃなくて、人間の声帯を物理モデリングして作れよ。
2008/07/23(水) 16:14:23
式うpしてくれ
2008/07/24(木) 02:26:56
まずは模型を作るところから始めるんだ
2008/07/25(金) 16:16:30
>>146

>勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
>しつこくしてくるのが関の山。
>いやほんとしつこくされるよ。
>住所なんか当たり前のように調べてくるしね。

匿名なのにどうやって送りつけるんだい?
話が矛盾してるぞ。
154おい
垢版 |
2008/07/25(金) 17:56:19
Shut the fuck up and write some code.
155デフォルトの名無しさん
垢版 |
2008/07/25(金) 21:14:17
>>153
ほんとに頭の悪い子だな。
頭の悪さは公表しなくていいからそっと隠しておけよ。
100回読みなおせばお前でも理解できるかも知れんから読みなおせ。
2008/07/25(金) 22:09:22
とりあえず Win + U×2 しとけ
2008/07/25(金) 23:05:35
自分の声から音声を合成し、入力したテキストを読み上げられるソフトを、OKIが発売した。病気などで声を失った人に、自分の声の代わりに使ってもらいたいという。
http://www.itmedia.co.jp/news/articles/0807/25/news011.html
2008/07/26(土) 00:49:05
声を失った人が、自分の声から音声を合成することは出来ないと思うのだが
159158
垢版 |
2008/07/26(土) 00:50:41
って書いてから記事を読んで理解した。すまそ。
160デフォルトの名無しさん
垢版 |
2008/07/27(日) 00:18:05
>>146
そんなの匿名でやればいい話
2008/07/27(日) 00:26:50
まだ作ってないのかおまえら
162デフォルトの名無しさん
垢版 |
2008/07/27(日) 09:42:30
>>160
だからお前がやればいいだろ。
オプソ厨の最大の欠点は、人が作ったものはクレクレ言って、オプソにしなければ
ならないと一生懸命言うけど、自分では何も作らないことだな。
社会正義のためとか言うけど、そんなものに興味があるなら自分でやれ。
おれは全然興味ない。
163デフォルトの名無しさん
垢版 |
2008/07/27(日) 11:30:58
ところでバーローの蝶ネクタイ型変声機みたいな物はできるのかね?
2008/07/27(日) 11:56:39
ぼかりすは似たようなもんだと思う。
2008/07/27(日) 14:23:25
韻律も含めて他人の声に変換してもらいたいなー
2008/07/27(日) 16:18:32
しかし、オープンソースにするとパッチとかがウザイとか言うけど、
どう考えてもクローズドの方が、オープンにしろって要望も含めて、あれやってくれこれやってくれって五月蝿いと思うがw

まぁ、かまってちゃんならそっちの方がいいんだろうけどw
167デフォルトの名無しさん
垢版 |
2008/07/27(日) 19:03:07
某コナンの蝶ネクタイ型変声機みたいな物はどうやって作るんだい?
そのアルゴリズム等を提案してみてください。
2008/07/27(日) 20:30:52
変声機はどっちかというと、元の音声をいかに消すかが肝だと思うw
2008/07/27(日) 20:37:01
音声認識して音声合成しなおせばいいんじゃね?
2008/07/29(火) 12:29:37
ところで音声合成ってどうやって作るんだい?
アルゴリズムを提案してくれ。
2008/07/29(火) 17:44:36
基本は、サンプリングのツギハギ。
声帯を物理シミュレーションしてるのは、あるのかな?
2008/07/30(水) 01:18:20
>>170
ttp://recognition.web.fc2.com/synthe/

>>171
党・本多
173デフォルトの名無しさん
垢版 |
2008/08/01(金) 00:14:21

94氏
この掲示板みてたら、現状を報告してくれ。
2008/08/03(日) 19:07:12
変声機つくっても犯罪用途しか思いつかないなぁw
2008/08/03(日) 20:42:59
マイナー分野である音声合成技術が、オレオレ詐欺に使われることで一躍世間の注目を浴びる、と。
2008/08/03(日) 21:08:32
それ既にあるぞ
2008/08/04(月) 19:12:59
こんなんみつけた
ttp://d.hatena.ne.jp/shoozhoo/20080712

やっぱ英語用の音声合成は日本語じゃ役立たずなのか?
178デフォルトの名無しさん
垢版 |
2008/08/06(水) 22:21:13
ところで誰か音声合成プログラムを作っている人いるかね?
2008/08/12(火) 00:25:48
ボイーン
2008/09/04(木) 03:02:37
>>171
面白い特許を見つけました。シンセサイザーの方では表現力が高いとして
90年代に研究され尽くされた物理モデリングアルゴリズムDWGを
音声シンセサイザーに応用するものです。
http://www.patentgenius.com/patent/5528726.html
2008/09/08(月) 11:38:26
よく見つけたな。ちょっと読んでみるか
182デフォルトの名無しさん
垢版 |
2008/09/15(月) 06:39:06
http://prius.hitachi.co.jp/prius/pc/2005may/yomiwaza/index.html
>※本ソフトウェアが出力する読み上げ音声の著作権は株式会社 日立製作所が保有します。

これってどうなの?
ここまで著作権を主張できるもんなの?
2008/09/15(月) 10:37:50
フォントの著作権の問題に似てるな
2008/10/14(火) 11:10:46
そろそろ何か作りれたか?
2008/10/14(火) 21:24:36
日本語でおk
2008/10/18(土) 15:12:50
>>94氏へ
この掲示板みてたら、なんでもいいから報告をしてくれ。
187デフォルトの名無しさん
垢版 |
2008/12/24(水) 02:45:19
http://iwasete.net/
188デフォルトの名無しさん
垢版 |
2009/01/03(土) 11:49:06
age
2009/02/05(木) 07:16:16
保守
2009/02/05(木) 11:09:11
>>182
しかし読み上げた結果の音声を自由に使えなきゃ意味ないよな。
2009/02/05(木) 11:11:41
そういえば、ちょっと前にアニメのキャラクターで音声合成するのがあったけど、あのベースになっているアルゴリズムはなんなんだろ。
藤崎モデルだっけ、あれとはちょっと違うでしょ?
2009/02/08(日) 10:49:41
波形接続だろ
2009/02/08(日) 11:15:27
でも、通常の波形接続リソースとは変えないとキャラっぽいしゃべりは無理だろ?
2009/02/09(月) 00:16:52
キャラ声でキャラせりふを録音しておくんだからOKだろ?
2009/02/09(月) 09:26:51
それじゃうまくいかないんじゃないか?
とはいえ、音声リソースに手作業で情報追加すれば何とかなるのかや。
2009/02/09(月) 10:49:52
量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。
2009/02/10(火) 23:16:28
>>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。
2009/02/14(土) 04:41:05
overlap add
2009/02/17(火) 14:31:50
>>198
わからんな、単語並べられてもさ。
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況