音声合成プログラムを作りる

**デフォルトの名無しさん** · 2007/06/14(木) 09:48:48

ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ

**デフォルトの名無しさん** · 2007/06/14(木) 09:52:04

じゃあ、一緒に作るれ

**デフォルトの名無しさん** · 2007/06/14(木) 09:54:14

しゃべた

**デフォルトの名無しさん** · 2007/06/14(木) 10:08:17

ネトラジリソース多いのんって誰かな
ＢＧＭとかあんまなくって、高音質なの

**デフォルトの名無しさん** · 2007/06/14(木) 10:33:17

よし、みんなで作れろ

**デフォルトの名無しさん** · 2007/06/14(木) 12:27:51

中原小麦が多いるれ

**デフォルトの名無しさん** · 2007/06/14(木) 14:18:18

音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。

**デフォルトの名無しさん** · 2007/06/14(木) 14:39:22

音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。

7 · 2007/06/14(木) 14:57:22

シミュレーションやるより、模型？を作った方が楽なんだなー

**デフォルトの名無しさん** · 2007/06/14(木) 14:58:35

でも、模型はメンテナンスが

**デフォルトの名無しさん** · 2007/06/14(木) 16:22:28

>>7 に期待

7 · 2007/06/14(木) 20:44:39

いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ？
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。

**デフォルトの名無しさん** · 2007/06/14(木) 21:11:40

　　　　　 |
　　＼　　__　　／
　　＿　（ｍ）　＿ﾋﾟｺｰﾝ
　　　　　|ミ|
　　／　｀´　＼
　　　　　('A`)　　　　　そうだ！　自分で喋ればいいんだ！
　　　　　ノヽノヽ
　　　　　　　くく

**デフォルトの名無しさん** · 2007/06/15(金) 00:03:29

>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。

1 · 2007/06/15(金) 01:58:54

まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな

7 · 2007/06/15(金) 02:42:52

ツールならHTKにいいのがあるんじゃね？

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな？
しかし懐かしすぎ・・・

1 · 2007/06/15(金) 02:48:21

>>16
HTKおｋ、しらべる
ｔｈｘ

**デフォルトの名無しさん** · 2007/06/15(金) 16:35:47

垚

**デフォルトの名無しさん** · 2007/06/16(土) 16:15:14

1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる

1 · 2007/06/17(日) 14:53:48

ＨＴＫ登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声ｄｂ作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの？
０から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな

**デフォルトの名無しさん** · 2007/06/19(火) 02:06:23

http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ！

1 · 2007/06/20(水) 03:00:36

86時間て正味？ネトラジから集めよう思たら数年分必要だなー
ところでこれＮＨＫの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん？

**デフォルトの名無しさん** · 2007/07/08(日) 20:38:20

http://pc11.2ch.net/test/read.cgi/software/1119069271/

**デフォルトの名無しさん** · 2007/07/10(火) 17:10:43

理系大学院って工学部と理学部でだいぶ違うよな

1 · 2007/07/10(火) 23:29:09

>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな

**デフォルトの名無しさん** · 2007/07/13(金) 14:22:49

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:27:35

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:29:44

age

**デフォルトの名無しさん** · 2007/07/13(金) 14:40:43

ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php

**デフォルトの名無しさん** · 2007/07/13(金) 18:29:39

同じ金額で声優雇った方が早くね？

1 · 2007/07/14(土) 00:03:56

>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で２ちゃんログとかメールとか
読んでもらったら面白くなくね？

**デフォルトの名無しさん** · 2007/07/19(木) 21:26:09

音（声）の切り張りと云うと、コナミがときメモ3でやってなかったっけ？
未プレイ（体験版触っただけ）だから、詳しくは解らんけど。

**名無しさん＠そうだ選挙に行こう** · 2007/07/29(日) 04:01:34

イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。

1 · 2007/07/30(月) 00:14:46

>>32
ときめも２と３でプレーヤの名前を呼んでくれる
ＥＶＳという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html

1 · 2007/07/30(月) 00:22:44

"音声合成ゲーム"で検索すると
ＰＳ２　モジブリボンにＮＴＴ
ＰＳ２　ダビつく３に東芝
ＤＳ　お料理ナビは？
ＤＳ　日本史・世界史に日立
なんてのが見つかったよ
どうなん？

1 · 2007/07/30(月) 00:26:22

>>33
イントネーションって網羅できるもんなの？
ＡｑｕｅｓＴａｌｋってあんまりきれいな声とは思えない

**デフォルトの名無しさん** · 2007/07/31(火) 01:27:57

以前でてた音声コーパスっていうのがそういうものじゃないのか？

**デフォルトの名無しさん** · 2007/07/31(火) 04:55:00

同じ単語でもどう使われるかでイントネーションって変わるからな。

**デフォルトの名無しさん** · 2007/08/01(水) 00:48:55

>>38
例えば？

**デフォルトの名無しさん** · 2007/08/06(月) 10:44:13

彼氏↑、彼氏↓

**デフォルトの名無しさん** · 2007/08/06(月) 16:39:36

箸　端　橋　嘴　波子　梯
頑張って聞き分けてください。

**デフォルトの名無しさん** · 2007/08/06(月) 17:10:09

無理ッス絶対無理ッス自分無理ッス

**デフォルトの名無しさん** · 2007/08/06(月) 20:17:36

>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。

**デフォルトの名無しさん** · 2007/08/06(月) 20:32:17

どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw

**デフォルトの名無しさん** · 2007/08/06(月) 20:33:20

>>35
くまうたも忘れないでくれ

**デフォルトの名無しさん** · 2007/08/08(水) 01:18:40

早く作りろ

**デフォルトの名無しさん** · 2007/08/08(水) 01:58:32

「あ」の波形と「い」の波形を足して２で割ったら、「あ」と「い」の中間の声ができるってわけか！

**デフォルトの名無しさん** · 2007/08/08(水) 01:59:27

ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン

**デフォルトの名無しさん** · 2007/08/08(水) 02:11:22

じゃ期限は明日の０時だ。よろしく。

**デフォルトの名無しさん** · 2007/08/08(水) 04:15:54

オーケーベイビー
首洗って待ってな。

**デフォルトの名無しさん** · 2007/08/09(木) 01:17:32

まだぁー？
もう全身洗って待ってるんだけど。

**デフォルトの名無しさん** · 2007/08/09(木) 06:52:26

声帯って振動するだけ？声によって（高さじゃなく「あ」とか「い」）振動の仕方が異なることはないよね？
音が高くなると振動数が増えるだけだよね？
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの？
舌のシミュレーションが大変そう(><;)

**デフォルトの名無しさん** · 2007/08/09(木) 10:39:18

音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。

**デフォルトの名無しさん** · 2007/08/10(金) 14:06:39

必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ

1 · 2007/08/10(金) 16:14:15

>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ

**デフォルトの名無しさん** · 2007/08/11(土) 18:40:21

どっちかっつーと話者変換のほうに興味があるんだが

**デフォルトの名無しさん** · 2007/08/16(木) 22:59:34

その声優の音声ファイルはSNいいのか？

1 · 2007/08/16(木) 23:48:39

>>56
話者変換って何に使うん？
自分のしゃべった声を誰かの声に似せるとかな？

1 · 2007/08/17(金) 00:13:19

>>57
ＳＮは分かんねが、音は良さげ（６４ｋｂｐｓの４４ｋＨｚ）
一人しゃべりでＢＧＭなしなんじょ

**デフォルトの名無しさん** · 2007/08/17(金) 01:07:05

BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。

**デフォルトの名無しさん** · 2007/08/17(金) 20:59:04

俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい

**デフォルトの名無しさん** · 2007/08/24(金) 21:36:59

エロゲの音声使えば？
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ

**デフォルトの名無しさん** · 2007/08/28(火) 07:41:37

北都さんの声でお願いします

**デフォルトの名無しさん** · 2007/09/06(木) 14:16:39

結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF

**デフォルトの名無しさん** · 2007/09/06(木) 20:14:37

>>64
藤田咲はまなストのモモ役が良かったなぁ

**デフォルトの名無しさん** · 2007/09/21(金) 10:48:08

ときめも２以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて

**デフォルトの名無しさん** · 2007/12/17(月) 22:51:47

>>66
overlap add

**デフォルトの名無しさん** · 2007/12/19(水) 12:23:36

――
学校

￣￣￣＼
専門学校

**デフォルトの名無しさん** · 2007/12/20(木) 23:14:24

>>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい

**デフォルトの名無しさん** · 2007/12/21(金) 01:38:07

Alice Project

**デフォルトの名無しさん** · 2007/12/24(月) 09:25:18

2007/12/19(Wed.) ◆ Julius-4.0 リリース

**デフォルトの名無しさん** · 2007/12/29(土) 18:28:29

初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。

そんな、俺に、お勧めはこれ。

「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1

**デフォルトの名無しさん** · 2007/12/30(日) 12:03:36

音声合成というより、台詞合成だな

**デフォルトの名無しさん** · 2007/12/30(日) 13:55:26

>>72
ワロタ

**デフォルトの名無しさん** · 2008/01/06(日) 13:05:04

れこーどうえーぶ
http://recwav.dip.jp/

音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222

**デフォルトの名無しさん** · 2008/01/10(木) 21:52:09

この板の住人じゃないんだけどＡｑｕｅｓＴａｌｋでwav保存できるソフト
あるのかな？
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしｗ

**デフォルトの名無しさん** · 2008/01/11(金) 06:44:14

全二十じゃないの？

**デフォルトの名無しさん** · 2008/01/11(金) 13:26:54

全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば？ということかな？
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。

**デフォルトの名無しさん** · 2008/01/13(日) 09:32:40

普通に、ライン出力を録画するんではダメなのか？

**デフォルトの名無しさん** · 2008/01/18(金) 02:45:43

>>78
スマンスマンｗ
二十って書いたの俺かもｗ

**デフォルトの名無しさん** · 2008/01/19(土) 00:36:30

>>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか？
ほとんどの人がライセンスがないから試せないと思われ。

**デフォルトの名無しさん** · 2008/01/26(土) 02:02:50

>>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない

**デフォルトの名無しさん** · 2008/01/26(土) 02:53:10

全二重に温室関係案のカナ？

**デフォルトの名無しさん** · 2008/02/07(木) 12:56:18

いまどこまで進んでいるんだ？

**デフォルトの名無しさん** · 2008/03/24(月) 13:24:15

age

**デフォルトの名無しさん** · 2008/04/06(日) 12:19:17

>>1
おーい！いまどこまで進んでいるんだ？

**デフォルトの名無しさん** · 2008/04/07(月) 01:29:34

age

**デフォルトの名無しさん** · 2008/04/07(月) 04:01:19

「あ」の波形と「う」の波形を足して２で割ったら「い」の波形ができるのを発見して特許取った

**デフォルトの名無しさん** · 2008/04/07(月) 08:54:58

特許番号は？

**デフォルトの名無しさん** · 2008/04/07(月) 21:51:13

どのくらい「い」と区別が付かないんだ？
不自然感０？

**デフォルトの名無しさん** · 2008/04/07(月) 21:54:23

じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん

**デフォルトの名無しさん** · 2008/04/23(水) 18:22:12

>>88-91
もうちょっとでアヘ声が実現するな

**デフォルトの名無しさん** · 2008/04/29(火) 23:32:40

>>88　特許番号は？

**デフォルトの名無しさん** · 2008/05/01(木) 14:02:57

juliusで音素列を指定して、
強制アライメント取れますか？

**デフォルトの名無しさん** · 2008/05/02(金) 23:24:08

>>94
つ単語・音素セグメンテーションキット＆Julian

94 · 2008/05/07(水) 03:45:12

>>95
ありがと
juliusでディクテーションさせて、julianで強制アライメントできるようになりました。
ところで、ピッチを求めるいいアルゴリズムはありませんか？

**デフォルトの名無しさん** · 2008/05/14(水) 13:20:18

Ｃ＋＋ＭＩＤＩプログラミングっていう廃刊を店に売ろうか悩んでるんだけどいくらになるんだろう

**デフォルトの名無しさん** · 2008/05/17(土) 07:29:42

ヤフオクの方が売れるんじゃね？

94 · 2008/05/19(月) 00:47:59

とりあえず、声優のラジオ番組の音声分割して、接続合成できるプログラム作ってみました
juliusの認識精度ではダメですね、手修正必須ですが

**デフォルトの名無しさん** · 2008/05/19(月) 08:53:12

そうか
音声素材なんてわざわざ録音しないでも
ネットラジオにいくらでも転がってるんだな
面白い発想するな

**デフォルトの名無しさん** · 2008/05/19(月) 22:39:48

これは意外な盲点。
個人(？)で使う分には十分だね。

**デフォルトの名無しさん** · 2008/05/20(火) 12:01:59

>>99
サンプルを聞いてみたいです

**デフォルトの名無しさん** · 2008/05/20(火) 19:25:05

周波数と最初に名づけたやつは死んでいいと思うな

94 · 2008/05/24(土) 11:02:31

>>102
音ってどこにアップできます？
それと何話させましょ？
声優はＳＭです

**102** · 2008/05/24(土) 13:14:10

>>104
アップローダは↓でお願いします。
ttp://www.axfc.net/uploader/

セリフは↓のサンプル音声の「シナリオ」あたりでどうでしょう。
ttp://voice.pentax.jp/blog/64.html

**デフォルトの名無しさん** · 2008/05/24(土) 15:20:08

ttp://www.aoni.co.jp/actress/ma/voice/minaguchi-yuko.mp3
これで

94 · 2008/05/25(日) 10:00:48

>>105,106
ttp://www11.axfc.net/uploader/20/so/He_103620.lzh
kwdは94です

**102** · 2008/05/25(日) 11:08:17

>>107
サンプル拝聴しました。
音素や単音単位ではなく、単語単位の連結なんですね。
語のつながりがぶつ切りで、聞き取るにはちょっと辛いかなと思います。
音素単位なら、聞き取りやすくなるかもしれませんが、
抑揚やアクセントを指定できるようにしないといけないので、難しいですが。

94 · 2008/05/25(日) 22:57:56

>>108
アドバイスありがとうございます。
使えるだけ使うので、単語より長い部分も１音素だけの部分もあります。
今はピッチ情報がないので抑揚をそろえられないです。だから最長一致。
これからはピッチをそろえられるようにしてみます。

**デフォルトの名無しさん** · 2008/07/12(土) 13:27:35

>>109
これってオープンソースにしないの？

**デフォルトの名無しさん** · 2008/07/13(日) 13:49:42

>>109
94さん

>>110の追加なんですがオープンソース化のメリットは・・・

開発が止まっても後を継げる。

・例えば作者が飽きたとか、あるいは交通事故にあったとかで開発が止まったとする。
　そんな場合、誰かが開発を引き継いでくれる可能性がある。

誰かが他のOSに移植してくれる。

・誰かがMacOS版を作りたいと思ったときに、ソースコードを見ずに移植した場合、どうして
　も互換性に問題が出る。
　しかし、ソースが公開されていれば、少ない手間でほぼ完全な移植ができる。
　環境に依存した部分は書き直したり、移植が難しい部分については機能を削ったりする
　必要があるけど、それでも一から書くよりはずっと楽。
　ちなみに、現在Windows以外の環境でサポート外の動いている場合、
　それは誰かが更新履歴の仕様を見て、オリジナルのコードを使わずに
　クラックして移植したものだ。ありがたいことだけど、
　もしソースが公開されていたらこの作業は不要だったはずで、その人はもっと別の作業ができた。

バグを修正できる
・誰かがバグを見つけ、それを報告したとする。
　それをみた第三者かが、ソースコードの中から原因を見つけて、
　作者に「ここを直せばいいぞ」と教えてくれる可能性がある。
　ひょっとしたら修正したソースコードをupしてくれるかもしれない。

**111** · 2008/07/13(日) 13:52:00

>>111　続き
自分で改良して、それを作者に提案できる。
・第三者ソフトウェアを見て「ここを改良したらもっと良くなるんじゃないのか？」
　もしくは「こんな機能を追加したらもっとよくなるんじゃないの？と誰かが思ったとする。
　その場合、公開されているコードを改良・追加し、作者に改良案や機能追加案を提案する
　ことができる。
　作者がその人の方がより開発に向いていると判断した人は、作者の許可を得て改良版を
　公開することができる。
　第三者が改良案や機能追加案を提案して作者がそれを見て、影響を受けて、第三者の
　改良版を使用しながら作者は更なる改良を加えることができる。
　ソースが公開されていなかったら、作者に具体的に改良案や機能追加案を
　提案することが難しい。

HDDが飛んでも即死しない
・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
　　ソースがサーバ上にアップしていれば、作者のHDDが飛んでも、開発を続行することが
　　できる。

とこんな感じなメリットがあります。
長文になってすいません。　ぜひご検討のほうよろしくお願いします。

**デフォルトの名無しさん** · 2008/07/13(日) 22:37:30

でたーオプソ厨

**デフォルトの名無しさん** · 2008/07/14(月) 12:10:04

>>110
>>111
>>112

それはいいアイディアですね。　ぜひやってもらいたいです。

**デフォルトの名無しさん** · 2008/07/14(月) 12:14:13

反論するのも馬鹿馬鹿しいが。
＞・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
これを字義通りに受け取る(或いはそのように敢えて振舞う)人がいることに驚いた。

**デフォルトの名無しさん** · 2008/07/14(月) 22:51:41

俺が学生時代にちまちま作ってたしょぼいソフトは
まさしくその運命をたどったよ

**デフォルトの名無しさん** · 2008/07/15(火) 01:33:45

そういや昔のプログラムはフロッピーに入れてたのでもう見れなくなったなｗ

**デフォルトの名無しさん** · 2008/07/15(火) 03:56:00

実はハードごとまだ生きてる
子供の頃しこしこ打ち込んでた雑誌掲載のBASICゲームは起動メニューを作っておいたので
ファイル名すら覚えてなくても今でも遊べる
子供時代の自分の聡明さにしばし感動
今はもう駄目かもわからんね

**デフォルトの名無しさん** · 2008/07/15(火) 21:05:07

そこで FILES

**デフォルトの名無しさん** · 2008/07/19(土) 12:36:03

>>109
おーい。94氏　オープンソース化しないのかい？
返事をくれ。

**デフォルトの名無しさん** · 2008/07/19(土) 13:34:24

自分の要求のために他者に負担をかけることを当然のように考えてるからオプソ「厨」って付くんだな。

**デフォルトの名無しさん** · 2008/07/19(土) 13:55:25

某コナンの蝶ネクタイ型変声機みたいな物は作れないかなぁ
他人の声からパラメータだけ抽出して、云々

**デフォルトの名無しさん** · 2008/07/19(土) 14:16:39

既にあるんですね...

**デフォルトの名無しさん** · 2008/07/19(土) 17:00:43

オプソ厨って、自作自演だよｗ
シェア作家のなｗ

**デフォルトの名無しさん** · 2008/07/20(日) 10:50:58

>>124
そんなわけないだろうｗ

94 · 2008/07/20(日) 12:22:06

久々に見に来たらレス増えてた。。。
オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ？
素材の音声データが無いと。それもかなりの量で。。

**デフォルトの名無しさん** · 2008/07/20(日) 14:54:58

プログラムの権利より音声データの権利のほうが問題になりがち

**デフォルトの名無しさん** · 2008/07/20(日) 15:05:16

>>122
1.マイクの声から声帯の影響を取り除く
2.フォルマントを他人の位置に移動する
でできるかも

**デフォルトの名無しさん** · 2008/07/20(日) 23:56:23

>>126
>オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ？

それでもいいと思う。

自分の声のデータを入れて合成することもできるし。

オープンソースなら合成エンジンをもっと高性能化することもできるし。

使う側が改造できるだけでなく、作った側にも自分の技術を高める、新しい着想を得る

といった双方にメリットがあるかもしれませんし。

**デフォルトの名無しさん** · 2008/07/21(月) 01:03:03

>>129
オープンソースって勝手に改変してくれる分にはいいけどパッチとか
送ってこられるとうざくない？
正直ソースが穢れるけど、拒否するとアンチ化しそうだし。

**デフォルトの名無しさん** · 2008/07/21(月) 02:24:44

そりゃ、コミュニケーション力がないだけだな。
適当にあしらえばいいし、ソースは参考になるなら自分で書き直して入れましたでいい。

オープンソースと、みんなで開発はまた別だよ。

**デフォルトの名無しさん** · 2008/07/21(月) 02:29:45

すべての会話音声を録音して流せば解決

**デフォルトの名無しさん** · 2008/07/21(月) 11:45:45

>>109
>>94氏
このプログラムは「Alice Project」と同じようなことができるのかい？

又某コナンの蝶ネクタイ型変声機みたいな機能を追加する予定とかはあるのかい？

**デフォルトの名無しさん** · 2008/07/21(月) 20:30:25

>>131
参考になるものは送ってこないから。
これだけは断言できる。
勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
しつこくしてくるのが関の山。
いやほんとしつこくされるよ。
住所なんか当たり前のように調べてくるしね。
それなりの覚悟がないとオープンソースは無理だよ。

**デフォルトの名無しさん** · 2008/07/21(月) 21:18:17

どうでもいいがペンタックスの合成ライブラリはかなり巧い

**デフォルトの名無しさん** · 2008/07/21(月) 22:28:41

>>134
そんなわけねえだろうよｗ
確かに参考になるものは送られてこないのは確かだけど、しつこくは
されないだろう。

しかもメールアドレスを公開しないでオープンソース化すればいいだけの話。

**デフォルトの名無しさん** · 2008/07/21(月) 22:32:25

オープンソース化ってもごく一部のソフト以外はパッチが送られてくるどころか読まれることすらほとんどなさそーな悪寒。

**デフォルトの名無しさん** · 2008/07/21(月) 23:19:57

てか、ソース見せ合うだけなら
どっかに無料のうｐロダ用意してそこに勝手にソースをうｐしたり、落としたりすれば良いんでは？

**デフォルトの名無しさん** · 2008/07/22(火) 00:15:42

反オプソ厨は、言い訳が稚拙なのがなｗ

普通に、手柄を独り占めしたい、ソースを見せたくない、でいいんだよｗ

**デフォルトの名無しさん** · 2008/07/22(火) 00:48:55

>>136
じゃぁそうしてみろよ。
どっかのロダに匿名で上げて見れ。
おれの創作物を勝手にオープンソースにしやがったってやつが3人は
出てくるから。
そうすればオープンソース厨の怖さが少しは理解できるだろ。
奴らは（無料も含めた）金のためなら何でもするからな。

**デフォルトの名無しさん** · 2008/07/22(火) 01:16:48

>>139
バカなオプソ厨を装った釣りとかネタか？
作った人間が手柄を独り占めできるのは当然の権利で言い訳とかいらんだろ？
むしろオプソ厨のほうが「あなたの手柄をタダ取りしたいんでソース見せてください」ってのを
いかにオブラートにくるんでうまく言えるか工夫しなきゃいけない立場なのに。

**デフォルトの名無しさん** · 2008/07/22(火) 01:24:19

>>141
だったら言い訳しなくていいよｗ　言い訳するってのは、何らかの心の働きだから。
いちいち、オプソ厨がウザイとか、ソースが汚いから見せるのが嫌だとか、しょうもない言い訳はいらんから。

まぁ、他の人のソースパクってて本当に見せられない奴も中にはいるだろうけどｗ

**デフォルトの名無しさん** · 2008/07/22(火) 01:37:40

>>142
え？マジなの？本当はオプソ厨のふりしたネガキャンだよな？

**デフォルトの名無しさん** · 2008/07/22(火) 23:53:47

>>140
だったらGPLもしくはGNU等のライセンスで公開すれば？
ちなみに、俺もオープンソースで公開したんたが、そんなことはなかったと思うな。

**デフォルトの名無しさん** · 2008/07/23(水) 00:00:43

誰か再うpしてくれないか
間違えて削除してしまった

**デフォルトの名無しさん** · 2008/07/23(水) 00:23:13

>>144
匿名でGPL等でうぷした場合の話だろ。
おまえは都合の悪い話は一切読めないのか？

クレクレ言ってる時点でオプソ厨のニオイがプンプンしてるんだよ。

匿名じゃない場合は過去ログ参照。

**デフォルトの名無しさん** · 2008/07/23(水) 01:01:07

こういう流れを作ってグダグダにするのがオプソ厨の狙いなんだから相手するなよｗ

**デフォルトの名無しさん** · 2008/07/23(水) 03:23:34

嫌なら嫌だって言えば良いだけだしな。
つーか、厨はクローズドの方がよってくると思うがｗ
あれしてくれ、これしてくれってｗ

オープンソース・フリーソフトなら、自分でやれ！で終わるｗ

**デフォルトの名無しさん** · 2008/07/23(水) 08:28:05

もし公開するならある程度完成度をあげてからの方がいいよ。オリジナルは俺だと主張できるくらいにね。
中途半端なソースを公開する必要なんて無い。

**デフォルトの名無しさん** · 2008/07/23(水) 13:10:13

実際の声からサンプリングするんじゃなくて、人間の声帯を物理モデリングして作れよ。

**デフォルトの名無しさん** · 2008/07/23(水) 16:14:23

式うｐしてくれ

**デフォルトの名無しさん** · 2008/07/24(木) 02:26:56

まずは模型を作るところから始めるんだ

**デフォルトの名無しさん** · 2008/07/25(金) 16:16:30

>>146

>勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
>しつこくしてくるのが関の山。
>いやほんとしつこくされるよ。
>住所なんか当たり前のように調べてくるしね。

匿名なのにどうやって送りつけるんだい？
話が矛盾してるぞ。

おい · 2008/07/25(金) 17:56:19

Shut the fuck up and write some code.

**デフォルトの名無しさん** · 2008/07/25(金) 21:14:17

>>153
ほんとに頭の悪い子だな。
頭の悪さは公表しなくていいからそっと隠しておけよ。
100回読みなおせばお前でも理解できるかも知れんから読みなおせ。

**デフォルトの名無しさん** · 2008/07/25(金) 22:09:22

とりあえず Win + U×2 しとけ

**デフォルトの名無しさん** · 2008/07/25(金) 23:05:35

自分の声から音声を合成し、入力したテキストを読み上げられるソフトを、OKIが発売した。病気などで声を失った人に、自分の声の代わりに使ってもらいたいという。
http://www.itmedia.co.jp/news/articles/0807/25/news011.html

**デフォルトの名無しさん** · 2008/07/26(土) 00:49:05

声を失った人が、自分の声から音声を合成することは出来ないと思うのだが

**158** · 2008/07/26(土) 00:50:41

って書いてから記事を読んで理解した。すまそ。

**デフォルトの名無しさん** · 2008/07/27(日) 00:18:05

>>146
そんなの匿名でやればいい話

**デフォルトの名無しさん** · 2008/07/27(日) 00:26:50

まだ作ってないのかおまえら

**デフォルトの名無しさん** · 2008/07/27(日) 09:42:30

>>160
だからお前がやればいいだろ。
オプソ厨の最大の欠点は、人が作ったものはクレクレ言って、オプソにしなければ
ならないと一生懸命言うけど、自分では何も作らないことだな。
社会正義のためとか言うけど、そんなものに興味があるなら自分でやれ。
おれは全然興味ない。

**デフォルトの名無しさん** · 2008/07/27(日) 11:30:58

ところでバーローの蝶ネクタイ型変声機みたいな物はできるのかね？

**デフォルトの名無しさん** · 2008/07/27(日) 11:56:39

ぼかりすは似たようなもんだと思う。

**デフォルトの名無しさん** · 2008/07/27(日) 14:23:25

韻律も含めて他人の声に変換してもらいたいなー

**デフォルトの名無しさん** · 2008/07/27(日) 16:18:32

しかし、オープンソースにするとパッチとかがウザイとか言うけど、
どう考えてもクローズドの方が、オープンにしろって要望も含めて、あれやってくれこれやってくれって五月蝿いと思うがｗ

まぁ、かまってちゃんならそっちの方がいいんだろうけどｗ

**デフォルトの名無しさん** · 2008/07/27(日) 19:03:07

某コナンの蝶ネクタイ型変声機みたいな物はどうやって作るんだい？
そのアルゴリズム等を提案してみてください。

**デフォルトの名無しさん** · 2008/07/27(日) 20:30:52

変声機はどっちかというと、元の音声をいかに消すかが肝だと思うｗ

**デフォルトの名無しさん** · 2008/07/27(日) 20:37:01

音声認識して音声合成しなおせばいいんじゃね？

**デフォルトの名無しさん** · 2008/07/29(火) 12:29:37

ところで音声合成ってどうやって作るんだい？
アルゴリズムを提案してくれ。

**デフォルトの名無しさん** · 2008/07/29(火) 17:44:36

基本は、サンプリングのツギハギ。
声帯を物理シミュレーションしてるのは、あるのかな？

**デフォルトの名無しさん** · 2008/07/30(水) 01:18:20

>>170
ttp://recognition.web.fc2.com/synthe/

>>171
党・本多

**デフォルトの名無しさん** · 2008/08/01(金) 00:14:21

94氏
この掲示板みてたら、現状を報告してくれ。

**デフォルトの名無しさん** · 2008/08/03(日) 19:07:12

変声機つくっても犯罪用途しか思いつかないなぁw

**デフォルトの名無しさん** · 2008/08/03(日) 20:42:59

マイナー分野である音声合成技術が、オレオレ詐欺に使われることで一躍世間の注目を浴びる、と。

**デフォルトの名無しさん** · 2008/08/03(日) 21:08:32

それ既にあるぞ

**デフォルトの名無しさん** · 2008/08/04(月) 19:12:59

こんなんみつけた
ttp://d.hatena.ne.jp/shoozhoo/20080712

やっぱ英語用の音声合成は日本語じゃ役立たずなのか？

**デフォルトの名無しさん** · 2008/08/06(水) 22:21:13

ところで誰か音声合成プログラムを作っている人いるかね？

**デフォルトの名無しさん** · 2008/08/12(火) 00:25:48

ﾎﾞｲｰﾝ

**デフォルトの名無しさん** · 2008/09/04(木) 03:02:37

>>171
面白い特許を見つけました。シンセサイザーの方では表現力が高いとして
９０年代に研究され尽くされた物理モデリングアルゴリズムDWGを
音声シンセサイザーに応用するものです。
http://www.patentgenius.com/patent/5528726.html

**デフォルトの名無しさん** · 2008/09/08(月) 11:38:26

よく見つけたな。ちょっと読んでみるか

**デフォルトの名無しさん** · 2008/09/15(月) 06:39:06

http://prius.hitachi.co.jp/prius/pc/2005may/yomiwaza/index.html
＞※本ソフトウェアが出力する読み上げ音声の著作権は株式会社日立製作所が保有します。

これってどうなの？
ここまで著作権を主張できるもんなの？

**デフォルトの名無しさん** · 2008/09/15(月) 10:37:50

フォントの著作権の問題に似てるな

**デフォルトの名無しさん** · 2008/10/14(火) 11:10:46

そろそろ何か作りれたか？

**デフォルトの名無しさん** · 2008/10/14(火) 21:24:36

日本語でおｋ

**デフォルトの名無しさん** · 2008/10/18(土) 15:12:50

>>94氏へ
この掲示板みてたら、なんでもいいから報告をしてくれ。

**デフォルトの名無しさん** · 2008/12/24(水) 02:45:19

http://iwasete.net/

**デフォルトの名無しさん** · 2009/01/03(土) 11:49:06

age

**デフォルトの名無しさん** · 2009/02/05(木) 07:16:16

保守

**デフォルトの名無しさん** · 2009/02/05(木) 11:09:11

>>182
しかし読み上げた結果の音声を自由に使えなきゃ意味ないよな。

**デフォルトの名無しさん** · 2009/02/05(木) 11:11:41

そういえば、ちょっと前にアニメのキャラクターで音声合成するのがあったけど、あのベースになっているアルゴリズムはなんなんだろ。
藤崎モデルだっけ、あれとはちょっと違うでしょ？

**デフォルトの名無しさん** · 2009/02/08(日) 10:49:41

波形接続だろ

**デフォルトの名無しさん** · 2009/02/08(日) 11:15:27

でも、通常の波形接続リソースとは変えないとキャラっぽいしゃべりは無理だろ？

**デフォルトの名無しさん** · 2009/02/09(月) 00:16:52

キャラ声でキャラせりふを録音しておくんだからＯＫだろ？

**デフォルトの名無しさん** · 2009/02/09(月) 09:26:51

それじゃうまくいかないんじゃないか？
とはいえ、音声リソースに手作業で情報追加すれば何とかなるのかや。

**デフォルトの名無しさん** · 2009/02/09(月) 10:49:52

量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。

**デフォルトの名無しさん** · 2009/02/10(火) 23:16:28

>>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。

**デフォルトの名無しさん** · 2009/02/14(土) 04:41:05

overlap add

**デフォルトの名無しさん** · 2009/02/17(火) 14:31:50

>>198
わからんな、単語並べられてもさ。

**デフォルトの名無しさん** · 2009/02/17(火) 20:41:36

>>191 のアルゴリズムがoverlap additionだと言いたいんだろうな