音声認識ソフト(2)
1 :名無しさん@1周年:2000/10/25(水) 04:41
音声認識ソフトを使っていると、いらいらして、発狂しそうになります。
これを使いこなすには、どうすればいいのですか?
前スレが変な形で終了しましたので、立て直しマスタ。 ドラゴンスピーチは2005年で止まってるのかな?
新しいバージョン出さないものか。
ドラゴンスピーチの良いところは、専門的な論文でも読み込ませて学習
させることができるので、独特な表現でも認識してくれるところか(勿論完璧ではない)。
それとクリックなども音声で出来るので(これも完璧ではないけど)、
指先が疲れない。
もう少しレベルアップしてくれると満足度が格段に上がるんだけど。
良い線行ってるのよ、だから新バージョンキボン。
私の使っていたのはドラゴンスピーチ・パートナー 2005 、5000円ぐらいの。
今は使ってませんが、腕と指が疲れるので、また使いたくなってきた。 専門的な論文でも読み込ませて……
これはオフィス2003でも出来ると思うけど。 トレーニングのように人間がいちいち読むのではなくて、
自分の書いた論文を大量に認識エンジンに記憶させて、
術語とか文章のパターンなどを学習させることができる。
IME 変換トレーニング ウィザードより、すごいのかな。
余り変わらないように思うけど。 入れたい文章と、音声認識で入力された文章両方を
載せてくれる人はいないのかな?
皆さんどの位で使われているか知りたい。
音声認識の実際を知りたい。 音声認識使い始めても、結局、手入力に戻ってしまう。
音声認識は使い込むと認識率は上がるんだろうけど、
使い込むまで行きません。
5000円ぐらいのソフト又はオフィス付属のを
実際に使って体験して見るのが一番です。
びっくりするぐらい認識するかと思うと
何回発声しても認識してくれない時や、
殆ど使えないぐらいの時も多々あり。 59入れたい文章と、音声認識で入力された文章を療法を乗せてくれる人はいないのかなア、ナ
皆さんどのくらいで使われているか知りたい。
音声認識の実際を知りたい。
60音声認識使い始めても、結局、手入力に戻ってしまう。
61音声認識は使い込むと認識率は上がるんだろうけど、使い込むまで行きません。
\5,000ぐらいのソフトまたはオフィス不足のを実際に使って体験してみるのが一番です。
びっくりするくらい認識するかと思うと何回発生しても認識してくれない時や、ほとんど使えないぐらいの時も只あり。 62の文章は音声入力で書き込みました。
こんな具合で音声入力を使ってます。 AmiVoice を使い始めています。かなり評判も良いのですが、
私の感想としてはドラゴンスピーチの方が認識率もよく使いやすい
ものでした。おそらく、どんな文体でどんなテーマで文章を書くかによって
AmiVoice の音声認識率は大分変わってくるのではないでしょうか。
ちなみに今書いている文章も AmiVoice を使っていますが、
この文章ではかなり認識率が高いので、満足いくべきものでした。 AmiVoice の特徴は、1音声トレーニングが必要ないこと、
2書き言葉、政治経済言葉、話し言葉、ブログ用と四つの
辞書体系にわかれていて、用途に応じて使い分けるように
なっていることです。おそらく多くの人が感じると思いま
すが、話し言葉だとかブログ用の言葉等は必要ないのでは
ないでしょうか。ただし、将来的に言えば、携帯電話を用
いたメールやブログに用いられることになるでしょうから
、重要なステップだったのでしょう。
以上は AmiVoice で書き言葉ユーザーを使ってみました。
音響学習としては現在レベル13。使っているパソコンは C
PU 2.4GB 、メモリー2GB 、 OS はウィンドウズ XP です
。
普通に修正できるところは修正して作り上げたのが上記の
文章です。かなり実用的であることがわかるでしょう。し
かし、私が自分のためのブログを書こうとするとき、どう
してもかなり煩わしい誤変換が出てきてしまいます。だか
ら、ドラゴンスピーチのほうが便利だな、思っております。 65 AmiVoiceの特徴は、一音性トレーニングが必要ないこと、二書き言葉、政治経済言葉、話し言葉、
ブログ用と四つの辞書体系に分かれていて、用途に応じて使いわけるようになっていることです。
おそらく多くの人が感じると思いますが話言葉だとかブログ用の言葉などは必要ないのではないでしょうか。
ただし、将来的に言えば、携帯電話を用いたメールやブログに用いられることになるでしょうから、
必要なステップだったのでしょう。
異常はAmiVoiceで書き言葉ユーザーを使ってみました。音響学習としては現在レベル十三。
使っているパソコンはCPUに手に4GB、メモリー2GB、OSはウインドウズXピーです。
常に修正できるところは修正して造り上げたのが上記の文章です。繋り実用的であることがわかるでしょう。
しかし、あたしが自分のための付録を書こうとするとき、どうしても可成煩わしい誤変換が出てきてしまいます。
だから、ドラゴンスピーチの方が便利だな、思っております。
上記の文章はオフィス2003で音声認識で書き込み、修正しておりません。
AmiVoice、ブログ用、辞書体系、誤変換などは音声認識で普段使わない言葉なので、
先に登録して音声認識させてみました。 67を見ますと、 Office 2003の音声認識というのも、
なかなかよくやっていますね。
実用性もかなり高いとみました。
ところでマイクは何を使ってるんでしょうか。
( AmiVoice 、及び附属の USB マイクによる、今回は無修正) 68の方へ。
50の「音声認識を使いこなそう」をそのまま実際に試し始めて4週間位で、
67位何とか入れ込めるようになって来ました。(ホントにやれるもんだね)
ヘッドセットは\580の超安物です。中国製品のインチキ臭い名のない会社の物です。
50にも書いてあったが、USB型のを使おうかと思ってはいるが、
USB型にすると認識が変わってしまい、落ちやしないか
心配なので当分これで行きます(実は買いに行くの面倒)。
スカイプで使っていた安物のヘッドセット\580で代用してます。
マイク感度は確か-58dbだったと思う。
以前ビアボイスV9を4年位前にほんのちょっと使っていた事がありましたが、
誤変換が多いので気が向いた時にする位でした。
Office2003も音声認識できる事を最近知り、試してみたら案外具合がいい。
間違った所だけ読み返すとほんとに上手く認識してくれる。
これはありがたい。同音異義語の場合はshift+→で反転させ、
変換キーを押せば事足りる。
何度発声しても誤認識の時は音声認識用の単語
を登録すると認識してくれる様です。
今回はキー手入力です。
>69
50のブログ(HPでしょうか)を作っておられる方ですね。貴重な報告、大変興味深く拝見させていただきました。
>ビアボイスV9
ViaVoiceについて言えば、ATOKと組み合わせていったほうがよいと思います。ボイスATOKというやつです。もし一太郎などを購入する機会があったら、使ってみてください。
>ヘッドセットは\580の超安物です
なるほど、そうなんですか。そんな安いものでもOKなんですか。それは朗報ですね。
>USB型にすると認識が変わってしまい、落ちやしないか
一般論でどうなのか分かりませんが、私の場合は、問題ありませんでした。
今、ドラゴンスピーチで音声認識による文章作成をしているわけですが、ユーザーとしては旧来
のマイクを使った時のものを使い、マイクはUSBマイクです。つまり、USBマイクで新たにユーザー設定してトレーニングするよりも、従来のものをそのまま使った方が認識率が良いのです。
なお、USBマイクを必ずしも使わなくてもよいのではないか、という気もしています。
ところでこの文章はドラゴンスピーチで書いているわけですが、おそらく、こういった文章の場合はAmiVoiceは向いていないのではないかと思います。
音声認識のヘッドセット・マイクについて疑問が一つある。
ソニーの IC レコーダで録音したものを認識することはできるのに、
どうせ手持ちマイクではだめなんだろうということだ。 50の「音声認識を使えなそう」をそのまま実際に試し始めて4週間ぐらい
で、67くらい何とかいれられるようになってきました。(ほんとにやれる
もんだね)絵でセットは[==>ヘッドセットは]580円の超安いものです。
中国製品のインチキ臭い等ない会社なものです。50にも書いてあった
が、 USB 型の使おうかと思っているが、 USB 形にすると認識が変わっ
てしまい、落合[落ちや]しないか心配なので当分これで行きます。
以上、Amivoiceで書いてみた。 中年だと思ってない中年じじー死ね 中年だと思ってない中年じじー死ね
中年だと思ってない中年じじー死ね 中年だと思ってない中年じじー死ね
中年だと思ってない中年じじー死ね 中年だと思ってない中年じじー死ね
中年だと思ってない中年じじー死ね 中年だと思ってない中年じじー死ね
その老いたすがた気持ち悪すぎ
その老いたすがた気持ち悪すぎ
その老いたすがた気持ち悪すぎ
その老いたすがた気持ち悪すぎ
死ぬとき このレスの事思い出してくれよ
ニヤニヤ(・∀・) ニヤニヤ(・∀・) ニヤニヤ(・∀・) ニヤニヤ(・∀・) >72了解です。
ありがとう御座います。
アミボイス、すごい。 >アミボイス、すごい。
そういうふうに受け取ってくれる人がいるということは、単なる1消費者
あるいは1ユーザーとしても嬉しいのです。しかし、ちょっと真剣になって
文章を書こうとすると、AmiVoiceではうまくできないのだ、という印象があるのです。
今度失敗例を上げたいと思います。
(これはドラゴンスピーチで書きました)。
くだけた文章例
今日の朝ご飯は、コーヒーと近くの100円ショップで買ったクロワッサン3日[三つ]だったよ。それから目玉焼きを二つ食べた。それで十分さ。
昼間は横断[うどん]。冷たい奴だよ。それに海苔をかけて、かぼちゃを炒めて。それだけ。
夕御飯はね、鮭とご飯、それから若干の数[おかず]。それから総研道[爽健美茶]は沢山飲んだ。
明日はね、定休日なんで、子供[を]連れて誰[映画]も見に行こうと思う。やっぱり宮崎の映画だら[だな]、何しろ、広島の福山の海がモデルに使われたっていうから、是非とも行かなくちゃ。
(以上、 AmiVoice 、ブログ用辞書)
夏休みは何か予定ありますか。うちは、三重県を旅行しようとも[思う]。行きは新幹線なら[???]。それからバスに乗ってに[←不要]田舎に行くよ。子供が大きくなったから、深夜バスも使えるようになって、必ずしも交通費が増えるというわけじゃないんだ。じゃまた。
(以上 AmiVoice のしゃべり言葉) (Amivoice 硬い文章の例)
ある英文学者をこんなこと[を]書いている。ある種ののテキストは、私たちがその文章を自伝ではないかというふうに
購読[←誤読]するようにいざなってしまう傾向がある。小説ですよっ等を
めぐって[←銘打って]あったとしても、投射[読者]の多くは、それを作者
の自伝[修正化]であると胴[←読解]する傾向がある、ということである。
言い換えれば、作者の人生という外部のテキストを参照しなくては理解で
きないのではないか、という気になるようなテキストがあるのだ。しかし
、この英文学者は、自伝的に同会[←読解]する誘惑にはできるだけ抵抗し
たいと考える。例えば、インド系移民の書いた文章だから、インド系移民
という少々[←少々]に還元してしまっては、せっかくのテキストを丹念に
読む意味がないのではないか、と主張しているのである。
ここではこんな深[修正]読みをしている。作家たちは、自分の書く[修正]文章が
伝記[修正]的に読まれるということを十分に意識しているんだから、実はそこに
は自伝[自伝]として読まれることに対する抵抗も内包しているのではないか。
>>76,77
アミボイスについてありがとう御座います。
ドラゴンスピーチはもう少し認識率が良いのでしょうか? 音声認識のスペシャリストによる、
アミボイスの実際を生で見ているような使用例が判って
嬉しいです。 AmiVoice の最大の魅力は、軽いこと、そして、単語入力が簡単にできてしまうこ
とだと思います。しかし逆に言えば、一つ一つ修正しながら単語認識させるよう
にするのが苦手ではないかとも思います。
ただ、しばらく使ってみると、結構使えるかもしれないな、という気になって
きました。そこで、前回試みた文章を、単語入力を踏まえて、もう一度音声認
識させみましょう。多少、細かいところは自分なりに変えてしまっているとこ
ろもありますが、その方が自然なので問題はないと思います。
ある英文学者がこんなことを書いている。ある種のテキストは、私たちがそ
の文章を自伝ではないかというふうに誤読するようになってしまう傾向があ
る。小説であると銘打ってあったとしても、読者の多くは、それを作者の自
伝であると読解してしまう傾向がある、というのである。言い換えれば、作
者の人生という外部のテキストを参照しなくては期待[←理解]できないので
はないか、という気になってしまうようなテキストがあるというわけである
。しかし、この英文学者は、自伝的に読解する誘惑にはできるだけ抵抗した
いと主張する。例えば、インド系移民の書いた文章だから、インド系移民と
いうことに物事を還元してしまうのでは、せっかくのテキストを丹念に読む
子も[←不要な語句]意味がないのではないのか、そんなことを言っているの
である。 ある英文学者がこんなことを書いている。ある種のテキストは、
私たちがその文章を事典ではないかというふうに孤独するように
なってしまう傾向がある。小説であると銘打ってあったとしても、
読者の多くは、それを作者の自伝であるとどっか胃してしまう
傾向がある、というのである。言い換えれば、作者の人生という
外部のテキストを参照しなくては理解できないのではないか、
という気になってしまうようなテキストがあるというわけである。
しかし、この英文学者は、自伝的に了解する誘惑にはできるだけ
傾向をしたいと主張する。たとえば、インド系移民の書いた
文章だから、インド系移民ということに物事を還元して
しまうのでは、せっかくのテキストを丹念に読む意味がない
のではないのか、そんなことを言っているのである。
以上の文章はオフィス2003で音声認識入力し修正してありません。
皆さん、こんにちは。僕の書いて文章に、反応し、くださってありがとう
ございます。今は、 AmiVoice の「しゃべり言葉辞書」を使って、しゃべる
にして書いています。ほとんど修正していません。
今回面白いなと思ったのは、私のように、ドラゴンスピーチだとか
ViaVoice 或いは VoiceATOK 等に慣れ親しんできた人間であっても、
新しいソフトを使うにあたっては、すぐにま使いこなせないんだな.
というが分かったことです。具体的にどういうところがコツなのか
わからんですが、とにかく、ある程度なれることが必要なんですね。
でも問題は、私のような1ユーザーが宣伝するんじゃなくて、メーカー
がやることじゃないきしょうかね。或いは、メーカーが僕に宣伝費を
少しよこすとか。(笑い)
81さん.
オフィス2003に備わっている音声認識というのは、かなりすごいんですね。
これだと、特にお金を使いたくないという人であっても、音声認識に
挑戦することはできますね。
余談ですが、音声認識で検索してみると、まだまだタイピングが下手な人
にも行っていると[向いている]とかくバカ者がいます。どう考えても、
ある程度タイキングができる人じゃないと、音声認識を無理じゃないしょうか。
むしろ大事なのは、しゃべるように文章を書くことができる人、
つまり、あまりつっかえたりせずに、ある程度すらすらと、口頭で
表現できる人というのが、大事なんでしょうね。
できたら、今度6歳の娘に音声認識を挑戦させてみたいと思います。
子供には、むつかしいかなという気持ちもしますが、 AmiVoice の場合
トレーニングは不要ということですから、ある程度反応するかもしれません。
将来的には、音声認識ソフトで子供の文章トレーニングだとか、
口頭発表トレーニングみたいなものが、可能になるのではないかと思います。
おそらく、英米では、すでに行われているのではないでしょうか。
少なくとも、発達障害の子供に有益だという新聞記事を読んだ事があります。
(英語の音声認識というのは、日本語に比べて大分精確のようです)。
以上は、アミボイスのしゃべり言葉辞書。一部修正しました。 ある英文学者がこんな事を書いている。ある種のテキストは、
私たちがその文書を事件ではないかというように孤独するように
なってしまう傾向がある。小説であると電話であったとしても、
読者の多くは、それを作者の自伝であると同開してしまう
傾向がある、というのである。言い換えれば作者の人生という
外部のテキストを参照しなくては理解できないのではないか、
という気になってしまうようなテキストがあるというわけである。
しかし、この英文学者は、自伝的にと解する誘惑には
できるだけに抵抗したいと主張する。
例えば、インド系移民の書いた文章だから、
インド系移民ということに物事を還元してしまうのでは、
せっかくのテキストを丹念に読む意味がないのではないのが、
そんなことを言っているのである。
80の文章をビスタの音声認識で入力しました。
無修正です。ビスタももっと使いこなしていけば
認識は良くなると思いますが、殆どビスタは使って
いないので、まぁこんなところです。 俺81ですが、実はタイピングは全然デキマセン。
片手で一つ一つ入れてます。
時間が掛かって、くたびれるので仕方なしに
Office2003の音声認識をしているのです。
Office2003中々いいよ! >85、皆さん、
やはり少し専門的な言葉、たとえば「誤読」とか「読解」、
こういうのがダメのようですね。だからそれさえマスターすればOKですかね。
>86 あ、タイピングできないんですか?
かえって、すごいじゃありませんか。
障害者なんかはタイピングをやらずに
音声認識でやりましょう、なんてテキストがそのうちできるかもね。 アミボイス、ドラスピ、ビアボイス、Office2003、ビスタも
それぞれのソフトの機能、特性を知り、
中の辞書を自分用に合わせないと
認識率は上がらないという事なんでしょうか。
アミボイス、ドラスピはだいたいどの方達にも
中の辞書を自分用に合わす事の
出来る優秀なソフトなんでしょうね。
「音声認識はしたいがお金を出してまでは……」
という方はOffice2003でもビスタでも
充分使いこなせるということかな。 予告ーーICレコーダーで音声認識(AmiVoice編) 友人が使ってないからと目のあまり見えなくなった私に
ViaVoiceを安く譲ってくれたので早速インストール
してみました。
まず言いたいことはエンロールが辛かった。
おそらく普通の人でもエンロールは時間がかかると思うが
表示されている文章がよく見えない私はこのエンロールに
途中休憩を入れて、およそ5時間ほどかかった。
本来こういうソフトは視覚障害者にやさしいと思っていた私が
甘かったのか。
とりあえず練習がてらViaVoiceでの入力結果をテストを兼ねて書き込んでみます。
エンロールが終わった直後なので果たしてどんな結果になることやら。
<以下結果>
友人が買ってないからと目のあまり見えなくなった私に
ViaVoiceを安く譲ってもらったので尊くインストール
してみました。
まず言いたいことはつらかった。
おそらくふつうの人でも返納部は時間がかかると思うが
表示されている文章がよく見えない私はこの返納に
途中休憩を入れておよそ5時間ほどかかった。
本来こういうソフトは視覚障害者にやさしいと思っていた私が
甘かったのか。
とりあえず練習がてらViaVoiceでの入浴結果をテストを兼ねて書き込んでみます。
遍路あるが終わった直後ので果たしてどんな結果になることやら。
<ここまで>
誤認識はともかく、頭の中で思った文章言えてないw
ドラゴンスピーチとかで、認識率向上のためのトレーニングを
さんざん読み間違えたり、変な風に読んだりしたら、
認識率って標準状態よりひどくなるのかな?
そんなことないと思うけど。
もう一回読み返して見たら……。 >まず言いたいことはエンロールが辛かった。
おそらくマイクの設定になにか問題があったのだと思います。
誰かわかる人がいて、となりに居てアドバイスしてくれるのならば、
20分以内に終わってしまうのではないでしょうか。福祉分野で、音声認識
の重要性が理解されることを希望します。
PCの処理性能は飛躍的に向上したし、最近のメーカー製ノートPCなんかには大抵自分撮りできるWEBカメラが内蔵されてる。
WEBカメラで撮影した話者の口唇の動きの分析結果も利用する、より精度の高い音声認識ソフトとか発売されんかな。 ちょっと前、音声認識の具体例をここに書いたものです。普通の人からみたら、かな
り音声認識を使いこなしているんだな、という感じだったでしょう。ところが、この
私でも、音声認識に手こずる場合があるのです。例えば、今はドラゴンスピーチプロ
フェッショナル7とamivoiceのUSBマイクを使って書いていますが、なぜかマイクか
らの音声入力の音質が悪いのだそうです。認識率もかなりを落ちています。音質が悪
くなる問題への対策はなかなか難しいのです。いちおう、やや大きな声を出してなん
とか実用化していますが、慣れていない人だったらもっと大変だったでしょう。
つまり、音声認識のテクニックとして最も重要なのは、@口とマイクの位置をどのよ
うに設定してのか、Aどのぐらいの声の大きさが良いのか、BPCとマイクなどのハー
ドにはどのようなものを選択するのか、なのですが、一筋縄ではいかない問題だとい
うことが分かるでしょう。
余談ですが、網ボイスを使うようになってドラゴンスピーチが嫉妬としているの
でないか、という疑いも捨て切れません。 DTM板住人ですが、DTM環境が整っているせいで、マイクからの音声は
USBオーディオインターフェイスに入り、インターフェイス内でコンプレッサー
等のエフェクト処理がされPCに入力される、という環境でドラスピ使ってます。
この環境だとマイクに向かって少々怒鳴ろうと、逆に囁こうと、音質は
ドラスピに最高水準で常に評価されますね。音量の問題をコンプレッサーが
吸収してしまうせいだと思いますが・・・。
ただ、常に音質最高でも、私の場合、しゃべり方のせいで、誤認識多い
気がしますがw
ああ、ちなみにこの環境ではドラスピがデバイスをコントロールしようと
する時、コントロールできないというようなエラーメッセージを出します。
通常のサウンドカードとかと機構上の違いがあるからだとおもいますが
ドラスピ等のソフト側からボリューム等をコントロールしないで、その
ハード専用のコントロールツールを使うか、ハードウェアで直接
コントロールすれば問題ありません。
>>95
喉の調子はいつもと同じでしょうか?
喉の感じがどことなくいつもと違うと認識率は
ガクンと落ちる事がありました。 >喉の調子はいつもと同じでしょうか?
そんなに変わらないと思います。
>96 僕はハードのことはよくわかりません。とりあえず、いみのあることかどうか
わかりませんが、アミボイスでマイクの入力をあげておき、それからドラゴンをやって
みます。(ドラゴンではUSBマイクの調節ができないんじゃないのか? USBだから
サウンドカードも関係ないし)。 >>98 そんなに変わらないと思います。
そうですか、僕は季節の変わり目に(風邪を引いていないが……)、
自分では殆ど同じと思っていましたが、喉の声がどことなく、
鼻に抜けるような時はガクンと認識率が落ちることがありました。 AmiVoiceを購入したのですが、あまり認識率が高くありません。
ビジネステンプレートのような文章だと相当に認識率が高いのですが、
ちょっと変わった表現や言い回しが入ると勝手に文脈判断をして、
意味のつながらない変換をしてしまいます。
話し言葉辞書、書き言葉辞書どちらを使用しても童謡の結果です。
使っているうちに認識率が上がるのかなと思ってはいるのですが、
AmiVoiceの「音響学習」がどういう機能なのかよくわかりません。
誤認識されたものを削除して再入力、また駄目だったので削除して
再入力……を繰り返していると、「音響学習の準備が整いました」という
表示が出ます。誤認識に構わずどんどん話し続けていても同様です。
これは、正しい入力をしたときにのみ随時学習させなければ意味がないのでしょうか?
それとも、誤認識まじりの場合でも大丈夫なんでしょうか?
あるいは、誤認識したとしても削除して再度入力していればオッケー?
説明書を見ても掲載されておらず、どうしたものかと思っています。
どなたかおわかりになる方はいらっしゃいませんか?
>>89
ICレコーダーで音声認識を早くやってほしい〜〜〜
私は100ではありません。
100の人にアドバイスですが、随時学習というよりは、単語入力がポイント
だと思います。学習不要の言葉の場合は割り切って手入力がいいでしょう。
シフトを押すだけのワンタッチでON/OFFできますから、手間はかからない
でしょう。 ICレコーダーで音声認識ということについて、リクエストがありましたので
ちょっとやっています。これは、まず最初にドラゴンスピーチで試してみます
。その次には、amidoしてやってみようと思います。
私の使っているICレコーダーは、ソニーのものです。使い方としては、ドラゴ
ンスピーチの場合は、ソニーの製品は使えることになっておりますので、問題は
ありません。もちろんのこと、使えるものとつかないものがありますので、注意
してください。amivoiceはといいますと、特にどのICレコーダーが良いの
か指定はありません。私の使っているICD−エスエックス56 [ICD-SX56]の場
合ですと、そのまま音声を保存するという選択をしますと、それが利用できるよ
うです。少々わかりにくいですが、メーカーなどに問い合わせながら、選択され
ることを薦めます。
少し、日記を書いてみましょう。8月も後半になり、日本もだいぶ涼しくなった
ようです。しばらく前はでは、私の住む神奈川県も暑かったのですが、8月23
日土曜日あたりから、涼しくなりました。そして今日日曜日は、小雨さらには大
雨になりました。
(以上、ドラゴンによる。一部修正した)。
[最初は意味不明の文章なので削除しました]。AmiVoice てやってみようと思いま
す。だっている開始レコーダは、ソニーのものです。使い方としては、ドラゴン
スピーチの場合は、ソニーの製品を扱えることになっておりますので、問題はあ
りません。もちろんのこと、使えるものと使えないものがありますので、注意し
てください。 AmiVoice は問いますと、とくにとの IC レコーダが良いのか指定
はありません。私の使っている IC 着ラシュディへ[←「ラシュディ」という人名
が登録されてあるため、「リコーダー」が認識できなかったようです]へ56NOVA
行けと[←意味不明ですが、この場合はICレコーダーの製品名ですからやむを得
ないと思います]、そのまま音声を保存するという選択をしますと、それが利用で
きるようです。少々判りにくいですが、メーカーなどに問い合わせしながら、選
択されることを勧めます。[左記の説明では不十分です。参考にしないでください
ね]
新しい連絡[←ドラゴンスピーチの「新しい段落」はアミボイスでは認識しえな
いから、こういうふうになりました]すこし、日記を書いてみましょう。8月も
後半になり、日本も大分涼しくなったようです。しばらく前は元は、私の住む
神奈川県も暑かったのですが、8月23日土曜日あたりから、涼しくなりました。
そして今日
日曜日は、小雨さらには大雨になりました。
以上 アミボイス >>103
うーん、そうですか……
実は私の場合、パソコンの前に座って音声入力という使い方を基本的に
想定せず、ICレコーダーに録音したメモや草稿を書き起こすために
AmiVoiceを買ったんですよ。(話者は私一人)
使用しているICレコーダはオリンパスのもの。WMA形式なので、そのまま
AmiVoiceで読み込めます。ところがこれの認識率が低くて。
それで、マイクを使って学習させてから……と思ったわけです。 >マイクを使って学習させてから
単語の登録が基本だと思いますよ。 ViaVoiceで、温水ミルクで文字を入れています。
まあこの後もっとように、文字がいいしてくれません。
意味不明ですね。意味不明をうまく認識しいます。
を音声入力で文字を入れています。いやもういつです。
言い直します。ViaVoiceです。本音声で文字を入力しいいます。
入力しいます。入力しています。ウエット。
かなりな方です。かなりの、阿呆です。ああ訪米する。
これに覚えさせるのは、いったいどんな芸、時間が
ガードル無償か通称Mac。飯野します。言い直します。
一体、ペットを取るなんて。いいがをします。
いいがをします。言い直します。一体、これを受け。
いいがをします。石井がをします。飯野します。言い直します。
一体、これはどれだけ、時間がかかるのでしょうかくしをマーク
。時間がかかるのでしょうか?ペット ViaVoiceで音声入力をしている。
きょう2日目である。
文章を読み上げて文字の認識力を高める作業を3つこなした。
あとひとつまだ会ってはいないが。
あとひとつ、またやっては偉大なやってはいないが、
明日やってみようと思う。
かなり、まともな認識になってきていて、
格段の進歩である。
これは結構使いものになりそうである。
なお、この文章はViaVoiceで
すべてやっております。 >>109
ビアボイスのバージョンはいくつでしょうか?
V10.5? 10? 9? >>110
10.5です。エンロール、全て完了しました(^^;)
つかれた。けど、かなり識字率向上しました。以下
音声入力です(^^;)
ViaVoiceで音声入力をしています。
かなりの識字率アップで、これも使いものになりそうです。
話してテキストを魅力するのと、。話してテキストを入力するのと、
キーボードから入力するのとでは、花園が楽かと思ってたのですが。
話す方が楽かと思っていたのですが、このように結構間違いも多いので、
白直す手間を考えると、キーボードから直接入れた方が、
慣れ切っている人間にはいいかもしれないとか思いましたが、
重たい色の識字率がいいので。思ったよりも、識字率がよいので、
しばらく使い込んでみようと思います。
確かに搬送早いかも。確かに話す方が早いかも。
上手に組み合わせて使うのが、とても良いかも知れませんね。 ビアボイスで音声入力をしています。
可成の認識率アップでこれも使いものになりそうです。
放してテキストを入力するのと、
キーボードから入力するのとでは話す方が楽かと思っていたのですが、
このように血行間違いも多いので、
直す手間を考えると、キーボードから直接入れた方が、
慣れきっている人間にはいいかもしれないと思いましたが、
思ったよりも認識率がよいので、しばらく使い込んでみようと思います。
確かに話す方が早いかも。
上手に組み合わせて使うのがとてもよいかも知れませんね。
以上、オフィス2003の音声認識です。 多くの音声認識ソフトって、
事前に登録されていない声(講義中における教授の声など)を認識することはできるのでしょうか? ViaVoiceで音声入力をしています。
かなりの認識率アップでこれも使いものになりそうです。
話してテキストを入力するのと、
キーボードから入力するのとでは話す方が楽かと思っていたのですが、
このようにけっこう間違いも多いので、
直す手間を考えると、キーボードから直接入れた方が、
ガレキっている人間にはいいかもしれないと思いましたが、
思ったよりも認識率がよいので、しばらく使い込んでみようと思います。
確かに話す方が速いかも。
上手に組み合わせて使うのはとてもよいかもしれませんね。
以上DragonSpeech7です。
決定的なミスは、[ガレキ」でしょうか。
「慣れきっている」が正解でした。 ViaVoice で音声入力をしてます。
かなりの認識率アップで、これも使い物になりそうです。
話してテキストを入力するのと、
キーボードから入力するのとでは、
話すほうが楽かと思っていたのですが、
このように結構間違えも多いので、
直すでも考えると、キーボードから直接れた方が、
瓦れきてる人間にはいいかもしれないかと思いましたが、
思ったより認識率が良いので、しばらく使い込んでみようと思います。
確かに結構早いかも。上手に組み合わせて使うのが、とても良いかもしれませんね。
以上を AmiVoice でやってみました。 Office2003、DragonSpeech7、AmiVoiceと、こうやって比較できるのは
嬉しいですね。どれも余り違いは無いようで、素晴らしいと思う。
各自の音声認識の普段の辞書特性が出ているように思われます。
結局、自分に合う音声認識辞書にいかにして行くか、
というのに尽きるように思います。 ViaVoiceで音声入力をしています。かなりように比率はで、これも使いものになりそうです。
話してテキストを入力するのと、作業キーボードから入力するのとでは、
話す方が楽かと思っていたのですが、
このようにけっこう間違いも多いので、
直す手間を考えると、キーボードから直接データ方が、
られている人間にはいいかもしれないかと思いましたが、作業[←改行コマンドでした] 思ったより認識率が良いので、しばらく使い込んでみようと思います。
たしかにけっこう早いかも。上手に組み合わせて使うのが、とても良いかもしれませんね。
以上をドラゴンスピーチとソニーのICレコーダーでやってみました。
「改行」がが多かったのでその辺が心配でしたが、なんとかなっているようですね。 AmiVoice 利用の際に大変不愉快なのは、修正のやりづらさである。このソ
フトは、誤変換しそうな箇所をよく分かっていて AmiVoice エディタ上で
はそれは異なる色で表されている。それは良いのだが、正しく変換された
場所であっても、ご変換しているかもしれないとソフトが判断した場所に
カーソルを持っていくと、勝手に次から次へと変換候補がポップアップし
てくるのである。そうすると、正しく変換された語句なのに、誤った変換
に戻されてしまうかもしれないのだ。
この点では、ドラゴンスピーチの方がはるかによかった。
ICレコーダーで録音した法学部の講演会をテープに起こしたいのですが、
このような専門用語を多用した音声に強いソフトはどれでしょうか。
耳でテープを聞きながら自分で読んで手打ちの速度より早く入力できるソフトを探しています。
Officeをアップデートするだけで十分なのならそちらにしますが、
過去ログにはDragonspeechには専門用語のあるファイルを学習させられるとあったので
気になっています。 Office2003は専門用語も非常に良く認識します。
IMEの変換トレーニングウィザードを使ってみたら如何でしょうか。
ただ、音声認識ツールの「単語の追加と削除」で発声の録音を
結構、マメに登録しないといけないでしょう。 ロースクールの学生で、
音声認識ソフトの購入を考えています。
ここの過去ログを読む限り、
ami2008はどのような文章を書くかにより
使い勝手が変わってくるようですが、
法律文書についてはどうでしょうか?
欠缺(ケンケツ)、蓋然性(ガイゼンセイ)など、
非常に専門的な言葉が多い分野です。
どなたか使用されている方がいらっしゃたら、
ご意見をお聞かせください。 >>121
結局、自分で色々苦労してみないと
音声認識は使いこなせないと思う。
人の意見は当てにならないよーっ!。 .>121
古いドラスピですが
いちいち登録していけば大丈夫。
医学用語なんてのもいちいち登録したよ。
当時、ドラゴンスピーチの医学用語辞書は恐ろしく高価だったし。
ユーザーデータを法律用、標準と使い分けたら使いやすくなると思うけど、
ある程度ならPC内のドキュメントファイルを学習してくれるので、それほど面倒なく
変換できるかもよ。
ami2008には、法律用語の辞書はないのかな?
office2003の音声認識ってofficeソフトでしか使用できないんですが、仕様でしょうか?
IMEパッドに「音声入力」がでてきません。 >>121さんへ
どんな文章か、一度200文字前後の文章を載せ頂けないでしょうか?
難しい漢字(かんじ)には振り仮名を付けてお願いします。
一度、Office2003の音声認識で入力した文章を載せてみようと思います。
挑戦してみます。 >>122>>123
ありがとうございます。
結局、自分の手でカスタマイズするしかないってことですね。
>>126
おお・・・親切な方がいらっしゃるものですね。
では遠慮なく。
「Xの口座に間違って振り込みがあった。
Xはこれに気がつき、事実を秘して受付職員をだまし、
銀行からこの金額分を引きだした。
誤振込(ごふりこみ)された金員(きんいん)の所有権が
Xにあるとすると
占有離脱物横領罪(せんゆうりだつぶつおうりょうざい)が成立するが、
銀行にあるとすると詐欺罪(さぎざい)が成立することになる。
では、所有権はどちらにあると解するべきか。
この点、民法判例(みんぽうはんれい)で、誤振込があった場合
名義人に有効な預金債権(よきんさいけん)が成立するとしたものがあるが、
これはあくまで民法の次元の話に過ぎない。
刑法の次元では、誤振込された金銭の占有は
銀行にあるものと解するべきである。
したがって、Xには詐欺罪が成立する。」
こんな感じでどうでしょうか。 >>125
ありがとうございます。
IMEパッドには出てきませんが、問題なく入力できるようになりました。 「×の口座に間違って振り込みがあった。
×はこれに気がつき、事実を比して受付職員をだまし、
銀行からこの金額分を引き出した。
ご振り込みされた金印の所有権が
×にあるとすると
占有離脱物横領罪が成立するが、
銀行にあるとすると詐欺罪が成立することになる。
では、所有権はどちらにあると介するべきか。
この、民法判例でご振り込みがあった場合
名義人に有効な預金債権が成立したものがあるが、
これはあくまで民法の次元の話に過ぎない。
刑法の次元ではこう振り込みされた金銭の占有は
銀行にあるものと介するべきである。
したがって、×には詐欺罪が成立する。」
ドラスピ
ユーザー設定 一般(ろくなことを喋ってない。殆どダイビングの話)
訂正なしでの結果。
比して→秘して
金印→金員
介する→解する
ご振り込み→誤振り込み
このような、文章ばかりだと、間違いを訂正していけば恐らくいける。仮にマイドキュメントとかに法律用語を沢山使った
文章があると、一発かもしれない。
「Xのコウダに間違って振り込みがあった。
Xはこれに気がつき事実を期して受け付け市職員をだまし、
銀行からこの金額分を引きだした。
五振り込みされた金委員の所有権がセックスにあるとすると
占有離脱物横領罪が成立するが、銀行にあるとすると詐欺罪が成立することになる。
では、所有権はどちらにあると解すべきか。
この点、民放判例で五振り込みがあった場合左D二人に有効な預金再建が成立するとしたものがあるが、
これはあくまで民放の次元の話にすぎない。
刑法の次元では、五振り込みされた金銭の戦友は銀行にあるものと解するべきである。
従って、Xには詐欺罪が成立する。」
以上Office2003の音声認識 続く下へ 口座、秘して、受付、誤振込、金員、民法、
名義人、預金債権、占有
以上は僕が普段、使わないので、音声登録してみた。
そして、音声認識してみました。以下がそうです。
Xの口座に間違って振り込みがあった。
Xはこれに気がつき事実を秘して受付職員をだまし、銀行からこの金額分を引き出した。
五振り込みされた金員の所有権がXにあるとすると
占有物離脱横領罪が成立するが、銀行にあるとすると詐欺罪が成立することになる。
では所有権はどちらにあると解するべきか。
この点、民法判例で、鍛誤振込があった場合名義人に有効な預金再建が成立するとしたものがあるが、
これはあくまで民放の次元の話にすぎない。
刑法の次元では誤振込された金銭の占有は近郊にあるものと解するべきである
したがってXには詐欺罪が成立する。
以上Office2003の音声認識でしたが
思った程良くなかった。すいません。
ドラスピの方がすごいかな。ン 「Xの口座に間違って振り込みがあった。
Xはこれに気がつき、事実を秘して受付職員をだまし、
銀行からこの金額分を引き出した。
誤振込された金員の所有権がXにあるとすると
占有離脱物横領罪が成立するが、
銀行にあるとすると詐欺罪が成立することになる。
では、所有権はどちらにあると解するべきか。
この点、民法判例で誤振込があった場合
名義人に有効な預金債権が成立するとしたものがあるが、
これはあくまで民法の次元の話にすぎない。
刑法の次元では、誤振込された金銭の占有は
銀行にあるものと解するべきである。
したがって、Xには詐欺罪が成立する。」
以上、Office2003の音声認識
すぎない→過ぎない
なんとかここ迄認識するようになりました。 音声認識ソフトって面白いな。
Office2003もってるけどそんな機能があったとは!
うん、音声認識ソフト、使いこなせると楽チンですよ。
手打ちがアホらしくなります。 Vistaで音声認識してみた(全然使ってなかった)。
トレーニング一つのみ、音声登録単語なしで、
これだけ認識するので、使い込めば殆ど認識するでしょう。
「Xの口座に間違って振り込みがあった。
Xはこれに気がつき、事実を必死で受け付け職員をだまし、
銀行からこの金額分を引き出した。
5振り込みされた金員の所有権がXにあるとすると
占有離脱物横領罪が成立するが、
銀行にあるとすると詐欺罪が成立することになる。
では、所有権はどちらにあると解するべきか。
この点、民放判例で、5振り込みがあった場合
02人に有効な預金債権が成立するとしたものがあるが、
これはあくまで民放の次元の話しに過ぎない。
刑法の次元では、5振り込みされた金銭の戦友は
銀行にあるものと解するべきである。
したがって、Xには詐欺罪が成立する。 全然使ってなかったんでしょ。凄い!
Vistaに音声認識があるのかもしらなかった。
これなら敢えてドラスピ等のソフトを別途インストールしなくてもいいんでないか?
Vistaは再インストール後(全然使ってなかった)、
初めて音声認識のトレーニングを一つだけして、
しかも、音声認識専用の登録単語もしないで
これだけ認識しました。思ったより良かった。 鍛えたら凄いだろうなぁ。
ユーザーデータは分割できるの?
例えば、仕事用とか日常用とか? 例えば、仕事用とか日常用とか?→
多分、それは出来ないと思う。
使っていないので分かりません。
デュアルブートにして、音声認識専用のパーティションを
作って、テキストデータだけ入れている人もいるみたいです。 IME→プロパティー→ユーザー辞書で、
新しく辞書を作れば多分出来ると思います。
やったこと無いので分からないが……。 それてができたら敢えて音声認識ソフトを購入する必要はないと思えます。
私は主にノートで使用してますが、XPでoffice2003、ドラスピです。
タイピングではATOKを使用しているため、XPに音声認識があるかどうか
わかりません。office2003にはあるらしい(知らなかった)し、ひょっとして
音声認識ソフトだらけ?
ドラスピは使い込めばかなり精度の高い文章が作れますが、適当に音響モデルの最適化を行い、,draファイルを
捨ててやらないとハードディスクを圧迫します。
基本的に頭が良くないと文章になってないことが多いです。脳のリハビリになりますね。
タモリが赤塚不二夫の追悼で読んだ紙は白紙だったそうですが、凄いと思います。
Cドライブ→Documents and Settings→渡辺**(ユーザー名)→
Application Data→Microsoft→IMJP9_0→imjp9u(.txt)の他に
imjp9u(.txt)をコピーしてimjp9u(音声認識用)とか
imjp9u(医学用)とかimjp9u(法律用)とか
作れば、用途に応じて使いこなせるはずです。 >>139
ビスタのIMEのツール→辞書ツール→ファイル→開く
imjp10uが出てくるので右クリック→コピー→
デスクトップに貼り付け→imjp10uを右クリック→名前の変更→imjp10u(仕事)と変更
→imjp10u(仕事)をimjp10uと同じホルダーに入れる(トラッグ&ドロップ)。
これで日常用imjp10uと仕事用imjp10u(仕事)
に分ける事出来ると思う。 >>139
ビスタで、音声認識の詳細オプションでプロファイルの認識で
新規に仕事用というのを作れば出来るんじゃないかな。 AmiVoice Es 2008を使っているんだけど、無限に学習できるわけじゃないんだね。
「音響学習レベルの最大値は126Esです。
126Esに達した後でも、学習内容は新しい音声データで更新され続けますが、
音響学習レベルの表示は126のままとなります。」
だって。
更新されるということは一応学習はしてくれるんだろうと思うけど、よく分からない。
今のレベルではかなり満足しているからいいんだけどね。 英語の音声を文書化したいのですが、
良いフリーソフトがありますか? ドラスピの「音声ノイズ比」はどのくらいになればいいの?
あり合わせのマイクで22-23の値が出てるけど、
改善努力すべきですか? それくらいあれば上等!!
私は、USBマイクロフォンセットですがそんなに出ません。(USBの接続端子によって変動する)
22-23を目指してるくらいだよ。
おお、そうですか。安心しました。
確かに認識精度には問題ないようです。ただ、気になったもので。