Windows VISTAの「音声機能」を使ってみる

投稿: 2008 01 24 コメント (3) | トラックバック (0)   このエントリーを含む「はてなブックマーク」 この記事を「livedoorクリップ」! 「Yahoo!ブックマーク」に登録

20080124_06音声読み上げソフトでVISTA対応のものを探していたら、実は「Windows VISTA」に音声機能が標準搭載されていることを知った。

そういや自分、VISTAって文句言ってばかりで、新機能ほとんど知らないかも。



●Windows Vistaを全操作できる音声認識機能のデモムービー(GIGAZINE)

↑GIGAZINEにこんな記事発見。

ボエッチャー氏が「Dear Mom(親愛なるお母さん、句読点)」と読み上げるとコンピューター上には「Dear Aunt(親愛なる叔父さん)」と表示される始末。次に、誤って認識されてしまった箇所を修正しようと「fix aunt, fix aunt(『叔父さん』の部分を修正、『叔父さん』の部分を修正)」と入力しようとするが、まったく認識はせず。いろいろと回復を試みようとした挙句に表示された文章がこれだ。

「Dear aunt, lets set so double the killer delete select all(親愛なる叔父さん、殺し屋に2倍払って全てを始末しちゃってください)」

な~んと!
リンク先のこの動画は必見!日本のこの話もなかなか。

めちゃめちゃ楽しそうな機能じゃないですか!!!
(ネタとしてわざとやってる気もするけど・・・)

さっそく使ってみることにした。

写真

まずは「コントロールパネル」を開き、「コンピュータの簡単操作」をクリック。

写真

お、あった!
音声認識オプション!

20080124_03

ここでヘッドセットの登場。
マイクとヘッドフォンの入力端子に接続。

●ヘッドセットは、エレコムのアウトレットショップ「エレコムわけありショップ」がお得

「音声認識オプション」(確か)をクリックすると・・・

20080124_04

初回は、こんな「音声認識チュートリアル」が立ち上がる。
(二度目以降はそうならなかった)

で、この初回の音声認識チュートリアル、かな~り時間がかかるんだけど、頑張って最後までやると、音声機能の使い方をばっちりマスターできる。
・・・と思ったら、終わった途端にほとんど忘れてしまった。いやー、年はとりたくないわ。

さっそく使ってみよう。

二度目からは「音声認識の開始」をクリック(自動的に起動する設定にしていない限り)

20080124_05

で、これも動画のほうがわかりやすいので、撮影してみた。
なぜか今日突然、Adobe Premiere Proが起動しなくなったので(昨日の動画騒動の余波か?)、急遽、カノープスの「エディウスJ」体験版をダウンロードして使ってみた(MacBookは別用途で忙しいので・・・)。

AIBOが登場するが、別に「VAIOとAIBOの連携」とか、そういう話ではない。
パソコンの前に誰もいないと、なんか落ち着かなかったので。

20080124_06

「スタート」

こういうと、スタートメニューが立ち上がる。

その後は「すべてのプログラム」などと言えばいいのだが、よく発音がわからないソフトも多い。
そういう時には、

「番号を表示」

これがすごく便利で、表示されている選択可能な項目すべての上に青い網がかかって、連番が表示される。選択・クリックしたい項目上の番号を読み上げればそれでいい。

20080124_07

それを、ブラウザ上でやってみよう。
これは、Yahoo!のトップページ。
まだデザイン全面リニューアルから一ヶ月もたっていないのに、結構慣れてしまった。

クリックできる項目がたくさんあるので、
マウスを音声指示だけで動かしてゆくのは大変。

そこで一発。

「番号を表示」

するとこうなる。

20080124_08

↑拡大してもらうとわかるのだが、青く網がけした上には数字が書き込まれている。
下の項目も、うっすら見える。

ここでクリックしたい項目のところの数字を読み上げる。

「113」

20080124_09

読み上げた数字部分が緑色に変わったのを確認したら、

「OK」

20080124_10

すると、そこがクリックされた状態になり、該当ページにジャンプする。

20080124_11

ただし、言葉がもごもごしていたり、あるいは本来そこで指示するべき内容ではないことを言うと

「何ですか?」

と、逆に問い返される(音声ではなく、このバーにメッセージが表示される)

自分の命令が悪いとは言え、繰り返し「何ですか?」と問い返されると、なんかいらつく。

20080124_12

次はデクテーション。
これ、なかなかすごい。

単に発音された音を一音ずつ書き留めてゆくだけということではない。
以前も、「ドラゴンスピーチ」という、音声入力ソフトを使っていたことがあるが、結構いい値段したそのソフトと同等もしくはそれ以上に精度がいいかも。

上の3行は「あいうえお かきくけこ・・・」と、ただ五十音を読み上げただけ。
このソフトは、それも恐らく何らかの意味ある文章なのだろうと、一生懸命頭脳を働かせて変換しようとする。

まだチューニングもしていないのに(チューニングを繰り返すとだんだん精度はあがってゆく)、なんか頑張っている。

その下は一般文章なので、しっかり書きとめてくれる。
ただ「割と」といったのが「無理と」になってしまった。そんな時は・・・

「無理」を選択

20080124_13

選択された。

「わり」と言うと、候補一覧が表示される。

20080124_14

「7」

数字を読み上げる。
そうすると、先ほどの選択されていた「無理」が「割」に置き換わる。

20080124_15

ファイル操作ももちろん音声で。

「ファイル」

「名前をつけて保存」

20080124_16

面白かったのがこれ。

「マウスグリッド」

というと、こんなグリッドが表示される。
自分がマウスを動かしたい場所を含むセルの数字を読み上げる。

「5」

20080124_17

すると今度は、その「5」のセル内が9分割される。
そうして、数字を読み上げて範囲を絞り込んでいくと、最後指定した数字のセルの場所にマウスカーソルが移動するというものだ。

たぶん、写真とテキストの説明を読むより、動画見ちゃったほうが一発だと思うので、よかったらこちらをどうぞ。


+++


なかなか面白かった。
デクテーション機能は、なんとなくゆっくりしゃべってしまったが、もっとスピードだしても大丈夫。さらにチューニング作業を重ねればだんだん精度もあがってゆくようだ。

≪追記≫ためしに割と早めのスピードで読み上げた動画サンプルを公開/チューニング作業はほとんどやってない状態(今日使い始めたばかりなので)


+++


自分も以前、同じような音声入力ソフト「ドラゴンスピーチ」を使っていた。

どういう時に使ったのかというと、テープ起こし。
割とタイピングが早いほうなので、ICレコーダーに録音した内容を、1.2倍とか1.3倍とかのスピードで再生すれば、そのままタイピングできるのだが、そのスピードも、さすがに1時間とかやると、指が疲弊する。

そこで音声入力ソフトの登場。

ヘッドフォンで録音した内容を聞きながら、自分がそれを話す。
そうすると、パソコン上でどんどん文字になってゆく。

正確ではないが、どうせ後で必要な箇所をピックアップして使ったりするのだから、ミススペルが入っていても特に問題はない。

本当は、録音したものから直接文字化できればいいのだが、ある程度明瞭に話さないと無理なので、こうした方法をとっていた。


まあ、普通にキーボードとマウス使ったほうがはるかに早いんだけど、
いざという時に使えるよう、VISTAユーザの人はちょっと覗いておいてもいいと思う。




●ヘッドセットは、エレコムのアウトレットショップ「エレコムわけありショップ」がお得


アームレスヘッドセットマイクロフォン:MS-AL94MWH[エレコムわけありショップ]
税込 252円(3,150円以上で送料無料)


USB PCカメラ:UCAM-E1C30TSV[エレコムわけありショップ]
税込 987円(3,150円以上で送料無料)←WEBカメラとのセット価格


マルチメディアヘッドセット:MS-NB56S[エレコムわけありショップ]
税込483円(3,150円以上で送料無料)


マイク付音楽携帯電話用ステレオヘッドホン:EHP-810MPWH[エレコムわけありショップ]
税込483円(3,150円以上で送料無料)



投稿: 2008/01/24 18:48:06 コメント (3) | トラックバック (0)  このエントリーを含む「はてなブックマーク」 この記事を「livedoorクリップ」! 「Yahoo!ブックマーク」に登録
次の記事 次の記事:Windows VISTAの「音声機能」を使ってみる(続)
前の記事 前の記事:音声読み上げソフトを導入してみる
トップページ トップページへ戻る
コメント

ドラゴンスピーチ、私も昔、夢を見て使ったことが
あります。音声機能、私も実は別の切り口から
発見して、いま使い始めているところです。

職場だと音を出す必要があるのでちょっと利用が
難しいんですが、これ、おっしゃるとおり、
ディクテーションを進めて行って、いつか
ICレコーダーの声を全部文章化できるように
したいですね。(無理なんでしょうけど。)

投稿者: daizo (2008/01/24 21:46:12)

うわあ、ドラゴンスピーチ使ったこと、あるんですか。
実は昨年の暮れ、買おうか迷いながら、「VISTAで使えるICレコーダに買い替えるほうが先か」と思ってやめたところ。

この記事を読んで、途中まで「インタビューテープのテープ起こしに使えるかなあ。音声が不明瞭だったりするから無理かなあ」と悩んでいたのですが、聞きながら、自分で声に出して音声入力という手を使えばいいんですね。

すごくためになりました。
ありがとうございますっ!

投稿者: 森田慶子 (2008/01/24 21:47:51)

daizoさん、
おお、daizoさんもですか!
それはなんか嬉しいなあ。
ドラゴンスピーチ、使っていると少しずつ賢いドラゴンになってゆくような期待感がもてて、楽しいんですよね。
実際にはなかなか大変なんですが。
VISTAのこの機能も、自分仕様にチューニングはかりたいです。

森田慶子さん、
確か新しいパソコンってVISTAじゃなかったでしたっけ?だったらドラゴンスピーチ不要です。このVISTAの音声機能がいい気がします。で、自分の経験だと、まだインタビューした音をそのまま音声認識にかけてテキスト化・・・というのは、難しいかもしれません。
音声認識が認識してくれる話し方というのが、ある程度あると思います。話す人によって特徴というか癖もあるので、チューニングがけっこう大切になってきます。

投稿者: わだ (2008/01/24 22:01:35)


コメントを書く






メールアドレスだけを入力しても、ページ上に公開されることはありません。なおURLを入力した場合には、そのURLへのリンクが張られます。




 
トラックバック
http://app.cocolog-nifty.com/t/trackback/5901/17820414

内容に関連性のある記事からのトラックバックは歓迎です。記事内リンクも特に必要ありません。過去交流のないブログでもまったく問題ありません。
ただし「単に部分的なキーワードつながり(関連性が薄すぎ)」「自動で大量トラックバック送信」「自身がトラックバックを受付けていないブログからの一方的なトラックバック」は、削除します。

▲このページの一番上に戻る

WADA-blog(わだぶろぐ)



居抜き物件情報
(東京・渋谷)