jjsの日記

jjsの日記がはてなブログに引っ越ししました

Windows8の音声認識機能を使ってみた

導入のきっかけ

文章入力をもう少し早くできないかなと考えていたところ、
ふと音声認識ソフトというものがあることを思い出した。


VocaloidとかSoftTalkのように文章を歌ったり、読み上げるソフトは有名だが、
逆に人間が話す言葉を理解して、パソコンを操作したり、文章を書きあげるソフトは
まだまだ認知度も人気も低い。


最初から純正ソフトとして入っているので、検索窓に「音声認識」と入れるだけで、
すぐに起動して使えるようになる。

ということでさっそく使ってみた。


どんなソフト?

マイクが一本あればすぐに使えるようになる、Windwos純正の音声認識ソフトウェア。
最初に自分の声や喋り方を覚えさせるため、30分〜2時間ほどの音声認識チュートリアル
音声認識の向上を行う必要がある。


使ってみて

元々あまり滑舌がいいほうではないので、残念ながら文章を書くのには全くと言っていいほど使えなかった。


ただ、Windwosの操作や各種アプリーケーションソフトの操作では、かなり有用なことが分かった。
ずっと音声認識ソフトウェアを使うわけではなくて、スポット的に、パソコン操作の補助手段として
使うのが非常によかった。


あまり使わないが「マウスグリッド」 or 「マウスオーバー」と言うと、マウスでクリックしたい
場所を指定できる。


区切られた区画で、クリックしたい個所の番号を言えば、どんどん格子状に区切られた区画が
小さくなっていく。ここまで小さくすれば、Youtubeでの表示をするためのボタンをクリックできる。

ここで、「いち」or「にい」or「よん(し)」or「ご」と言った後に「クリック」と言えば、別タブでYoutubeの再生が始まる。


Internet Explorerの画面上で、「番号を表示」と言えば、クリックできる個所が
番号で表示される。

クリックしたい個所の番号を言えば、その場所がクリックされ、画面を切り替えて、
その内容を見ることができる。


メモ帳はもちろん、PhotoshopやLightroom4も起動させることができるし、終了させることもできる。
「メモ帳を開く」と言えばメモ帳が開くし、「それを閉じる」と言えば、現在選択されている
アプリケーションソフトを終了できる。最小化したい場合は「それを最小化」と言う。
マウスオーバーほど派手さのない機能だが、実際はこちらのほうが有用。
恐ろしいことに、IMEで「単語の登録」をしているため、dispcalGUIもちゃんと起動することができた。


音声認識が上手くいかないので

開く、閉じる、キャンセル、最大化などの単語はよく拾ってくれるので、Windwos操作の補助には
問題があまりないが、文章は全く書けない。
さすがにバッファローのマイクだと、安すぎてきちんと声を拾ってくれないのだろうか。


探してみたら、ソニーのマイクがコスパがよくて、性能もかなりいいようだ。

これのうち、どちらかを買ってみようかな。