Windows音声認識 再考/とりあえず使ってみる

Last-modified: 2014-08-16 (土) 12:41:50 (2013d)

←もどる

マイクを設定する

Windowsキーをクリックし、「音声認識」と打つと、「Windows 音声認識」と「音声認識オプション」が表示されると思います。「音声認識オプション」をクリックします。(コントロールパネル→音声認識オプション でも行けます。)

音声認識オプションから、「マイクのセットアップ」を選択します。

dictation_01.png

同時に、タスクトレイのスピーカーアイコンを右クリックし「録音デバイス」を選択して、デバイスウィンドウを表示しておくと良いでしょう。

dictation_02.png

録音デバイスのウインドウで、マイクとして使用したいデバイスにチェックマークが入っていることと、そのマイクに向かって話した時にレベルメーターが動くことを確認します。3つ〜5つぐらい点灯すれば十分でしょう。

後は、マイクのセットアップウィザードの指示に従って進めれば、マイクのセットアップが完了します。

音声認識チュートリアルの実行

dictation_03.png

次は、音声認識オプションから「音声認識チュートリアルの実行」を選択し、チュートリアルを行います。 画面の指示に従って発言していれば終わります。数十分単位の時間がかかると思います。

チュートリアルを完了することで、アプリケーションの起動、テキスト入力、アプリケーションの切り替えなどをボイスコマンドで実行できる知識が身につきます。

認識精度を向上させるプログラム

dictation_04.png

「ユーザーの音声をより正確に認識できるように、コンピュータに学習させる」を選択すると、認識精度の向上を目指したプログラムが実行され、終了させることで認識精度が上がるようです。

実際、これを行わなくても十分認識されるので、行ったところでどれほど精度が向上されるか不明ですが、私はとりあえず1回は行ってます。

嫌でも覚える、必須ボイスコマンド

  • 「聞き取りを開始」「聞き取りを停止」
  • 「スタート」(Windowsスタートメニュー)
  • 「番号を表示」

さらに、快適な動作のために覚える必要のあるボイスコマンド

  • 「マウスグリッド」マウス操作をシミュレーションします。
    ドラッグの例:「マウスグリッド 3 5 3 マーク 2 2 9 3 OK」(「OK」は「クリック」でも同じ)
  • 「音声認識オプションの表示」
  • 「戻る」
  • 「エンター」「バックスペース」「スペース」
    特定のキー(Del、BackSpace?、Enter、PageUp?PageDown?、Home、End、Tab )は、最後に「〜を押す」と言わなくても入力されます。特に、「エンター」は「それをダブルクリック」を代用できる場合が多く、重宝します。
  • 「アプリケーションを切り替え」 1つしか起動していないウインドウが非アクティブになっている場合、そのウィンドウをアクティブ化する際にも使います。
  • 「切り取り」「貼り付け」「元に戻す」
    定番キーボードショートカットを代替できます