Windows音声認識 再考/音声認識の苦手分野

Last-modified: 2014-08-16 (土) 12:41:50 (2152d)

もどる

音声入力は現在まだ発展途上の技術であり、使用者も少ないため、操作にストレスを感じる場面も少なくありません。

そもそも、マウスとキーボードを使うことを前提に設計されたUIを、それ以外のヒューマンインターフェイスで操作しているわけですから、無理がない方がおかしいでしょう。

ディクテーションの問題

日本語は選択肢が多く、音声入力に適した言語ではありません。(これは手書き入力でもよく感じますね。)

例えば、英語はまず読み取ってくれません。画面上に選択肢が少なく、わかりやすい単語であればそこそこ認識してくれるのですが、メモ帳にディクテーション入力する場合など、英語は全滅です。

送り仮名も思い通りになりません。「引数」と入力したいつもりが、「引き数」にしかならずイライラします。直そうとすると「キス」になったり。

候補がたくさんあり過ぎるのも操作を難しくしています。「例:」なんてのは入力するのがとても難しいです。「0」にばっかりなったり。

そして、私は一部の子音の発生が苦手なため、「で」「れ」なんかは誤認識が多いです。「ディー」と「ビー」の区別がつかない、と人から言われたことがあります…。

「ビートルズ」「ディスク」「デベロッパー」などはきちんと認識してくれるのですが、「ベータ」と言ったつもりがほぼ確実に「データ」と認識されます。

ついでに、「イオン」「子音」など、尻すぼみな単語も認識率が悪いですね。これらは「4」と間違われる場合が非常に多いです。

使用者にストレスなく入力させるためには、PCが日本語の構造(教科書的なもの以外に、スラング的なものも)をよく理解する必要があるでしょう。