放射線科医・MRI専門家の高原太郎個人ブログ

放射線科医・MRI専門家の高原太郎個人ブログ

Tarorin.com 記事一覧

音声認識は、もはや「リテラシー」

      2017/04/24

Siriによって音声認識はだいぶ認知されてきましたが、まだまだ「文字入力困難者のためのツール (-_-;)といった捉え方もあります。でも、PCを用いた放射線科レポート作成のような専門職の現場では、「これがないと業務にならない」と思うぐらい、音声認識は役立つツールになっています。

今では、一般のPC上でもこんな風に認識できるって知っていましたか?

驚愕!Macの標準機能を見てみよう(Winはあとで紹介)

以下は、Macの標準機能である「拡張音声認識」を用いて、左の文を読み上げて原稿を書いている様子です。想像以上にスムース(@@)に入力されるでしょう!! 「改行」も音声で指示しますし、入力が終わったら最後に音声で修正もしています。

いまや、逆に音声認識を使わなくてはソンソン!という感じですよね。

ワードだけでなくって、FaceBookなど、何にでも使えるから、チャットに便利ですね!

スクリーンショット 2015-09-05 11.47.19

 

間違ったところも、もう一度音声認識で入力できる

PC上の音声認識でうれしいことのひとつは、「間違ったところも、容易に音声認識で修正できる」ということなんです。この例でも、いい間違えた「ほうしゃせん・・・か」→「放射線か」 を、もう一度読みなおして修正しています。

スクリーンショット 2015-09-05 10.18.30

Siriだと、間違ったところへカーソルを持っていくのはちょっと面倒ですが、パソコンならトラックパッドでスルッと間違い箇所に移動できますもんね。ちなみに、ひとかたまりの音節は「ダブルクリック」すればワンタッチで選択できますよね。動画にもあるように、肩こりの方にはとくに朗報です!

音声認識は21世紀の「リテラシー」

ワープロ開始時代に「ワープロが出来る人と、いつまでも手書きでないとダメな人」にわかれましたが、僕はこれからは、「音声認識が使える人(as リテラシー)と、いつまでもタイプ入力だけしか使えない人」にわかれると思っています。

音声認識に慣れて「、」(てん)「。」(まる)、「改行」(かいぎょう)”「”(かぎかっこ)”」”(かぎかっことじ)と言えるようになればしめたものです!僕は慣れすぎてしまって、外来で患者さんを呼び出すときに「◯◯さん、3番診察室にお入り下さいまるっていって超恥ずかしかったことありますが (^^;;;;)

「優れた」音声認識ならではの注意

すぐれた音声認識には、ちょっとした注意点があります。認識率が99%ぐらいになると、人間のほうに「あってるはず」という思い込みが生じて、細かい誤りに気づかないこともあるんですね。ここに挙げた例でも、左の原稿の「を」が抜けていたり(下図)、「ひとたび」→「一度」の誤りに気付かず作業を終了しました。だから音声認識で入力したときは、あとでよくチェックをする必要もあります。まぁ、タイプでも変換間違いなどはたくさんありますけれどもね。

スクリーンショット 2015-09-05 10.58.00

Winな人は?

Winな人には、放射線科レポートなど医学の分野で、揺るぎない地位を確立している、アドバンスト・メディア社のものが良いと思います。「AmiVoice SP2」というのがオススメですよ。1万円以下だからまあまあリーズナブルだし、AmiVoiceはプロ用放射線科できわめて高い認識率がもう10年以上前に証明されいています*ので。そのほかドラゴンスピーチもありますね。

スクリーンショット 2015-09-05 11.34.18

*(実は2002年にはもう実用可能だった)
高原太郎、中嶋美佳、似鳥俊明、蜂屋順一 連続音声認識によるMRIレポートの試み 日本医学放射線学会雑誌. 62(1) 23-26, 2002

音声入力は誤認識部分の確認、修正作業も含む・音声認識率は平均97.3%(実験レポート数10件 単語数689語) 。1レポート200文字、平均単語長2.9文字として1レポート中誤認識は2単語(個所)

(プロツールでは専用マイクも用いさらに効率アップ)
「AmiVoice(音声認識)を3倍便利に使う方法」

Macの拡張音声認識の設定

初期状態では、音声認識を使うようにはなっていませんので、「システム環境設定」で、音声入力をONにします。
スクリーンショット 2015-09-05 10.16.07

また、内臓マイクではなくて、iPhoneのイヤホン(イヤホンマイク)を使うと、認識率がアップしますヨ!
スクリーンショット 2015-09-05 11.48.46

というわけで、皆さん「音声認識時代の到来」を楽しみましょう!

 - 21 コンピュータ一般, 25 音声認識, 音声認識

  「21 コンピュータ一般, 25 音声認識, 音声認識」カテゴリーの人気記事

ギガファイル便で大容量データを送るときは「自分に」送ろう! 〜 DropBoxやGoogle ドライブよりも気軽に
ギガファイル便で大容量データを送るときは「自分に」送ろう! 〜 DropBoxやGoogle ドライブよりも気軽に

大容量データを送るには、「DropBox」や「Google ドライブ」を利用する...

字幕とClosed Caption
字幕とClosed Caption

ランニングマシーンでTVを見るときに字幕をON! あけましておめでとうございま...

You have NO chance  ・・ウィーン変換アダプター紛失事件
You have NO chance ・・ウィーン変換アダプター紛失事件

その不幸は「君の名は。」によりもたらされた ウィーン空港に到着後、空港内で2時...