今日の十分日記

今日の十分日記

原点回帰の雑記ブログ。十分で書ける内容をお届けします。十分以上書くときもあるけどね。十分以下もあるし。

音声入力の研究

スポンサーリンク

 

  まさりんです。

  徒手空拳でお送りしたい。

 

  近頃、音声入力というのが流行りつつあるらしい。

  スマホの普及と、それに付随して音声検索が頻繁に行われるようになったからか、音声入力の質が劇的に向上しているらしい。それはパソコンも同様で、Windows10には音声認識による操作が標準装備されるようになった。

  それらの音声入力はそれぞれのAIを使って行われているらしい。アップル製品ならSiri、Windowsならコルタナ、グーグルならGoogle? がそれぞれ音声を検知している。

  ただ、音声入力というのは昔からあった。それは、電話をかけて音声ガイダンスに従い、数字を選んで操作するといった類のことだ。これらのガイダンスなどで使われる音声入力は比較的判別が簡単だ。使われる音声がほぼ決まっていて、コンピュータ側も想定外しやすいからだ。

  それが会話や文章の入力など、複雑な音声の認識になると、難易度が増す。その精度が向上してきたらしいのだ。

 

  これがかなり高い精度で使えるようになると、個人的にはとても助かる。

  小説を書く場合、原稿用紙を使って手書きすることが多い。その他の文章も、手書きすることが多いので。これらをパソコンで打ち直しながら、文章を修正して行く。始めの手書きはネタ出しに近いということだ。この場合、キーボードで打つ作業が非常に億劫だ。これを音声入力で行えれば非常に楽になる。もちろん、キーボードを使う場合文章を見ながら同時に修正するのだが、それを音声認識で同時にやるのはかなりテクニックが要りそうだ。それがいきなりできるとは思ってはいない。それでも、「あとで直すところ」とチェックしながら音声入力をすれば、キーボードよりも早くできるのではないかと思ったのだ。

 

  しかし、iPad、WindowsPC、Android携帯を所有しているが、それぞれ試してみたところ、内臓のマイクは精度がひくくなるらしい。

以下は内部マイクを使って音声入力して見た。

 

iPad Pro

  親譲りの無鉄砲で子供の時から損ばかりしている。小学校に入る自分学校の2階から飛び降りて1週間程度押尾抜かしたことがある。なぜそんな無闇をしたと聞く人があるかもしれんいる。別段深い理由でもない。新築の2階から首を出していたら、同級生の1人が冗談に、いくら威張ってもそこから飛び降りる降りることができまい。弱虫やーい円とはやしたからである。(夏目漱石『坊ちゃん』)

平和起動なり。故にノーなるもこれに不能を示し、要なるもこれに不要を示し、近くともこれに登記を示し、トークトもこれに近木を示し、りして俺を誘い、卵にしてこれを取り、実にしてこれに備えて今日にしてこれを避け、道にしてこれを見出し、日にしてこれを怒らせ、いつにしてこれを下ろし、審議してこれを話す。その6日を責め、その不意にイズ。これ陛下の勝利して先には伝うべからざるなり。(『孫子』)

Android

親譲りの無鉄砲で小供の時から損ばかりしているまる小学校にいる自分学校の2階から飛び降りて1週間程度固執のかしたことがあるまるなぜそんなむやみをしたと聞く人があるかもしれぬまる別段深いわけでもないまる新築の二階から首を出していたら同級生の一人が冗談にいくら頑張ってもてそこから飛び降りることはできない弱虫大丸と林宝であるまる(夏目漱石『お坊ちゃん』)

 

兵は詭道なり故に膿なるもこれに行くのを示しようなのもこれに扶養を示し近くトモコレに登記を示しトークトモコレに近きを示してしてこれを誘い何にしてこれを取り実にしてこれに備え場にしてこれお酒度にしてこれを乱し一にしてこれを折らせ一にしてくれらを弄し心理してこれらを話すそのムービーを責めその国伊豆これ陛下の価値にして先にはつた宇部からざるなり(『孫子』)

 

Windowsは内臓マイクでの認識ができなかった。どうして内臓マイクが存在しているのだろうか。Skype用なのだろうか。

 

  文章は、夏目漱石の坊ちゃんの冒頭と孫子である。一応著作権が切れたものを探して使用した。気にしすぎだが。Androidは句読点をどうやってつけるのかわからなかった。元の文章を入れるべきだが、面倒だ。これこそ音声入力が必要なのだが。

  あまりにも精度が低いので、ヘッドセット(ヘッドフォンとマイクがついているやつ)を購入した。これでもう一度実験をするはずであった。◯◯電気でそれほど高くないヘッドセットを購入した。事前にネットで調べていったのだが店頭に売ってなかったので、違うのを購入したのだが、これが大失敗だったらしい。帰ってきて、あまりにもマイクがヘッポコだったので、ネットでそれを調べて見たら、本当にマイクがヘッポコな機種であった。勢いでものを買うべきではない。

  しかし、かなりゆっくり話さないと認識が正確にならないという話もあり、結局キーボードで打ってしまった方が早いのではないか、と思い始めた。

  無駄に一週間を使ってしまった。

 

ブログランキング・にほんブログ村へ