こんにちは。
みなさんGoogle音声入力を知っていますか?
僕は今までGoogle音声入力を使ったことがなかったのですが、これを使うことによって文書の作成速度が恐ろしく早くなり、感動しています。
今回はそんな、ものすごく便利なGoogle音声入力と、有料の音声入力ソフトについて調べてみました。
もくじ
Google音声入力とは?
Google音声入力とは、googleが提供している無料サービスGoogleドキュメントやGoogleスライドにおいて、パソコンにつなげたマイクから音声を入力し、そこから文字の入力や設定の変更、命令を行えるというものです。
簡単に言えば、しゃべった言葉をそのまま文字にしてくれます。すごいですよね。
このソフトの素晴らしいところは、他の一般的なソフトと異なり無料で使えるという点です。ですからGoogleドキュメントやGoogleスライドを既に使ったことがある方は、マイクさえあればすぐに使えるサービスというわけです。
当たり前ですか、手動での文字の打ち込みとちがって、音声入力の場合はしゃべる速度で文字を入力する事が可能になるため、文書の作成速度が恐ろしいほど速くなります。
最初は音声入力のくせのようなものに慣れなければいけず、ちょっとしたコツを覚える必要がありますが、慣れてしまえば入力速度はますます喋る速度に近づくでしょう。
そんな素晴らしいメリットがあるため、使っておいて損はありませんよね。
Google音声入力の設定・使い方
Google音声入力に最低限必要なものは、マイクのみです。スマートフォンの場合、標準搭載されているマイクを使うのであればマイクも必要ありません。
パソコンで使う場合について
まずマイクが内蔵されていないパソコンである場合、パソコンにマイクをつなぎます。
マイクをつないだら、 コントロールパネルを開き、ハードウェアとサウンドをクリックし サウンドをクリックします。
タスクバーを録音に合わせ、使いたいマイクを選択・右クリックし、「既定のデバイスに設定」をクリックします。これをすればマイクで音を拾うことが可能となります。
次に、google 音声入力を使うことができる、 google ドキュメントもしくは google スライドを使う手順についてです。
google chromeブラウザをインストールします。
googleアカウントを作成します。
google chromeブラウザを開き、自身のgoogleアカウントでログインします。
ここらへんは調べていただければすぐに出てくると思いますので軽い紹介で済ませます。
画像の赤枠の位置にあるGoogleドキュメントをクリックして開きます。
Googleドキュメントを開いたら、ツールバーのツール→音声入力から
画像のようなバーを出します。
そして、それをクリックして、画像のように赤くなったら開始です。
このようにして音声入力を使うことができます。
スマートフォンの場合
スマートフォンでGoogle音声入力を使いたい場合、最も簡単な方法は
Google日本語入力を入れてしまうことです。
Androidの場合、
Google Playストアから「google日本語入力」と検索すれば一番上に出てきます。
インストールが出来た場合、画面のようなアプリが表示されます。
インストールが終わったら、文字入力画面を開くと、以下のようになっています。
右上のマイクボタンをクリックすると、以下の画面になり、音声入力が使えるようになります。
これでOKです。
精度はパソコンに比べるとやや劣るような気がします。しっかりしたマイクを使えば問題ないのでしょうか?
どれくらい便利なの?
僕がGoogle音声入力を始めて使い始めてから、二つほど記事を書きました。
こちらの二つです。
参照:Amazonの本の読み放題サービスKindle Unlimitedがすごい
今までの僕であれば、この分量の記事を作成する場合は平気で4時間から5時間ほどかかるのを覚悟していましたが、音声入力を使ったこの記事はどちらも3時間ほどで 記事が完成しました。
このうち、文字を打ち込む作業はおおよそ3時間ほどでしたが、今回は約半分の1時間半ほどで完了することができました。ですから文字入力について言えば作業速度2倍ほどですね。
まだまだ慣れていない私でもそれほどの速度向上ですので、慣れてくればさらに早くなるのではないでしょうか。
これは僕にとってものすごい衝撃でした。非常に便利です。
Google音声入力のデメリット
Google音声入力には、有料のソフトに比べて大きなデメリットが存在します。このデメリットさえ気にならないのであれば、わざわざ有料のソフトを買う必要はないでしょう。
大まかに以下の3点がデメリットとなります。
MicrosoftのWordやPowerpointには直接入力できない
Google音声入力の最大のデメリットは、GoogleドキュメントやGoogleスライドでしかサービスを使うことができないという点です。
お仕事をされている方であれば、文章の作成やスライドの作成する場合、WordやPowerpointを使うのが一般的です。
ですから、Google音声入力を使いたい場合は、Googleドキュメントで作成した文章をコピーアンドペーストしてWordで使うという方法をとることが多いです。このひと手間が非常に面倒くさく、このサービスがいまだに定着していないのはこれが原因ではないかと思います。
自分専用の学習機能がない
Google音声入力はその性質上誤った入力というのが必ず存在します。それは自分の声質とかイントネーションなどに依存します。
Google音声入力は有料ソフトと比べてそういった誤った情報を自分専用に学習させる機能がありません。ビッグデータとしてGoogleで情報の収集を行うことがありますがそれは自分専用のデータではありません。
長く使っていく上で、有料ソフトと比べてもそれは大きなデメリットとなります。
文字の入力しかできない
これは有料ソフトとの比較になりますが、 Google音声入力は文字の入力機能は非常に充実していますが、パソコンの操作などのサービスは全くありません。
有料ソフトの場合、ソフトをインストールしてしまえば、インターネットの検索を音声で行えたり、アプリケーションを開くといった操作も、音声で操作することが可能です。
Windows10であれば Windows 標準のソフトCortanaがありますが、やはり有料ソフトの精度が高いようです。
有料の音声入力ソフト比較
上記のようなデメリットを解消したのが、これから示す二つの有料ソフトです。無料のGoogle音声入力を試して音声入力の魅力を感じたのであれば、次に示す二つの有料ソフトのうち適しているものを選択すると良いかもしれません。
気になっている方のために、先に結論だけ書くと
ドラゴンスピーチ
- Windows7以上のハイスペックなパソコンで普段使いの方
- 値段を安く抑えたい方
- さまざまな機能を使ってみたい方
AmiVoice
- ドラゴンスピーチが対応していないWindowsVistaやWindowsXP SP2、性能の低いタブレットPCなどのユーザー
- 法律、医療への用途を検討されている方
- 録音ファイルからの文字書き起こしをメインで使う方
上記のような方にそれぞれオススメです。
ドラゴンスピーチ
有料のソフトの中でも最も音声による文字入力の性能が高いのはこのドラゴンスピーチでしょう。
後述のアミボイスSP2と比べても比較的安いのも特徴です。ドラゴンスピーチは多機能かつ認識率の高さもあり、パソコンに高いスペックが要求されます。
現在最新のドラゴンスピーチ11が要求するスペックは以下のものです。
- プロセッサ:SSE2 命令セットを搭載した 1 GHz 以上の Intel Pentiumプロセッサまたは同等のAMDプロセッサ、1.66 GHz以上のIntel Atomプロセッサ。SSE2 命令セットを搭載した1.8 GHzのIntel Dual Coreプロセッサまたは同等のAMDプロセッサ
※プロセッサが高速になるほど処理能力が向上します。- メモリ:2 GB以上のRAM(32 ビット)、4 GB以上のRAM(64 ビット)
- OS: Windows7 SP1, Windows8, Windows 8.1 (32ビット版または64ビット版OS)
簡単に言えば、
- Windows7以降のOSを搭載
- メモリ4GB以上
- クロック周波数1.8GHz・Dual Core以上のIntelプロセッサもしくは同等のAMDプロセッサ
このレベルのスペックであれば、最新のスタンダードなノートパソコンであれば問題ありません。つまり、このレベルのスペックがあり普段使いであれば、ドラゴンスピーチ一択でしょう。
しかし一方で、軽量なモバイル用ノートやタブレットなどでは少し問題があるかもしれません。
ですから、外出時にモバイル端末でWord, Excelの音声入力をしたい!といった場合は高性能の端末を選ぶ必要があります。
要求するスペックが高いだけあって、以下のような様々な機能があります。
- ICレコーダの録音ファイルから文字への書き起こし可能
- 主要ソフト(outlook, word, excel, powerpoint, internet explorerなど)に直接音声入力可能
- 音声によるパソコン操作
- SNS専用コマンド搭載
- スマートフォンやBluetoothマイクから音声入力可能 (Lite版は一部制限有り)
- 認識精度を向上させる機能搭載
中でも面白いのは、録音ファイルから文字への書き起こし機能とSNS専用コマンドでしょうか。
録音ファイルの文字起こし機能とは
ちょっとした会議や話し合いの場で録音したファイルがあるときに、このソフトを使うだけで文字起こしができてしまう機能です。何も使わずに文字に起こす場合と比べても労力が段違いです。
SNS専用コマンドとは
例えばTwitterへ投稿したいと思ったときに、何も起動していないデスクトップ画面で、「ツイッターへ投稿」と発話し、ツイートしたい内容を発話します。
内容を確認して、「クリックOK」と発話すればツイッターへの投稿完了です。
これはドラゴンスピーチのみの機能であり、思い立ったときにSNSへ投稿できるもので、Twitterであればまさにツイートする(つぶやく)ことが出来るというわけです。
独自性のある面白い機能ですね。
AmiVoice SP2
前述のドラゴンスピーチは高性能かつ多機能で、非常に多くの方に使ってもらえる機能が搭載されていました。一方こちらのアミボイスSP2は、用途や目的が絞られています。具体的には以下のような特徴があります。
- パソコンに要求されるスペックが圧倒的に低い
- プロセッサ:1 GHz 以上のプロセッサ ただし、Intel Atomプロセッサは1.66 GHz以上。
- メモリ:2 GB以上
- OS:Windows® 10、Windows® 8.1、Windows® 8、Windows® 7、Windows Vista®、Windows® XP SP2以上
- 法律用、医療用の認識ソフトなど特殊用途に強い。専門用語に対応する。
- 録音ファイルから文字への書き起こし機能の専用エディターがある
上記の内容から、ターゲットは次のような方に絞られます。
- ドラゴンスピーチが対応していないwindowsVistaやwindowsXP SP2、性能の低いタブレットPCなどのユーザー
- 法律、医療への用途を検討されている方
- 録音ファイルからの文字書き起こしをメインで使う方
このように、ドラゴンスピーチと比較しても対象となるユーザーが明確です。中でも録音ファイルの書き起こしはAmiVoiceの強みです。
AmiVoiceの録音ファイルの文字書き起こしには、専用の編集ソフト「書起しエディター」というものがあります。このソフトの面白い点は、音声を再生した直後に入力した文章と、再生した位置をリンクさせて記録する機能が有ることでしょう。この機能がドラゴンスピーチよりも優れている点で、これだけでも購入する価値はありそうです。
一方、値段に関してはドラゴンスピーチと比べてもやや高価で、
AmiVoice SP2 USBマイク無 でも税別19800円となっています。(アカデミック版は税別13800円です)
ドラゴンスピーチ11 Lite ノイズキャンセリングUSBマイク付で税抜定価13100円ですので、少なくとも5000円以上の差がありますね。
※セットだとさらに高くなります。
というわけで、それぞれのソフトはこのような方がターゲットです。
ドラゴンスピーチ
- Windows7以上のハイスペックなパソコンで普段使いの方
- 値段を安く抑えたい方
- さまざまな機能を使ってみたい方
AmiVoice
- ドラゴンスピーチが対応していないwindowsVistaやwindowsXP SP2、性能の低いタブレットPCなどのユーザー
- 法律、医療への用途を検討されている方
- 録音ファイルからの文字書き起こしをメインで使う方
ドラゴンスピーチを使ってみた感想
ここまでの内容は一般的なレビューで、いわゆる建前です。ここから本音を書きます。
Google音声入力が便利すぎたため、最もポピュラーであり多機能であるドラゴンスピーチを購入してみました。購入したのはドラゴンスピーチ11スタンダードのダウンロード版です。
結論だけ書くと
- 音声認識の精度はGoogle音声入力の方がずっと良い
- 使いこなせるようになるまで時間が掛かりそう
- ハイスピードの音声認識はドラゴンスピーチの方が強いかも
- 精度が向上しないのであればGoogle音声入力の方がずっと便利
使ってみた感想です。
音声認識の精度は、Google音声入力の方がずっと上だと思います。これは最もがっかりした点です。
Google音声入力の場合、ある程度小声でボソッという風にしゃべっていても音声を認識してくれますが、ドラゴンスピーチの場合はやや大声でハキハキとしゃべらないとかなり精度が下がります。
あと気になったのは、マイクがオンになっている限り、常に音声が入力されている状態となり、文章があちらこちらに飛躍するというのも気になりました。Wordに文章を入力しているときに、しゃべらない状態で置いておいたらあちらこちらにカーソルが飛んでいく現象がありました。これは僕だけでしょうか?
音声入力について、Google音声入力の場合には区切りを入れて発話しても音声認識がうまくいくイメージがありましたが、ドラゴンスピーチの場合は一気に発話した方がうまくいくような気がします。
慣れてきたらドラゴンスピーチの方が早く入力できるということかもしれません。もし慣れてもこのままであれば、正直google音声入力だけで十分です。
音声入力はすべての人が幸せになれる機能
上記のとおり、音声入力機能はほとんどデメリットはなく、若いパソコンを使ったばかりの人や、年配のあまりパソコンを使ったことのない人たちにとっても、文書作成の多いビジネスマンにとっても非常に便利な機能です。
この機能はすべての人が幸せになれる機能と言っても過言ではありません。また、この機能は精度が上がればますます広まっていくでしょう。いずれは文書入力やパソコン操作のスタンダードになりえると考えています。
ですが、今の時点で音声入力を他の人よりも早く知り、使いこなせるようになるのは、他の人よりも無駄な時間を少なくすることができるのです。使いこなせるようになるに越したことはありませんね。
音声入力は少々癖があるので、入力速度をしゃべる速度にまで近づけるには慣れが必要です。取っ掛かりとして、みなさんも無料の google音声入力を使ってみませんか?
今回はこんなところで。ではでは。