iPhone・Androidで高速に日本語音声入力するためのベストプラクティス

先日Twitterで「大学生がスマートフォンでレポートを書いている」というツイートが話題になっており、それに対して反応している方達もほぼ全員が「スマートフォンでレポートを書くのは効率が悪い」という前提で話をしていることに大変違和感を覚えました。

なぜなら私はこのブログはもちろん、技術書を執筆するときでさえ主にスマートフォンで下書きをしているからです。

PCを使うのは、ほぼスクリーンショットの撮影と最後の仕上げだけです。
その方が、最初からPCで文字入力するのに比べて圧倒的に効率が良いです。

この記事では、iPhoneとAndroidそれぞれで音声入力を効率よくおこなう方法について解説します。

iPhone・iPadの場合

先に結論から申し上げると、iPhone・iPad・Macの日本語音声入力は、AndroidのGoogle音声入力に比べて認識精度が低く、認識できる単語が少ないです。
仕事で大量に日本語テキストを書く場合などであれば、音声入力だけのためにAndroid端末を買うことをおすすめします。

しかし、それほどの量ではないとか、今持っているiPhoneやiPadを使いたいという方向けにこの項目を書いています。

標準キーボードを使う

iPhoneやiPadの場合、ソフトウェアキーボードは他社製ではなく、標準のものを利用した方が良いです。

標準のキーボードは、ネイティブアプリで日本語入力部分をタップすると、キャレット(文字入力位置を示す縦棒)のある部分や選択したテキストの修正候補が表示されます。
このおかげで、音声入力に間違いがあっても後で訂正できます。

日本語音声入力をしたいときは、「日本語キーボード」の左下のマイクアイコンをタップして日本語入力を開始しましょう。
英語キーボードのマイクアイコンをタップすると「英語モード」の音声入力になりますのでご注意ください。

※設定アプリで[一般>キーボード>音声入力言語]で[日本語]のみチェックを入れ、ほかのチェックをすべて外しておけば常に日本語で音声入力できます。

iPhoneやiPadで音声入力するときのコツ

iPhoneに限りませんが、音声入力するときはなるべく口をマイク(スマートフォンの下部)に近づけた状態でしゃべった方が良いです。

Apple製品を使用した音声入力に関して、「MacよりiPhoneの方が認識精度が高い」という意見を聞くことがありますが、音声認識処理はAppleのサーバーで行われているので精度は同じはずです。

精度が違うと感じられるのは、マイクと口の距離がMacの方が一般に離れている場合が多いからだと思います。

たとえばiMac内蔵のマイクを使用して音声認識をおこなうと、口とマイクの距離が離れているため非常に精度が悪く感じられる場合が多いです。

どうしてもMacで音声入力を行いたい場合は、マイク内蔵のBluetoothイヤホンなどを使うと良いでしょう。

音声入力したい言葉を「単語登録」する

iPhoneやiPadには音声入力用の単語登録機能はありませんが、以下2つの方法で対応することができます。

「連絡先」アプリに登録する

うまく入力できない単語は、「連絡先」アプリに登録しておくと入力できるようになります。
連絡先アプリで[+](新規作成)をタップすると、以下のように6つの入力欄があります。

ここで[姓]に入力したい文字列、[姓(フリガナ)]に発音をひらがなで入力すると、[姓(フリガナ)]で発音したときに[姓]に入力した文字列が優先的に入力されるようになります。

同様に[名]と[名(フリガナ)]、[会社]と[会社名(フリガナ)]も別の単語を登録することができるため、1つの連絡先項目に3つの単語登録が可能ということになります。

しかし、思い思いの単語を3つずつ登録していると、連絡先のあちこちに単語登録された単語が出てきて使いづらくなってしまうことがあります。

iPhoneを電話機としても使用している場合は、[姓]と[姓(フリガナ)]には # などの記号を登録しておき、単語登録は[名]と[名(フリガナ)]、[会社]と[会社名(フリガナ)]の2項目だけを使用した方が良いかもしれません。

単語を選択して、単語登録した単語に再変換する

iPhoneやiPad標準の日本語入力は選択した単語を再変換できるため、あらかじめ入力したい単語を単語登録しておき、音声入力した後文字列を選択して、単語登録した単語に再変換するという方法もあります。
手間はかかるので頻繁に音声入力する単語ではあまりおすすめしません。

Androidの場合

ATOKをインストールする

このあと紹介する「Edivoice」というアプリを素早く呼び出すために、「マッシュルームアプリ」という機能に対応したキーボードアプリが必要です。

ATOKは日本語キーボードアプリの中で変換精度が高く、辞書だけでなく変換履歴までPCやMacと共有でき大変便利です。

買い切り版のATOKアプリは2021年10月でサポートが終了したため、月額制(330円で10台までのWindows・Mac・Androidで利用できる)のATOK Passportの導入をお勧めします。

リンク: ATOK Passport 日本語入力 – Google Play のアプリ

Edivoiceアプリをインストールする

Edivoiceアプリは、「Google音声入力」を使用して効率よく日本語テキストを入力するためのアプリです。
普通にGoogle音声入力キーボードを使用して日本語音声入力をしても良いですが、Edivoiceを使用した方が効率よく入力することができます。
なぜ効率が良いといえるのかはこれから解説していきます。

リンク: Edivoice – 音声入力で手軽に文章作成 マッシュルーム対応 – Google Play のアプリ

音声入力する

実際に音声入力するときはATOKキーボードの左下のアイコンを長押しし、そのまま(指を離さずに)1つ上のアイコンまでスワイプしそこから右にスワイプします。
すると、Edivoiceアプリが起動できます。

Edivoiceアプリでは、「音声認識開始」ボタンを押すと音声認識を開始します。右上の[Menu]から設定変更すれば、起動時に自動的に音声認識を開始するようにできます。

Edivoiceアプリを使用する一番のメリットは「複数の候補から素早く選択できること」だと思います。

たとえばGoogleドキュメントの音声入力であれば、複数の候補がある場合は1度音声入力した後で、下線付きの文章をクリックして別の候補を選択する、といった操作になります。

しかしEdivoiceであれば、発音した直後に画面の下半分に候補一覧が表示されるため、その中から素早くタップで選択することが可能です。

句読点や記号を入力する

Edivoiceでは、アプリ内のボタンを使用して句読点などの記号を入力することができます。
句読点や感嘆符(!)も、ボタンをタップすれば挿入されます。

上から3行目のボタンのみ、挿入される記号を自分で変更することが可能です。
ボタンを長押しすると「キーの割り当てを変更」ダイアログが出てくるため、表示される文字列と挿入される文字列(最大64文字まで)を登録することができます。
私は、SNSのハッシュタグやMarkdownの見出しのために「#」などを登録しています。

少し特殊なのが「矢印」ボタンです。
このボタンは普通にタップすれば「→」が挿入されるだけですが、「矢印」ボタンを左にスワイプすると「←」が挿入され、上にスワイプすると「↑」が挿入されます。

単語登録する

Edivoiceを使用するメリットの1つに「単語登録ができること」があります。

たとえばGoogle音声入力はたいていの単語はうまく入力できるのですが、なぜか「みやこ」という音声が強制的に「京都」と入力されたり、「よんけー」が4Kではなく「4型」と入力されるなど、一部の言葉がうまく認識できない場合があります。

単語登録しておけばそういったうまく入力できない単語を入力しやすくしたり、よく入力する言葉があれば短い言葉で代用したりすることができます。

単語登録するにはEdivoiceの画面右上の「Menu」をタップし、「設定」→「単語登録」から登録することができます。

単語登録を利用した句読点の入力

単語登録機能を利用すると、句読点の入力も可能です。

Google音声入力は、句読点は「くてん」「とうてん」、改行は「あたらしいぎょう」と音声で入力することができます。
しかし、iPhoneやiPadの音声入力と同じように「てん」「まる」「かいぎょう」で入力した方が楽、あるいは分かりやすいという方もいると思います。

そのような場合、単語登録で「てん」「まる」を「後方一致」で登録します。
音声入力するときは「こんにちはまる」のように文章の最後に「まる」が来るようにすることで、文章の最後に句読点を入力することができます。

Edivoiceには設定画面の中に「音声による句読点の自動入力」というチェックボックスがあり、ここをオンにすることで「テン」「マル」のほか「かんたんふ」などの音声で記号を入力することができます。
一般的にはこちらの設定をオンにした方が楽だと思います。

しかし、この設定をオンにした場合、文章の途中で「感嘆符キーを押すと…」と入力したいのに、「!キーを押すと」と入力されてしまうなど、まれに意図しない入力になる場合があるため、私は手動で単語登録をしています。

意図しない入力をソフトウェアキーボードで修正する

Edivoiceで意図しない入力になった場合、「入力確定」キーを押してからテキストエディター上で修正しても良いのですが、その場でソフトウェアキーボードを使って修正することも可能です。

Edivoice上でソフトウェアキーボードを表示するには「KEY」ボタンを上にフリックします。
すると、ソフトウェアキーボードが現れます。

うまく文字列が入力されないアプリの対処法

ほとんどのアプリはEdivoiceで「入力確定」ボタンを押すとテキストが入力されます。
しかし、Facebookアプリなどごく一部のアプリではテキストが入力されない場合があります。

その場合も、「入力確定」ボタンを押した瞬間にクリップボードにテキストがコピーされていますので、テキスト入力欄を長押しするなどして「ペースト」すれば入力できます。

Webコーディングスクール 体験レッスン受付中

まとめて検索置換する

Edivoiceには単語登録機能があるためそれほど使用頻度は高くないかもしれませんが、うまく入力できなかった文字列をまとめて検索置換するスクリプトを組んでおくと、大量の文章を音声入力で執筆する場合に便利です。

ここからの作業はMacなどのコンピューターを使って行います。
具体的なやり方ですが、同じフォルダーに以下の3つのテキストファイルを用意しておきます。

sed.txt ファイルには以下のように置換したい文字列と置換後の文字列を書いておきます。
これは1行ごとに正規表現の記法で書いています。

s/マック/Mac/gi
s/Mac os/macOS/gi
s/windows/Windows/gi
s/ウインドウズ/Windows/gi
s/ウィンドウズ/Windows/gi
s/一つ/1つ/gi
s/二つ/2つ/gi
s/三つ/3つ/gi

これは「マック」を「Mac」に、「ウインドウズ」を「Windows」に、「一つ」を「1つ」に…などの表記揺れをまとめて置換するための指定です。

input.txtには音声入力で書いたテキストをペーストしておきます。

続いて、Macの場合「ターミナル」アプリを起動しsedコマンドを使用します。
ターミナルアプリで「cd」コマンドでinput.txtやoutput.txtに移動してから、以下のように入力してreturnキーを押します。

cat source.txt | gsed -r -f "sed.txt">output.txt;open output.txt

するとoutput.txtに検索置換処理された後のテキストファイルが書き込まれ、テキストエディターで開きます。
これで完了です。

最近の記事

Web制作関連動画

メルマガ会員向けの「コーダーにも役立つ補完AI『Codeium』の使い方」の動画を期間限定で公開しています。
CodeiumはGitHub Copilotと似ていますが、CSSなども補完できて、今登録すれば無料で使えます。

メルマガでは、Web制作者のためのAI活用やWordPress関連の動画など、さまざまな特典があります。ご興味ある方は、ぜひメルマガにご登録ください。