Google Pixel の「コンテキスト認識型」音声入力をどのキーボードよりも優れたものにする 3 つの機能

in tech

おそらく、Gboard が優れた音声入力エクスペリエンスを提供していることはすでにご存知でしょう。あまり知られていないかもしれませんが、Pixel デバイスでは Gboard が音声編集もサポートしているということです。乱雑な音声ドラフトを作成し、コマンドを使用して正確に編集したり、形式的に整えたり、書き直したりすることができます。これらすべてを画面に触れることなく行うことができます。

Pixel での Gboard の音声入力を他のキーボードよりも優れたものにする 3 つの主要な機能を紹介します。

ピクセル10

ブランド

グーグル

SoC

Google テンソル G5

画面

6.3 インチ Actua OLED、20:9

ラム

12 GB RAM

ストレージ

128GB / 256GB

バッテリー

4970mAh

Pixel へのアップグレードを検討していますが、より高価なモデルの追加機能がすべて必要かどうかわかりませんか?標準の Pixel 10 モデルに失望することはありません。印象的なカラー、Gemini の機能、7 年間のアップデートを備えたこの購入で間違いはありません。


音声を使用して句読点を挿入します

カンマを追加するためだけに画面をつつくのはやめてください

Pixel 上の Gboard は、話しているときに句読点を自動的に挿入するという確かな機能をすでに備えています。ほとんどの場合、それについて考える必要はありません。カンマとピリオドがどこにあるかを理解するだけです。

ただし、完璧ではありません。明らかなカンマが抜けている場合もありますし、特定の場所に句読点を意図的に配置したい場合もあります。そのような場合は、「カンマ」、「ピリオド」、「疑問符」、「感嘆符」、または「改行」などの句読点を声に出して言うだけです。通常、Gboard は、ユーザーの間や発話パターンに基づいて、ユーザーが「感嘆符」という単語を意味しているのか句読点を意味しているのかを判断します。これは私の経験からすると非常に正確です。

句読点以外にも、音声を使用してメッセージに絵文字を挿入することもできます。適切な絵文字を見つけるために一時停止するのではなく、「泣いている絵文字」または「火の絵文字」と言うだけで、インラインで表示されます。ただ、他の人の周りではこのようなことをしないでください。 「笑い絵文字」を 4 回続けて言うと、すぐに気まずい顔をされます。

青色の背景に絵文字の選択。

これらの絵文字を間違って使用するのはやめましょう: 人々が常に誤解している 16 の絵文字

正式な名前は一つの物語を物語っています。実際の使用法は別のことを物語ります。ここでは、最もよく読み間違えられる絵文字と、今日人々が実際に意味するものを紹介します。

ハンズフリーのテキスト編集

音声入力から音声編集まで

手書きで入力するときに間違いが発生する場合、音声で入力する場合はさらにその可能性が高くなります。ありがたいことに、Gboard では音声コマンドを使用してこれらの間違いを修正できるため、携帯電話を手に取りキーボードに切り替える必要はありません。たとえば、ディクテーションした最後の単語が間違っていた場合は、「最後の単語を削除」と言って削除できます。文字起こし全体が汚れている場合は、「クリア」と言うだけで消去できます。すべてが完璧に見える場合は、「送信」と言ってメッセージを送信します。

より強力なレイヤーは、Pixel 8 以降で利用できる詳細な編集コマンドです。これらにより、音声だけで正確な編集を行うことができます。たとえば、次のように口述筆記したとします。

「ジョンはカフェテリアに行きました。」

しかし、あなたは「ジョン」ではなく「ジョニー」を意味していました。 「ジョンをジョニーに変更」または「ジョンをジョニーに置き換え」と言うと、Gboard が自動的に修正します。 「ジョンを削除」と言ってその単語を削除することもできます。特定の単語を削除したり、テキストを大文字にしたり、珍しい名前を 1 文字ずつスペルアウトしたりすることもできます。最初は面倒に聞こえるかもしれませんが、慣れれば、携帯電話に触れることなくメッセージ全体を作成および編集できるようになります。

すべてのコマンドのリストは次のとおりです。

  • 最後の単語を削除: 最後に話した/入力した単語を削除します。
  • 削除 (単語): 特定の単語の最新のインスタンスをテキストから削除します。
  • クリア: 最後の文を削除します。 例:「おはようございます。お元気ですか?」 > 「クリア」と言う > 「おはよう」
  • すべてクリア: テキストフィールド全体をクリアします。 例: 「明日の午後 5 時に会議」 > 「すべてクリア」と言う > フィールドを空にする
  • 送信: 現在のメッセージを送信します。
  • 停止: マイクをオフにします。
  • 前後に挿入 (単語): 指定した単語の前後に単語を挿入します。 例: 「コーヒーと紅茶が欲しいです」 > 「コーヒーの前にホットを入れてください」と言います > 「ホットコーヒーと紅茶が欲しいです」
  • (単語) を (単語) に変更します。 特定の単語を置き換えます。 例: 「月曜日に会いましょう」 > 「月曜日を金曜日に変更してください」 > 「金曜日に会いましょう」
  • (単語) を (文字) として綴ります: カスタム スペルを強制します。 例: 「新しいアプリの名前は Nate です。(一時停止) Nate を KNATE と綴ります」 > 「新しいアプリの名前は KNATE です」と言います。
  • 大文字化 (単語): 特定の単語を大文字にします。 例: 「シャルマ博士とのミーティング」 > 「博士を大文字にして」と言います。 > 「シャルマ博士との面会」
  • 小文字 (単語): 大文字の単語を小文字にします。 例: 「これを人事部に送信」 > 「小文字の部門」と言う > 「これを人事部に送信」

キーボードを打つと痛みがあり手を握る。

私はプロのライターですが、キーボードにはほとんど触れません。代わりに使っているものは次のとおりです。

書くことは、特定のツールを使用することではなく、自分の考えを共有することです。

音声でメッセージ全体を校正して書き直す

「直して」って言ってください

この機能は Pixel 9 以降 (9a を除く) で利用可能で、音声入力が真に強力で、本物のキーボードの代替品のように感じられるようになります。メッセージを口述した後、「これを校正して」または「これを修正して」と言えば、キーボードに内蔵された AI がメッセージをクリーンアップしてくれます。タイプミス、文法の間違い、句読点の問題を修正し、洗練された読みやすいメッセージを提供します。

ご想像のとおり、これにより編集プロセスが完全に効率化されます。文字起こしの間違い、句読点の抜け、つなぎ言葉の編集について心配する必要はありません。すべて自動的に処理されます。主な制限は、AI が認識しない固有名詞です。通常、手動で修正する必要があるのはこれらのみです。

この機能を使用してメッセージを書き直すこともできます。音声の下書きが上司や同僚に送信するにはカジュアルすぎる傾向がある場合は、「テキストを形式的にする」と言って、よりプロフェッショナルなものにすることができます。逆に、メッセージをよりカジュアルでフレンドリーなものにしたり、絵文字を追加したりすることもできます。短いメッセージを拡張したり、長いメッセージを短縮したりすることもできます。

リライターを使用すると、新しいダイアログ ボックスが表示され、メッセージの複数のバージョンが表示されます。 「次へ」または「前へ」と言うことで、それらを循環できます。気に入ったテキストが見つかったら、「これを使用してください」と言うと、元のテキストが置き換えられます。

まだいくつか問題があります

完璧ではありませんが、ほぼ完璧です

キーボード レイアウトと浮動絵文字を含む Google Gboard のイラスト。 クレジット: Lucas Gouveia/ハウツー ギーク

Gboard の高度な音声入力機能を初めて使用するときは、当たり外れがあるように感じるかもしれません。それは、この機能が機能しないからではなく、それを使用する特定の方法があるからです。ただし、コツを掴めば、ワークフローは驚くほど直感的に感じられます。

Gboard キーボードで入力している手。数字の行が強調表示され、その両側に Google ロゴと無効なスペルチェック アイコンが表示されます。

この設定を変更するまでは Gboard が大嫌いでした

いくつかの調整を加えるだけで、Gboard のエクスペリエンスがさらに快適になります。

コマンドを登録するには一時停止する必要があります

理解するために最も重要なことは一時停止です。コマンドを言う前に少なくとも 1 秒間一時停止する必要があります。そうしないと、コマンドは通常のテキストとして入力されます。たとえば、「ジョンはジョンという単語を削除すると言っています」と一時停止せずに言うと、文全体が入力されます。しかし、「ジョンは、ジョンという単語を削除すると言った(一時停止)」と言うと、Gboard はコマンドを解釈して「ジョン」を削除し、「言った」を残します。

とはいえ、誤ってコマンドを実行することを心配する必要はありません。 Gboard では、コマンドなのかテキストなのかがわからない場合、デフォルトで入力して強調表示します。 「適用」と言うと、コマンドとして実行できます。

AIは最後の数文しか「見る」ことができない

音声コマンドは、テキスト カーソルの位置から最後の数文に制限されます。したがって、「ジョンを削除」と言うと、「ジョン」の最新のインスタンスが削除されます。 「John の 2 番目のインスタンスを削除する」など、より高度なターゲティング オプションがあればよかったのですが、少なくともこの記事の執筆時点ではサポートされていません。この制限は、AI が最後の 2 文または 3 文のみを処理する「修正」や書き換えなどの AI 機能にも適用されます。

ただし、それは取引違反ではありません。簡単にタップして単語を手動で選択し、音声コマンドを使用して編集できます。これは実行可能な回避策ですが、ハンズフリーのワークフローを破壊します。


エクスペリエンスはショートメッセージ用に最適化されています

全体として、Gboard の高度な音声入力機能と音声コマンド機能は、短いメッセージで最もよく機能します。いくつかの文をディクテーションする場合、すべてがシームレスに感じられます。AI は完全なコンテキストを処理でき、音声編集は確実に機能します。

ただし、500 語のブロックをディクテーションしてから「fix it」を実行すると、コンテキスト ウィンドウが限られているため、エクスペリエンスがさらに不安定になります。実際的な回避策は、一度に 2 つまたは 3 つの文をまとめてディクテーションし、「fix it」を実行してから続行することです。理想的ではありませんが、機能します。

関連情報は以下のリンクからご確認いただけます

詳しい情報を見る

関連記事

前の投稿
Instagram での会話はもうプライベートではなくなります
次の投稿
今週末 (5 月 8 ~ 10 日) に観るべき受賞歴のある Netflix 映画 5 本