ホーム アシスタントのウェイクワードをトレーニングした後、「オーケー ナブ」をやめました

in tech

ホーム アシスタントには、アシストと呼ばれる独自の音声アシスタントがあります。 「オーケー ナブ」、「ヘイ ジャービス」、「ヘイ マイクロフト」など、音声コマンドに使用できる事前トレーニング済みのウェイク ワードがいくつか付属しています。独自のカスタム ウェイク ワードを作成したかったのですが、それは予想よりはるかに簡単でした。

ウェイクワードのトレーニングは思っているよりも簡単です

事前の知識や強力なハードウェアは必要ありません

私は常に、独自のカスタム ウェイク ワードをトレーニングするのは、かなり強力なハードウェアを必要とする時間のかかるプロセスであり、完了までに数時間かかるだろうと思っていました。実際、デバイス上で処理を一切行わずに、ブラウザを通じてすべての操作を行うことができます。少し面倒かもしれませんが、理論的には携帯電話でも実行できます。

プロセス全体は、ホーム アシスタント チームが提供する Google Colab ノートブックで実行されます。これは、カスタム ウェイク ワードを作成するために必要なすべてのコードと手順が含まれる Web ページで、コードは自分のコンピュータではなく Google のコンピュータで実行されます。

最初のセクションでは、カスタム ウェイク ワードを入力します。このセクションを実行すると、必要なツールがインストールされ、ウェイク ワードの音声バージョンが生成されます。正しく聞こえない場合は、生成されたウェイク ワードが希望どおりに聞こえるまで、発音のスペルを使用してプロセスを繰り返すことができます。

次のセクションでは、背景ノイズ、音楽、室内エコーなどのオーディオ サンプルをダウンロードします。これらは、カスタム ウェイク ワードがトレーニングされるサンプルを可能な限り現実的に作成するために使用されます。すべてダウンロードするには約 15 分かかります。

最後のセクションではモデルをトレーニングします。さまざまな背景ノイズが追加された、話されているカスタム ウェイク ワードの複数のオーディオ ファイルが作成されます。これらのオーディオ ファイルは、バックグラウンド ノイズ中でもウェイク ワードを認識するようにモデルをトレーニングするために使用されます。

全体として、デフォルト設定を使用したプロセスには約 1 時間かかりました。完了すると、カスタム ウェイク ワードが TensorFlow Lite と Open Neural Network Exchange (ONNX) の 2 つの異なる形式で保存されます。

ホームアシスタント音声プレビュー版

寸法

84×84×21mm

重さ

96g

Home Assistant Voice Preview Edition は、Amazon Alexa や Google Nest Mini などの代替として構築されたプライバシー最優先のスマート スピーカーです。ホーム アシスタントを搭載したスマート ホームに、ローカルのみの処理を含む音声アシスタント機能を追加します。


ホームアシスタントにウェイクワードを追加するのは簡単です

モデルをフォルダーにドロップし、openWakeWord を再起動します。

ホーム アシスタントの音声アシスタント設定のウェイク ワード オプションとして「Hey KITT」が表示されます。

ナイトライダーのデヴィッド・ハッセルホフのような気分になれるウェイクワードを作りたかったのです。彼は、車内のタッチスクリーンまたは時計を通じて、人工知能車 KITT に話しかけることができたので、Google Colab を使用して「Hey KITT」をウェイクワードとしてトレーニングしました。

まず、openWakeWord アドオンをホーム アシスタントにインストールする必要がありました。ホームアシスタントにウェイクワードを聞き取らせるソフトウェアです。インストールしたら、ドロップしました hey_kitt.tflite ホームアシスタントにファイルを送ります。 Samba アドオンを使用して、 /share/openwakeword ディレクトリ。

次に、ホーム アシスタントで新しい音声アシスタントを設定しました。三点メニューの アシスタントを追加 窓、あるよ ストリーミング ウェイク ワードを追加する オプション。これを選択すると選択できるようになりました ウェイクワードを開く ウェイクワードエンジンとして、そして やあ、キット サポートされているウェイク ワードのリストから選択できるようになりました。

木の表面にケーブルが接続された Raspberry Pi コンピューター。

ホーム アシスタントを実行する 7 つの最良の方法

スマート ホーム ハブに最適なハードウェアを見つけてください。

私のスマート スピーカーはカスタム モデルを簡単に使用できませんでした

代わりに Mac でウェイクワードをテストしました

Lenovo L32p-30 モニターと 27 インチ Retina iMac の比較。 クレジット: Mark LoProto / How-to Geek

ReSpeaker Lite を使用して構築された Assist 用のスマート スピーカーを持っていますが、これはオンデバイスのウェイク ワード検出を使用するため、私の openWakeWord モデルは適切ではありませんでした。ウェイクワードをテストするために、老朽化し​​た iMac を音声衛星としてセットアップすることにしました。

私の古い iMac は、新しい ESPHome ベースの音声衛星オプションには適していなかったため、時代遅れのワイオミング プロトコル統合を使用してセットアップする必要がありました。少しいじった後、「Hey KITT」と言うことでアシストを起動することができ、照明のオン/オフなどの操作を行うことができましたが、音声応答が機能しなかったため、アシストからの確認音や音声応答を聞くことができませんでした。

次に、M2 MacBook Air で再度試してみました。Linux Voice Assistant ソフトウェアを実行すると、Mac を音声衛星として使用できるようになりました。 LVA を使用すると、MacBook のスピーカーからアシストの音と応答を聞くことができました。

結果はかなり堅調でした

ついにデヴィッド・ハッセルホフになった気分になった

LLM の気まぐれで紫色になったスマート電球。 クレジット: Adam Davidson / How-To Geek

Google Colab セットアップにはトレーニング用のデフォルト設定がありますが、より多くのサンプルとトレーニング ステップを使用するとモデルが改善されると記載されています。ただし、これを行うにはさらに時間がかかります。デフォルト設定を使用していたので、ウェイク ワードはあまり効果的ではないと確信していました。予想していたよりもはるかにうまく機能することがわかり、うれしい驚きを感じました。

「Hey KITT」と言うのはほぼ毎回効果があり、音楽が流れていてもウェイクワードは認識されました。 「Hey KITT」と言って、照明を消したり、その他のスマート ホーム コマンドを要求すると、1 ~ 2 秒以内にそれが行われます。私はついに、マイケル・ナイトであることがどのようなものかを知りました。あとはアシストの音をウィリアム・ダニエルズのようにするだけです。


「オーケー、ナブ」と言うのはいつも奇妙に感じていた

Alexa は最高のウェイクワードではありませんが、「オーケー ナブ」はいつも奇妙な選択のように感じられました。 「Hey Jarvis」のほうが優れていますが、独自のウェイクワードを作成できるのは素晴らしいことです。そうすることは私が予想していたよりもはるかに簡単です。

関連情報は以下のリンクからご確認いただけます

完全ガイドはこちら

関連記事

前の投稿
私は、Oura Ring の月額 6 ドルの RingConn 料金を捨てました。これ以上に幸せなことはありません
次の投稿
インターネットのお気に入りの部分を 0 ドルで保存しました。所要時間はわずか 30 分でした