私の Alexa スマート スピーカーは、スマート ホーム内のすべてを音声で制御する未来をもたらすことを目的としていました。代わりに、それらは機能が限られており、いくつかの重大なプライバシー問題を備えた閉鎖的なシステムであることが判明しました。交換時期が来たと判断しました。
独自開発のスマートスピーカーの問題点
望ましくない広告とプライバシーに関する重大な懸念
Amazon の Echo デバイスなどの人気のスマート スピーカーは、魅力的に設計されています。価格も手頃で、音声でスマート ホームを簡単かつ簡単に制御できるようになります。問題は、それらが本質的には閉じられたスマートホームエコシステムへのゲートウェイであることです。
どのデバイスがスマート スピーカーと連携するか、またはそのデバイスが提供する機能を制御することはできません。ロケールによっては機能が削除されたり、まったく提供されなかったりする可能性があり、便利な機能がペイウォールの背後に隠れてしまう可能性があります。最終的には、その逆ではなく、スマート ホームをスマート スピーカーに合わせて調整する必要があります。
次に、プライバシーの問題もあります。私の Echo スマート スピーカーは、私の音声対話のほとんどをクラウドに送信して処理しますが、サードパーティの請負業者が応答の品質を判断するためにこれらの録音の一部を聞いていたことが明らかになりました。つまり、Echos から聞こえる範囲内で私が発言した内容は、サードパーティのサーバーに転送され、他の人に聞かれる可能性さえあるということです。
私の Echo Show デバイスはさらに悪く、買い切りで購入したにもかかわらず、不要な広告が定期的に表示されます。これらのスマート スピーカーを使用する利点は、もはや欠点を上回っていません。
私が Amazon Echo スマート スピーカーを手放す 7 つの理由
「アレクサ、出発の時間です。」
ホームアシスタント用のスマートスピーカーの構築
必要なのは安価なキットだけ
ホーム アシスタントが代替手段を提供します。無料のオープンソースのスマート ホーム ソフトウェアには、独自の音声アシスタントが備わっています。音声コマンドを Assist で処理できるテキストに変換し、Assist のテキスト応答を音声に変換してスマート スピーカーで再生するパイプラインを設定できます。
これを機能させるには、スマート スピーカー ハードウェアが必要です。ホーム アシスタント音声プレビューなどの既製のスマート スピーカーを購入して、ホーム アシスタントで使用することも、独自に構築することもできます。私は後者のオプションを選択しました。地元のスマート スピーカーがどの程度機能するかをテストするためのより安価な方法だったからです。
Seeed Studio の reSpeaker Lite 音声アシスタント キットを選択したのは、2 つのマイク アレイとオンボード オーディオ処理を備えた開発ボード、ホーム アシスタントと通信するための ESP32、音声応答を再生するためのスピーカー、およびシンプルなエンクロージャなど、オープンソースのスマート スピーカーを構築するために必要なものがすべて含まれていたためです。価格は 30 ドル未満で、組み立てもそれほど難しくありませんでした。
それを構築し、関連するファームウェアをフラッシュしたら、ホーム アシスタントに接続しました。速度を上げるために、独自の音声パイプラインを設定するのではなく、Home Assistant Cloud サブスクリプションの一部として含まれている Home Assistant Cloud の音声合成 (STT) および音声合成 (TTS) 処理を使用しました。やがて、スマート スピーカーをテストする準備が整いました。
オンボードのオーディオ処理と 2 つのマイク アレイがうまく機能します。スマート スピーカーのすぐ隣にある Hi-Fi スピーカーで音楽を再生しているときでも、ウェイク ワードを検出してコマンドを理解することができました。ウェイクワード検出は独自のスマートスピーカーほど強力ではありませんが、今のところ私のニーズには十分以上です。
- ブランド
-
シードスタジオ
- CPU
-
ESP32-S3R8
reSpeaker Lite 音声アシスタント キットには、2 つのマイク アレイ、事前はんだ付けされた XIAO ESP32-S3 コントローラー、およびオンボードの自然言語理解、干渉キャンセル、音響エコー キャンセル、ノイズ抑制、および自動ゲイン制御を備えた XMOS XU316 オーディオ プロセッサが含まれています。 5W スピーカーを接続すると、ESPHome 経由でホーム アシスタントに接続できる独自のローカル音声アシスタントを作成できます。
Home Assistant の Assist ですぐにできること
音声でスマートホームをコントロール
ホーム アシスタントのネイティブ アシスト音声アシスタントは、コマンドを理解して関連するアクションを実行するために AI を活用したスマート機能を使用しません。代わりに、ユーザーの発言をテキストに変換し、そのテキストをサポートされている文パターンのライブラリと照合しようとします。一致するものが見つかった場合は、適切なアクションが実行されます。
たとえば、Assist に「リビングルームの照明をつけて」と依頼すると、そのパターンと関連する意図が一致して照明が点灯します。 「リビングルームの照明をオンにする」「リビングルームの照明をオンにする」「リビングルームの照明をオンにする」など、さまざまな表現を使用できます。
ただし、すべてのフレーズのバリエーションが文型に含まれているわけではないため、「リビング ルームで、電気をつけてください」のような言い方は機能しません。これは、Assist が、クラウドでコマンドを処理し、自然言語処理を使用してユーザーの意図を理解する Alexa や Google Home のようなものほど多用途ではないことを意味します。
ただし、単純なコマンドを使用すると、ほとんどの場合、Assist はユーザーの要求を理解し、反応時間が速くなります。たとえば、新しく構築したスマート スピーカーを使用して、アシスタントに照明を消すように依頼すると、1 秒以内にそれが行われます。これは、Alexa が行うことと同等です。公開するものを制限し、明確な名前とエイリアスを使用することで、Assist の応答性を向上させることができます。
Assist はデバイスを制御するだけではありません。天気を聞いたり、タイマーを開始したり、買い物リストに商品を追加したりすることができます。
AI を活用したスマートな会話エージェントを追加する
Assist が役に立たない場合、LLM が役立ちます
Assist だけではできないことは、独自のスマート スピーカーのように、より広範で一般的な質問に答えることです。たとえば、Alexa に 2022 年に最も興行収入を上げた映画は何かと尋ねると、答えが得られます。アシストは助けがなければこれを行うことはできません。
ただし、できることは、LLM を Assist の会話エージェントとして接続することです。 Assist 自体がクエリを処理できない場合は、代わりに LLM に渡されます。 OpenAI の API や独自のハードウェア上で実行されるローカル LLM などのオプションを使用すると、これらの質問に答えることができる頭脳を Assist に与えることができます。
さらに優れているのは、Assist がスマート ホームを制御できるようになるということです。 Assist が使用する定型文に固執する必要はありません。 「ここは少し暗すぎる」などと言うと、LLM はあなたが照明をつけたいと推測し、それを実現します。
LLM 会話エージェントを使用してスマート スピーカーをセットアップしたところ、必要なことはすべて実行されるようになりました。 Alexa と同じように、スマート ホームを制御したり、タイマーを開始したり、一般的な情報を尋ねたり、音楽を再生したりできます。私は現在クラウド LLM を使用していますが、大金を稼いだら、まともな AI リグを購入して、ついにスマート スピーカーを完全にローカルで実行できるようになります。
独自のスマート スピーカーに縛られる必要はありません
Alexa などのスマート音声アシスタントの使用は便利かもしれませんが、欠点が多すぎます。オープンソースのスマート スピーカーには本当に満足しているので、「アレクサ、さようなら」と言う時が来ました。
関連情報は以下のリンクからご確認いただけます