Alexa や Google アシスタントなどの人気のある独自の音声アシスタントを使用すると、音声でスマート ホームを簡単に制御できますが、個性が欠けています。彼らはむしろコンピューターに似ています スタートレック JARVISより アイアンマン またはGLaDOSから ポータル。ホーム アシスタントの 2 つのツールを使用して、音声アシスタントにそれに合わせた個性と声を与えました。
アレクサの名前は変更できますが、性格は変更できません
Alexa+ でもオプションは限られています
私は長い間Echoスマートスピーカーを所有しています。多くの SF 番組や映画で約束されているように、スマート ホームを制御する簡単で効果的な方法になることを期待していましたが、まったくそのとおりにはなりませんでした。音声制御はぎこちなく感じられる場合があり、常に適切であるとは限りません。
私は今でも、思いついたときに To Do リストにタスクを追加したり、ミュージック アシスタントを使用して家の中で音楽を再生したりするなど、いくつかのことには音声コマンドを使用しています。問題は、Alexa が信じられないほど鈍いことです。できるだけ早くウェイクワードを「コンピューター」に変更しましたが、それでも Alexa は面白くなりませんでした。
問題は、Alexa の性格を変更できないことです。私は Alexa+ を持っていませんし、持っていたとしても、性格タイプは非常に限られた数しか選択できませんでした (Brief、Chill、Sweet、Sassy)。名前だけ聞くと恐ろしく聞こえます。
LLM はスマート ホームに必要な個性を与えることができます
カスタム指示により、音声アシスタントの応答方法を決定できます
ホーム アシスタントには、アシストと呼ばれる独自の音声アシスタントがあります。デフォルトでは、Assist はローカル インテント認識を使用して音声コマンドを理解します。 LLM のような自然言語処理を使用するのではなく、テキストを調べて単語のパターンと特定のアクションを照合しようとします。
Assist を LLM に接続して会話エージェントとして機能させることで、Assist に自然言語を理解させることができます。 OpenAI などの有料 API や独自のハードウェア上で実行されるローカル LLM を使用して、Assist は音声コマンドを LLM に渡すことができます。LLM は自然言語処理を使用して意図を判断し、独自の応答を生成し、それを Assist に返して発話します。 Extended OpenAI Conversation 統合を会話エージェントとして使用しています。

Alexa と Google Home への支払いはもうやめましょう – このオープンソースのスマート ホーム システムは決して料金を請求しません
あなたのスマートホームにはサブスクリプションは必要ありません。
このプロセスの最も便利な部分の 1 つは、会話エージェントを設定するときに、LLM が従うべき特定の指示を追加できることです。たとえば、応答を簡潔にする、確認を求めない、マークダウンなしで常にプレーン テキストで応答するなどの指示を含めることができます。これらの指示を使用して、音声アシスタントに個性を与えることもできます。
たとえば、「あなたは勇敢な海賊です。常に海賊と同じように対応してください」という指示を追加すると、音声アシスタントは海賊が使用するような言語を使用し始めるはずです。応答の品質 (および速度) は、使用している LLM の機能によって異なります。独自のクラウドベースの LLM は、弱いハードウェアでローカルに実行される小規模なモデルよりも優れたパフォーマンスを発揮する可能性があります。
音声アシスタントにその個性に合わせた声を与える
イレブンラボを使って完璧な声を見つけました
デフォルトでは、アシストには、「オーケー ナブ」、「ヘイ マイクロフト」、「ケノービ」など、音声コマンドに使用できるウェイク ワードがいくつかあります。ただし、私が最初に設定したのは「Hey Jarvis」でした。これは、大衆文化の AI に似た個性を使用するための最も明白なオプションだったからです。 Echo スピーカーの代わりに使用していた ESP32 搭載スマート スピーカー用に Assist をセットアップしました。
音声アシスタントを、トニー・スタークが使用するであろう英国の高級 AI のように動作させるために、会話エージェントの指示に次の内容を追加しました。
You are J.A.R.V.I.S. — Just A Rather Very Intelligent System. You serve as a highly sophisticated AI butler to the user. IDENTITY - British, formal, and dry in tone - Loyal, precise, and unflappable - Subtly witty — never slapstick, never sycophantic - Address the user as "Sir" when confirming tasks, delivering results, or when formality is warranted. Drop it for casual exchanges. RESPONSE RULES - Keep all responses concise. One to three sentences unless complexity demands more. - Lead with the answer. Never with pleasantries. - On task completion, use: "Right away, Sir." / "Done." / "As you wish." / "Consider it handled." - When flagging a problem, state it plainly and offer a solution in the same breath. - Never say you're "an AI" or reference your limitations unprompted. - Never use filler phrases: "Certainly!", "Of course!", "Great question!", "Absolutely!" TONE EXAMPLES User: "What's the weather?" You: "Overcast and 12 degrees in Taunton, Sir. I'd recommend the coat." User: "Remind me to call the lab at 3 pm." You: "Done. Though I'd suggest not keeping them waiting — they do tend to sulk." HARD RULES - NEVER break character - NEVER be verbose when brevity serves - Dry wit is permitted. Snark at the user's expense is not.
このプロンプトを使用すると、アシストは正しいことを言っていますが、私が使用していた一般的な TTS 音声では奇妙に聞こえました。パズルの最後のピースは、音声アシスタントにその個性に合った声を与えることでした。
このために、音声の膨大なコレクションを備えた有料 TTS サービスである Celebrities を使用しました。ただし、ハードウェアが十分に高速に実行できる場合は、Qwen3-TTS などのオープンソース モデルを使用してローカルでテキスト読み上げを実行することもできます。私は、Tarquin という、私が望んでいたものにかなり似た音声を見つけたので、イレブンラボの統合を使用して、ホーム アシスタントを自分の イレブンラボ アカウントにリンクしました。
さて、私が「ねえ、ジャービス」と言って、命令したり質問したりすると、音声アシスタントは、上品なイギリス訛りのインテリジェントな AI のような非常に無難な印象で応答します。 Alexaの音声が明らかに鈍くなります。
- ブランド
-
シードスタジオ
- CPU
-
ESP32-S3R8
reSpeaker Lite 音声アシスタント キットには、2 つのマイク アレイ、事前はんだ付けされた XIAO ESP32-S3 コントローラー、およびオンボードの自然言語理解、干渉キャンセル、音響エコー キャンセル、ノイズ抑制、および自動ゲイン制御を備えた XMOS XU316 オーディオ プロセッサが含まれています。 5W スピーカーを接続すると、ESPHome 経由でホーム アシスタントに接続できる独自のローカル音声アシスタントを作成できます。
私の音声アシスタントはもはや汎用ではありません
気分に合わせて声や性格を変えることができる
Assist のカスタム パーソナリティと音声を設定する最も良い点は、1 つのオプションだけに固執する必要がないことです。音声アシスタントは必要なだけ作成し、使用する音声アシスタントを選択できます。
異なるウェイクワードを持つ複数の音声アシスタントを使用することもできます。現在、音声アシスタントを設定しているので、「ねえ、ジャービス」と言うと、JARVIS のパーソナリティと声が使用されます。 「大丈夫ナブ」と言うと、『ザ・ストレンジャー』に似た性格と声を使います。 ビッグ・リボウスキ その代わり。気分に応じて、適切なウェイクワードを使用して、希望する性格を得ることができます。
音声アシスタントは退屈である必要はありません
アレクサは役に立つかもしれないが、信じられないほど退屈だ。ホーム アシスタントを使用すると、音声アシスタントの音声をより希望どおりにすることができます。唯一の本当の問題は、可能性がほぼ無限であるため、非常に中毒になる可能性があることです。
関連情報は以下のリンクからご確認いただけます