韓国の科学者は、AIが騒がしい環境でマイクの代わりになることを証明した

in tech

近年、AI テクノロジーが飛躍的に進歩していることは周知の事実であり、2026 年には、少なくとも私たちの多くにとって、AI システムが日常生活に定着しています。しかし、AI テクノロジーが従来のマイクの使用方法を変えるだけでなく、完全に置き換える日が近いかもしれません。

韓国で開発されている技術(それ自体が革命的です)があり、AI が私たちの日常生活で従来のマイクをどのように強化し、それに取って代わることができるかについての憶測への扉を開きました。

画面上の 3D Google 翻訳ロゴ。

Google 翻訳に Android で発音練習用の AI コーチが登場

Google 翻訳 20 歳の誕生日プレゼント。

マイクは着実に進化している

私たちは燭台電話から長い道のりを歩んできました

決して最高品質ではない平均的なラップトップの内蔵マイクの主な欠点を無視しても、今のマイクはかつてよりも大幅に優れています。ほとんどのスマートフォンは音声分離機能を備えており、まさにその名の通りの機能を備えています。バックグラウンド ノイズを低減し、話者の音声を分離して、よりクリアな音声を実現します。頻繁に旅行する人や、通勤中に電話を受ける人には、この機能が非常に役立ちます。

しかし、音声分離は何も新しいことではありません。 Apple は iOS 15 アップデート (2021) から音声分離機能の展開を開始し、Samsung も同じ年に「Voice Focus」設定の導入を開始しました。

最新のマイクでは不十分な点

私たちが定期的に直面するマイクの苦戦

マイクは決して確実なものではなく、オーディオ技術は依然として大きな周囲の騒音や振動に直面すると苦戦しています。言うまでもなく、ポッドキャスト、音楽、またはビデオのナレーションを制作するための最高品質のマイクには、伝説的な「ポッドキャスター マイク」である Shure SM7B のように、高額な値札が付いています。

これは、産業現場、緊急通報、最新のマイクの品質の影響を受ける可能性のある明瞭な通信に依存する騒々しい環境などの高圧の状況では有害となる可能性があります。しかし、AI が私たちのコミュニケーション方法を完全に変える日は近づいているのでしょうか?

ここでAIが登場します

AI は私たちの日常のマイクを改善できるでしょうか?

手に持っているのはAnker Soundcore Work AIレコーダー。 クレジット: タイラー・ヘイズ

AI の明らかに成功している側面の 1 つは、高度なパターン認識です。これを「Deep Face」テクノロジーと組み合わせると、AI を使用して筋肉の動きだけからリアルな音声を作成できるようになります。韓国の浦項科学技術大学 (POSTECH) の科学者たちは、首の小さな動きを音声に変換するネックバンドを作成するために AI テクノロジーを最適化し、新しい形式のコミュニケーションへの扉を開きました。

この技術は現在、言語障害を持つ人や喉頭切除患者など、話すことができない人々に音声を取り戻すことを目的としているが、彼らが開発したデバイスは、いつか従来のマイクに取って代わる可能性がある。

しかし、本当に効果があるのでしょうか?

専門外の用語で言うと

平たく言えば、POSTECH チームは、小型カメラとモーション センサーを備えたシリコン製ネックバンドを作成しました。これらは、言葉を口にするときに皮膚と首の筋肉がどのように動くかを監視し、口と喉がどのように言葉を作り出すかについての現実的なロードマップを作成します。

これらの小さな動きは AI モデルに入力され、発声を必要とせずに意図された単語を識別するように設計されています。

AI が単語を認識すると、それが音声に合成されます。ネックバンドには、着用者の正確な音声を学習できる AI モデルが搭載されています。

提案するウェアラブルSSIシステムの概要 クレジット: POSTECH

News Atlasの報道によると、研究者らによると、音声モデルのトレーニングには10分未満の録音が必要で、ディープフェイクの作り方と同じように、ネックバンドがユーザー自身の声の特徴やイントネーションで話すことができるようになるという。

AI ネックバンドは機能していますが、まだ初期段階にあり、定期的に使用する前に解決すべき問題がまだあります。これまでに実行されたテストでは、26 語の固定語彙 (NATO アルファベットの「Alpha」「Bravo」「Charlie」など) の使用が含まれています。使用された 26 単語全体で、85.8% の精度を達成しました。ただし、ユーザーが歩いたり頭を動かしたりすると、精度は 39.72% 低下しました。

従来のマイクをここで置き換えることができます

AIによるテクノロジー乗っ取りへの次のステップ

このネックバンドは、まだ誕生したばかりの段階ではありましたが、ある特定の領域、つまり周囲の騒音に直面した場合に驚異的な効果を発揮しました。研究チームによると、約90dB(混雑した建設現場の騒音レベルにほぼ相当)のホワイトノイズを使用したテストでは、システムは全体を通して33.75dBという安定した信号対雑音比を生成し、これは同じ条件下で市販のEMGシステムを上回ったという。

ここで、このようなネックバンドが医療用途から離れて日常生活に取り入れられる利点がわかりました。 Cyborg and Bionic Systems に論文を発表した著者らは、現在の技術では不十分な特定の環境において、このようなネックバンドが従来のマイクの代わりになる可能性があると示唆しています。たとえば、産業施設、緊急対応、航空、海上作戦、軍事シナリオでは、マイクのパフォーマンスが背景の騒音や振動の影響を受ける可能性があります。

POSTECHで研究を主導したSung-Min Park教授は、この技術が「言語障害を持つ患者が自分の声を取り戻せる日を加速する」という希望を述べているが、続けてネックバンドの可能性についても述べ、「喉頭摘出患者の補助、騒がしい産業環境でのコミュニケーション、さらには無言の会話のサポートなど、幅広い用途の可能性があるため、注目に値する技術だ」と述べた。


従来のマイクに別れを告げるまでどれくらいかかるでしょうか?

パーク教授が述べたように、このようなクールな (そして潜在的にディストピア的な) テクノロジーが非言語コミュニケーションを維持できるのではないかと推測するのは楽しいです。ただし、これらの AI ネックバンドをすぐに店頭で購入できるようになるわけではありません。 POSTECH の次のステップでは、チームはより多くのユーザーでモデルをテストし、語彙を拡大して最終的に現実的なコミュニケーションを模倣し、より多くの体の動きの理解を向上させています。

したがって、騒がしい環境でよりクリアなコミュニケーションが得られることは大きなメリットであり、利用可能なテクノロジーを大幅に変革するために AI が使用されていることは明らかですが、このような AI ネックバンドで従来のマイクを置き換えるにはまだ遠い道のりかもしれません。


関連情報は以下のリンクからご確認いただけます

公式情報はこちら

関連記事

前の投稿
すべての Microsoft Outlook ユーザーが知っておくべき 10 のハック
次の投稿
このAmazon Fire TVサウンドバーは現在150ドルオフです