見出し画像

完全なオープンソースのAIウェアラブルデバイス ChatGPTは今、ずっと怠けることが少なくなるべきです

サイード・エザティ 2024年2月5日翻訳


今日のメールで: 👼 このAIは、赤ちゃんの目を通して世界を見ることで言語を学びました

🎼 Metaは、ディープフェイクオーディオに秘密のウォーターマークを付ける方法を見つけました

🤗 Hugging Faceは、OpenAIのカスタムGPTに対抗するオープンソースのAIアシスタントメーカーを立ち上げました

🧰 13の新しいAIパワードツールとリソース。ツールの完全なリストについては、オンラインバージョンを確認してください。

サインアップ | 広告する | ChatGPT | オンラインで読む

トップニュース

このAIは、赤ちゃんの目を通して世界を見ることで言語を学びました


AIモデルは、「ベビーベッド」や「ボール」といった単語を認識する方法を学びました。これは、18ヶ月の赤ちゃんであるサムの視点から撮影されたビデオを研究することによってです。このユニークなアプローチは、2024年2月1日にScience誌に掲載された研究で詳述されており、頭部に取り付けられたカメラからの61時間の映像を利用してニューラルネットワークを訓練しました。赤ちゃんの視覚的および聴覚的体験を通じて学習するこの方法は、言語に関する生得的な知識が学習に必要であるという考えに挑戦し、人間の言語獲得への新しい洞察を提供します。

AIは、サムの日常活動からの250,000語とそれに対応する画像にさらされ、コントラスト学習と呼ばれるプロセスを通じて特定の単語と画像を関連付ける方法を学びました。テストでは、AIは62%の成功率で単語を画像に正確にマッチングさせることに成功し、これは偶然よりも著しく高く、はるかに大きなデータセットで訓練された他のAIモデルと比較しても同等です。しかし、未知の例へのこの知識の一般化能力は変化し、訓練データで頻繁に登場し、一貫した外観を持つオブジェクトで最も良いパフォーマンスを示しました。

この研究の発見は、異なる感覚入力間の関連を形成する能力を超えた特別なメカニズムが言語獲得に必要であると提案する理論に反証を提供します。しかし、単一の子供の経験からのデータに依存することは、結果の一般化可能性に関する疑問を提起します。それにもかかわらず、この研究は、AIが人間の学習プロセスを模倣し、洞察を提供する可能性を強調していますが、実際の赤ちゃんの学習に不可欠な触覚的および対話的体験を再現できないといった制限も認めています。

Metaは、ディープフェイクオーディオに秘密のウォーターマークを付ける方法を見つけました。


AudioSealは、Facebook Researchによって開発された新しいシステムで、知覚できないウォーターマーキングを通じてAI生成のディープフェイクオーディオを検出するように設計されています。AIの音声合成が向上するにつれて、本物と偽物の人間の話し言葉を区別することが難しくなり、声のクローニングやディープフェイクのような悪用の可能性が生じています。AudioSealは、合成音声にウォーターマークを埋め込むことで、操作されたオーディオを識別できるようにします。

従来の受動的検出方法は、進歩した合成技術に対して効果がなくなっています。対照的に、AudioSealはアクティブなアプローチを使用し、生成された声にマーキングを施すことで技術の進歩に適応します。これは、ウォーターマークを埋め込むためのジェネレータと、ウォーターマークが施されたオーディオを識別するためのディテクターから構成されており、正確な位置特定とオーディオの歪みに対する強靭さを提供します。

AudioSealは、検出速度と効率性で以前のモデルを超え、一般化、正確な操作の局所化、編集技術に対する強靭さを提供します。しかし、機密性、倫理的懸念、標準化とユーザーの同意の必要性などの課題にも直面しています。その進歩にもかかわらず、AudioSealは合成メディアの進化する課題に取り組む広範な努力の一部であり、真実性と倫理的な慣行の重要性を強調しています。

完全なオープンソースAIウェアラブルデバイス

これはAdeus、オープンソースのAIウェアラブルデバイスです - そしてこのリポジトリでは、あなた自身のセットアップ方法について案内されます!ハードウェアを購入すること(約100ドル、そしてRaspberry PI Zeroバージョンを完成させるとさらに安くなります)から、バックエンドの設定、ソフトウェアのセットアップ、そしてあなたのウェアラブルの使用を開始するまで!

Adeusは3つの部分から構成されています:

モバイル/ウェブアプリ:ユーザーがチャットを通じて自分のアシスタントやデータと対話できるインターフェイス。

ハードウェアデバイス(現在はCoral AIですが、間もなく15ドルのRasberry-Pi Zero Wになります):これはすべてを記録し、バックエンドに送信して処理されるウェアラブルになります。

Supabase:私たちのバックエンドおよびデータベースで、データを処理して保存し、LLMと対話します。SupabaseはオープンソースのFirebase代替品であり、「バックエンド・アズ・ア・サービス」で、Postgresデータベース、認証、エッジ機能、ベクトル埋め込みなどを無料(最初は)で、非常に簡単にセットアップできるようにします!

Hugging Faceは、OpenAIのカスタムGPTに対抗するオープンソースのAIアシスタントメーカーを立ち上げます。

Hugging Faceは、オープンソースのAIコードリポジトリで知られるニューヨーク市を拠点とするスタートアップで、Hugging Chat Assistantsという新製品を発表しました。この製品では、ユーザーが無料で自分自身のAIチャットボットを作成でき、OpenAIのカスタムGPTビルダーに似たサービスを提供しますが、関連するコストはかかりません。

OpenAIの提供物がGPT-4のような独自のモデルに依存するのに対し、Hugging Chat Assistantsは、MistralのMixtralやMetaのLlama 2など、さまざまなオープンソースの大規模言語モデル(LLM)によって動作することができます。Hugging Faceのアプローチは、ユーザーのカスタマイズと広範なモデルから選択する自由を重視しています。

さらに、ユーザーがカスタマイズしたアシスタントを共有およびアクセスできる中央リポジトリを作成しました。AIコミュニティの中には、カスタマイズ可能性と無料アクセスのためにHugging Chat AssistantsをGPTよりも優れていると見る人もいますが、OpenAIのモデルが現在提供しているウェブ検索機能や自動ロゴ生成といった機能が欠けているなどの制限があります。

Hugging Chat Assistantsの発売は、OpenAIのような独自のAIモデルに対抗する競争力のある代替品を提供しようとするオープンソースコミュニティの努力における重要な一歩と見なされています。

この記事が気に入ったらサポートをしてみませんか?