見出し画像

Apple、iOS18でAI新機能/日本語特化のChatGPT登場/Meta Llama3とGoogle Gemini Pro1.5がスゴイ/NotingからChatGPTイヤホン登場/Adobe Expressスマホアプリ登場/Premier Pro SoraやRunwayも使えるように【週刊AIのニュース 2024年4月22日号】

こんにちは。AIのある暮らしです。

2024年4月15日〜4月21日の「週刊AIのニュース」をお届けします。


【1】文章生成AIニュース

「ChatGPT」「Gemini」の比較ならスペック以上に面白い“個性と違い”はこれだ

本記事は、OpenAIの「ChatGPT」とGoogleの「Gemini」を比較しており、それぞれの生成AIサービスの強みや弱みを専門家のレビューと検証結果をもとに詳しく解説しています。

般に言語ベースのタスクにはChatGPTが、マルチモーダルタスクにはGeminiが向いているとされています。

検証では、GeminiのLLM「Gemini Pro」が長文の処理や複雑な推論に強い一方で、数学的推論や多肢選択式の問題においてバイアスが生じやすいなどの弱点も指摘されています。

また、新型の「Gemini Advanced」は説明や検索において優れた性能を見せたが、ChatGPTと同様に一貫性の欠如や不正確な回答を出力する問題があります。最終的に、Geminiは効率的な情報処理に優れ、ChatGPTはユーザーインターフェースで秀でていると結論付けられています。

ChatGPTのビジネス利用が急増、米国では5人に1人が使用調査結果

ピュー研究所の最新調査によると、米国でChatGPTのビジネス利用が急増しており、成人の20%が仕事で使用していることが明らかになった。2022年のChatGPT公開以降、AI技術への関心が高まり、多くの人が科学、ビジネス、メディア業界でこのツールを利用しています。

AIに対する評価は分かれており、一部では過大評価されているとの指摘もありますが、技術の普及とその影響は明確で、今後もさらなる変革が期待されています。

ChatGPTに手伝ってもらってExcelマスターになる方法

この記事では、ChatGPTを活用してExcelをマスターする方法が紹介されています。Microsoft 365のCopilotではExcelに対するサポートがまだ完全ではないため、ChatGPTの利用が推奨されています。

具体的には、社員データベースのような表を作成する際に、ChatGPTに必要な項目を尋ねることで、効率的にフォーマットを作成できます。また、Excelでの作業指示をプロンプトとして入力することで、適切な出力を得ることが可能です。この方法を用いることで、手間と時間を節約しながら、より効果的にExcelの操作をマスターできます。

「ナッシング」からChatGPTを搭載したイヤホン2型が登場 日本市場に本格進出

イギリスのテクノロジーブランド「ナッシング(NOTHING)」は、新型イヤホン「ナッシングイヤー」と「ナッシングイヤー(a)」を発表しました。これらのイヤホンは、オーディオ業界で初めてChatGPTを搭載し、ナッシングのスマートフォン「ナッシングフォン」にChatGPTアプリを同期させることで、AIとの対話が可能になります。

ナッシングのCEOカール・ペイは日本でのイベントを行い、日本がアメリカに次ぐ大きな市場であると述べ、日本市場への本格進出を発表しました。日本オフィスの黒住吉郎マネージングディレクターも登壇し、日本のデザインとテクノロジーへの敬意を表しました。新製品は特定の店舗で先行発売されます。

ChatGPT開発のOpenAIが東京オフィス設立。日本語特化AIも数カ月以内に

OpenAIが東京に新オフィスを設立し、日本法人「OpenAI Japan」を立ち上げたことを発表しました。この拠点はアジア初のものであり、日本語に最適化された「GPT-4 カスタムモデル」のリリースも予定されています。日本法人代表には、元アマゾンウェブサービスジャパンの長崎忠雄氏が就任。

OpenAIは日本での企業利用の活性化を図り、さまざまな規模の企業や政府機関での採用事例を増やすことを目指しています。また、パートナーシップを通じて、質の高い「学習データ収集」も重視しており、将来的には日本の言語や文化を学習させる計画です。

GoogleのGemini 1.5 Proに音声認識の新機能が!早く使ってみたい

Googleの最新AI、Gemini 1.5 Proは、音声認識機能を新たに搭載しました。この機能により、動画や音声から情報を収集することが可能になり、特に決算説明会の内容把握や録音されたインタビューの書き起こし、音声付きビデオの分析が容易になります。

Gemini 1.5 Proは、テキスト、コード、ビデオだけでなく、アップロードされた音声も処理できるようになり、多様なコンテンツを一度に処理する能力を持っています。ただし、このAIは現時点で一般ユーザーには公開されておらず、限られた開発者向けに提供されています。

Claude(クロード)とは?Anthropicの最新AIモデルの活用例を紹介

ClaudeはAnthropic社によって開発された最先端の生成AIモデルで、多様な言語タスクに対応します。2023年に一般公開されたClaudeは、自然言語での対話が可能で、文章生成、要約、翻訳、コード生成などを行います。

最新版「Claude3」はマルチモーダル機能を搭載し、より広範な情報処理が可能です。また、AnthropicはOpenAI出身者が立ち上げた企業で、巨額の資金を調達し、高い性能と低コストのバランスで注目されています。APIを通じた外部アプリケーションとの連携も可能で、ビジネスや研究分野での応用が期待されています。

ファミマ、生成AIで一部業務の作業時間を約50%削減 対象となった業務は?

ファミリーマートは、生成AIの導入によって特定の業務で作業時間を約50%削減する成果を達成しました。この成果は、2023年12月から始まった3カ月間の実証実験を通じて得られたものです。削減対象となった業務は、アンケート集計、社内文書・社員教育資料の作成、スーパーバイザーからの問い合わせ対応などで、新たに創出された時間をメディア事業などの高付加価値業務に再配分する計画です。

また、ファミリーマートは生成AIの活用を推進するために全社横断の「生成AIプロジェクト」を立ち上げ、50人のプロジェクトメンバーが6つの領域で業務改善方法の検討や効果検証を行っています。今後は、生成AIを用いた業務削減の事例を社内で競うコンクールを開催し、効率化の実績を社員評価に反映させることで意識改革を促進する方針です。

Meta、無料で商用可の新LLM「Llama 3」、ほぼすべてのクラウドでアクセス可能に

Metaは新しいオープンソースのLLM「Llama 3」を発表しました。この最新モデルには80億パラメータと700億パラメータの2つのモデルがあり、AWS、Google Cloud、Microsoft Azureなどほぼ全ての主要クラウドサービスで利用可能になります。

Llama 3は以前のモデルに比べてデータセットが大幅に増加し、英語以外の言語データも強化されています。この改良により、誤った拒否率が低減し、モデルの応答の多様性が向上しました。さらに、推論やコード生成などの機能も大幅に強化されています。また、MetaはこのAIを活用したAIアシスタント「Meta AI」を自社のサービスにロールアウトしています。

Microsoft⁠⁠、生成AIのプロンプト解釈を最適化するフレームワーク「SAMMO」を発表

Microsoftが新しいオープンソースフレームワーク「SAMMO」を発表しました。このフレームワークは、生成AIや大規模言語モデル(LLM)が長文のプロンプトを効率的に処理できるように設計されています。SAMMOは、プロンプトの最適化を行うための構造的変更を可能にし、従来のRAG(検索拡張生成)方式を進化させるものです。

このフレームワークにより、プロンプトの解釈の正確性が大幅に向上し、プロンプトを静的なテキスト入力ではなく、動的でプログラム可能なエンティティとして扱うことができます。SAMMOはGitHubでオープンソースとして公開されており、幅広いクラウドサービスでの利用が可能です。

【2】画像生成AI関連のニュース

「ウルトラマン」に似た画像提供の生成AI事業者、中国の裁判所が著作権侵害で賠償命令

中国の裁判所は、生成AIによって「ウルトラマン」に類似した画像を作成した事業者に対し、著作権侵害で損害賠償を命じました。この判決は、AI生成コンテンツと著作権の関連性について注目される事例となっています。

被告のAIサービス事業者は、円谷プロダクションが保有するウルトラマンシリーズの著作権を侵害しているとされ、許可なく類似画像を生成させたために、裁判所は画像の生成停止と共に損害賠償を命じました。この判決は、AIと著作権をめぐる国際的な議論に影響を与える可能性があるとも指摘されています。

「Sora」など急速進化の画像生成AI 既存ビジネスで地殻変動や論争も

この記事では、画像生成AIの最新動向として、米OpenAIの「DALL・E」と「Sora」、米アドビの「Firefly」などのプロダクトが中心に取り上げられています。これらの技術は急速に発展しており、特にクリエイティブ業界に大きな影響を与えています。

生成AIが既存ビジネスを変革する可能性がある一方で、生成した画像の著作権問題やクリエーターの失業リスクなど、様々な論争も引き起こしています。また、これらのAIは著作権フリーの画像でトレーニングされており、高品質な画像を生成する能力が評価されていますが、その法的な側面や市場への影響についても議論が必要とされています。

【3】動画生成AI関連のニュース

中国ベンチャーの動画生成AI、4K画質で巨大のショートドラマ市場に挑む

この記事は、中国のベンチャー企業「七火山科技」が開発した動画生成AI「Etna」に焦点を当てています。Etnaは4K画質で15秒の動画を生成し、60fpsで動画を滑らかに再現する技術を備えています。この技術は、ショートドラマ市場での応用を目指しており、特に動画の長さ、解像度、ディテール、言語理解度で他のモデルを上回っています。

さらに、Etnaはテキストプロンプトに基づいて動画を生成し、具体的なキャラクターの動きや表情、感情を反映させることが可能です。これにより、より忠実で表現力豊かな動画を作成することができます。

七火山科技はまた、動画編集AI「LavaAI」と、AIショートドラマ配信プラットフォーム「miniTV」も開発しており、これらのツールを用いてショートドラマ市場に革命をもたらそうとしています。会社はすでにシャオミと提携し、ショート動画の制作や海外でのショートドラマの現地化を支援しています 、

Adobe Premiere ProがAI対応。映像撮影した後も加工が自由自在に

アドビの映像編集ソフト「Premiere Pro」が、生成AI「Adobe Firefly」に対応しました。これにより、Premiere Proでの編集作業において、背景の不要な物を消去したり、存在しなかった物体を追加するなどの高度な編集が可能になります。

また、撮影時に気付かなかったミスや、後から変更したい箇所も簡単に修正できるようになります。これにより、ユーザーはより自由自在に映像を加工でき、ハリウッド級の作品作りが手軽に行えるようになります。

Adobe、Premiere Proに追加する生成AI機能プレビュー、OpenAI Soraなど他社AIも

Adobeは「Premiere Pro」に新しい生成AI機能を追加予定であり、そのプレビューを公開しました。この機能により、動画編集中にオブジェクトの追加や削除、既存クリップの拡張が可能になります。

さらに、AdobeはFireflyモデルに加えて、OpenAIやRunwayなどのサードパーティ生成AIモデルもPremiere Proで利用できるようにする計画を明らかにしました。これにより、クリエイターはより多様なAIツールを活用して、映像制作の幅を広げることができます。AdobeはこれらのAI機能を商用利用にも対応させ、クリエイターが法的な安心感を持って使用できるよう配慮しています。


【4】モバイルAI関連のニュース

Apple、iOS18で「日常を支える」AI新機能を強化か

AppleはiOS18で新たなAI機能を導入する予定です。Bloombergの報道によると、これらの機能はユーザーの日常生活で役立つよう設計されています。特に、デバイス上で完結するAI処理により、プライバシーが強化され、応答速度が向上し、データ通信量が削減されます。

また、AppleはAI機能の処理能力よりも、その有用性を強調するマーケティング戦略を取るとしています。この新機能は、GoogleやOpenAIとの連携を通じてさらに強化される見込みです。

<Samsung>「Galaxy AI」の利用端末が拡張 4月18日(木)よりGalaxy国内版モデルに「Galaxy AI対応」開始

Samsungが最新のOne UI 6.1アップデートを通じて、そのAI機能「Galaxy AI」の利用可能な端末を拡張しました。このアップデートは、Galaxy国内版モデルに適用され、特にGalaxy S24シリーズなどの最新フラッグシップモデルで利用できるようになります。

Galaxy AIは、翻訳、要約、検索、画像編集などのAI機能を提供し、ユーザーが効率的に日常業務を行えるように支援します。この技術はサムスンの「オンデバイスAI」とクラウドベースのAI技術を組み合わせて使用し、プライバシー保護と高い利便性を提供します。

Adobe Expressアプリ公開 スマホだけで動画編集・ロゴ制作、SNS予約投稿

アドビは、新しいモバイルアプリ「Adobe Express」を公開しました。このアプリは、Adobe Fireflyの生成AI機能を含むオールインワンのAIコンテンツ作成ツールです。ユーザーはスマートフォンだけで、動画編集、ロゴ制作、チラシ作成、SNSの予約投稿などを行うことができます。iOS版とAndroid版が公開されており、無料で利用可能です。

Adobe Expressアプリでは、動画のクリップ、画像、音楽を組み合わせて動画を作成でき、アニメーションの追加や高精度のリアルタイム編集も行えます。また、テキストから画像を生成する機能や、テキストに装飾を加える機能など、多様な生成AI機能が備わっています。さらに、SNSへの投稿予約機能も搭載されており、ユーザーは投稿の計画やスケジュール設定を簡単に行えるようになっています。

「Facebook」や「Instagram」でAIアシスタント「Meta AI」が提供開始

Metaは、そのプラットフォームにAIアシスタント「Meta AI」を導入しました。このAIアシスタントは、Instagram、Facebook、Messenger、WhatsAppに追加され、特に英語で利用可能です。

Mark Zuckerberg CEOによれば、Meta AIは最新の大規模言語モデル「Llama 3」を利用して強化され、テキスト生成、質問応答、画像生成などの機能を提供します。また、米国では「Ray-Ban Metaスマートグラス」や「Meta Quest」での利用が可能です。このアップデートにより、Meta AIは非常に高度なAIアシスタントとされています。

【5】その他のニュース

OpenAIが開発した音声生成モデル「Voice Engine」が見せた実力と課題

OpenAIが開発した音声生成モデル「Voice Engine」についての最新の成果が公表されました。このモデルはテキストと15秒間の音声サンプルを使用して、元の話し手に近い自然な音声を生成することができます。

2024年3月29日に行われた小規模プレビューでは、この技術の持つ可能性と同時に、悪用のリスクも明らかになりました。OpenAIはこれらの予備的な知見をもとに、Voice Engineの技術をより広範囲に展開するかどうかを検討中です。この音声生成モデルは、リアルで感情的な音声を生成する能力が高い一方で、その悪用リスクに対する慎重なアプローチが求められています。

TikTok、Instagramのような写真共有アプリ「TikTok Notes」を試験提供

TikTokは新しい写真共有アプリ「TikTok Notes」を試験的にリリースしました。このアプリは、写真に見出しやキャプションを加える機能を提供し、Instagramに対抗するものです。

現在、オーストラリアとカナダで限定的なテストが行われています。TikTok Notesは、写真とテキストコンテンツ専用のスペースを提供し、ユーザーが旅行のヒントや毎日のレシピなどを共有するライフスタイルプラットフォームとして位置づけられています。このアプリは、日々の出来事を詳細に説明するためのギャップを埋めることを目指しており、ユーザーが写真に対してコメントを受け取るインタラクティブな体験を提供します。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内が届きます。また「指示文」と送信して頂ければ、「本当にしごとに役立つ指示文20選」ががもらえます。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!

公式グッズの販売はこちらから


この記事が気に入ったらサポートをしてみませんか?