見出し画像

Microsoftの言語モデル「Phi-3」/日経新聞の言語モデル「NiLM」/Adobe 新画像生成AI「Firefly Image 3」/OpenAI「Sora」をテストしている映像作家が明かす「その特徴と限界」/生成AIで死者を“復活”させるビジネスは人を救うのか/グーグルAIプロンプト最適化の電子書籍を発行/AIの収益化競争で、マイクロソフトがグーグルに先行【週刊AIのニュース 2024年4月29日号】

こんにちは。AIのある暮らしです。

2024年4月22日〜4月28日の「週刊AIのニュース」をお届けします。


【1】文章生成AIニュース

Microsoft、商用利用可のSLM「Phi-3」リリース スマホで動くモデルも

この記事では、マイクロソフトが新しい小規模言語モデル「Phi-3」を発表したことを報じています。このモデルは三つのサイズ(mini、small、medium)で展開され、最小モデルのPhi-3-miniは38億パラメータで訓練され、すでにAzure AI Studio、Hugging Face、Ollamaで利用可能です。

Phi-3モデルは、主要なベンチマークで同じサイズまたはより大きなサイズの言語モデルよりも優れたパフォーマンスを示しており、例えばPhi-3-smallは、OpenAIのGPT-3.5 Turboなどよりも優れた結果を発揮しています。

商用利用も可能なPhi-3-miniは、10倍の大規模言語モデル(LLM)に匹敵する機能を持ちながら、サイズが小さいため実行コストも低く、iPhoneのA16 Bionicチップ上で高速に動作することができます。これにより、インターネット接続が困難な環境や低コストでAIを活用したい分野に適しています。

AppleがAIスタートアップ企業を買収してた。その意図は…?

この記事では、Appleがフランスのスタートアップ企業Datakalabを買収したことについて報じています。DatakalabはオンデバイスでのAI処理を得意とする会社で、この買収によりAppleはiPhoneでの生成AIの能力を強化しようとしていることが示唆されています。特に、AppleはSiriを生成AIで強化する計画を持っており、端末内での処理を強化することで、データのセキュリティと顧客プライバシーを重視する方向性が明らかにされています。

この買収は、演算パワーが大きく必要とされる生成AIをiPhoneで効率的に動作させるための戦略的なステップであることが強調されています。また、AppleはGoogleの生成AI Geminiとの連携も視野に入れているとのことで、今後の発表が待たれる状況です。

日経新聞、経済情報特化の大規模言語モデル「NiLM」開発

日本経済新聞社は、経済情報に特化した大規模言語モデル「NIKKEI Language Model (NiLM・にるむ)」を開発しました。このモデルは、インターネット上の公開情報を使わず、日本経済新聞社が保有する約40年分の記事データを基に構築されています。これにより、日本の経済情報に特化した専門的な言語モデルが実現されました。

NiLMは、130億パラメーターモデルと700億パラメーターモデルの二つのバージョンがあり、両モデルとも社内の特定のタスクにおいて性能改善が確認されています。これは、日経イノベーション・ラボによるAIプロダクト群の研究開発で利用される予定です。

この開発は、日本経済新聞社の著作権情報を活用し、経済に特化した知識が必要な場面での利用が期待されています。日本語コーパスのトークン量は約1億規模に達しており、「日本経済新聞社グループにしかできない最高品質の大規模言語モデル」と評されています。

生成AIの収益化競争で、マイクロソフトがグーグルに先行

この記事では、マイクロソフトとアルファベット(グーグルの親会社)が2024年第一四半期の決算を発表し、両社ともに予想を上回る業績を報告したことが紹介されています。特に、マイクロソフトは生成AIの商業化において優れた成果を示しています。

マイクロソフトのCEOサティア・ナデラは、同社のGitHub CopilotやOffice 365のCopilot、Microsoft Azure Cloudを通じてのOpenAIのサービスが顧客に大きく受け入れられていることを強調しました。これらのサービスを通じて、マイクロソフトは顕著な顧客増加と売上の向上を達成しています。

一方、アルファベットのCEOスンダー・ピチャイは、Google Cloudの生成AIツールを使用する開発者が100万人を超え、生成AIスタートアップの多くがGoogle Cloudを利用していることを報告しています。しかし、ピチャイは具体的なサブスクリプションプランのサインアップ数については明言を避けています。

両社の戦略的な違いとして、マイクロソフトがAIをビジネスに直接統合し、収益化に成功しているのに対し、アルファベットはまだ生成AIを本格的に収益化する段階には至っていないことが示されています。この差は今後の市場動向や投資家の評価に大きな影響を与える可能性があります。

Microsoft、AI需要で2桁台の増収増益 「CopilotがAIの新時代を推進」とナデラCEO

この記事は、Microsoftの2024年第1四半期(1月から3月)の決算に焦点を当てています。同社の売上高は前年同期比17%増の618億5800万ドル、純利益は20%増の219億3900万ドルで、アナリストの予測を上回る結果となりました。

サティア・ナデラCEOは、Copilot製品がAI変革の新時代を推進し、あらゆる業界におけるビジネス成果を向上させていると述べています。

また、企業向け「Office 365」の売上が15%増となるなど、Productivity and Business Processes部門も堅調でした。全体として、MicrosoftはAI需要に応えるために設備投資とリースに140億ドルを費やし、短期的には需要が供給を上回っている状況です。

グーグル、AIプロンプトの最適化に役立つ2つの新しいリソースを無料で公開

Googleは、「Gemini for Google Workspace」ユーザー向けに、AIプロンプトの技術をマスターするための新しいブログシリーズと電子ブック「Prompting guide 101」を無料で公開しました。これらのリソースは、GoogleのAIアシスタントを仕事で最大限に活用する方法を学ぶのに役立ちます。

ブログシリーズは、効果的なプロンプトの作成についてのヒントやコツを提供しており、AIチャットボットとの対話を始める際のきっかけとしてのプロンプトの重要性を解説しています。主な内容としては、プロンプトの作成における「Persona」(ペルソナ)、「Task」(タスク)、「Context」(コンテキスト)、そして「Format」(フォーマット)の4つの要素が紹介されています。

さらに、「Prompting guide 101」では、マーケティングやカスタマーサービスなど特定の職業に適したプロンプトの例文を提供しており、具体的なアドバイスを通じて、AIチャットボットの利用を最大化する方法を学べます。このガイドは、他のAIプラットフォームにも応用可能です。

生成AIで死者を“復活”させるビジネスは人を救うのか 指摘される懸念とは?

この記事では、生成AIを使用して亡くなった人々を「復活」させるビジネスについて取り上げています。特に中国で展開されているこのビジネスは、亡くなった人の画像や声を学習させ、デジタルクローンを作成して家族との対話を可能にします。同様のサービスは米国を含む世界中で注目を集め、広がりを見せています。

サービスの肯定的な側面として、亡くなった家族と対話できることが心の癒やしにつながる可能性がある点が挙げられます。しかし、この技術は「ディープフェイク」とも関連し、倫理的な懸念や悪用の危険性も指摘されています。過去にはセレブの顔を不適切なコンテンツに使用する事例もあり、デジタルクローンの技術が進むにつれ、これらの問題はさらに複雑になる可能性があります。

このビジネスが人々を救う手段となるか、それとも倫理的、社会的な問題を引き起こすのか、今後の議論と技術の進化に注目が集まっています。

1万8000字入力に対応したMicrosoft Copilotの「ノートブック」を使う

Microsoftの生成AIアプリ「Copilot」に新たに追加された「ノートブック」という機能について説明しています。

従来のCopilotのチャット機能は、2000~4000字の文章に対応していましたが、新しいノートブック機能では最大1万8000字までの長文入力に対応しています。これにより、長文の要約や校正などの作業が可能になり、より多くの情報を明確に指示して入力することで、高精度の文章生成が期待できるようになります。

この機能はWebブラウザーやモバイルアプリ、Windows 11の「Copilot in Windows」アプリで利用できるプレビュー版から使用可能です。

誰もが悩む「名前が出てこない問題」がみるみる解消…ChatGPTと「検索エンジン」の決定的な違い

ChatGPTと検索エンジンの使い分けについて、一橋大学名誉教授の野口悠紀雄氏が語っています。

野口氏は、ChatGPTは検索や読書を効率的に行うためのツールとしての位置付けをしており、「ChatGPT「超」勉強法」という著書を引用しながら、AIが提供する情報の正確さを検証することの重要性を強調しています。

また、検索語が分からない場合の検索技術の進化として、「八艘飛び検索法」を提案しています。これは、ある情報から関連情報へと効率的にアクセスする方法です。

ChatGPTは医師の10倍の速さで事務作業をこなす

ChatGPT-4は、医師の10倍の速さで患者の退院時報告書を作成し、その品質は専門家パネルによって医師が作成した報告書と同等であると評価されました。

これにより、診察する患者の数を増やす上での妨げとなっていた事務作業の負担が減少することが期待されています。記事は、スウェーデンのウプサラ大学病院で実施された研究に基づいています。

アクセンチュア流「タイパ最強」の生成AI活用術、プロンプト書き方4原則とは?

記事では、アクセンチュアによる生成AI(ジェネレーティブAI)の活用法について紹介されています。特にビジネス領域での使用方法が焦点となっており、生成AIが言語、画像、動画、音声生成と多岐にわたり活用されている状況が説明されています。

アクセンチュアは、生成AIを用いて業務効率を大幅に向上させる手法を推進しており、その一例として「プロンプトの書き方4原則」が紹介されています。これにより、AIを効果的に活用し、ビジネスや公共サービスにおける実装が進んでいる様子が述べられています。

【2】画像生成AI関連のニュース

Adobe Firefly Image 3 Foundationモデルを発表⁠⁠、Photoshopに画像生成機能を装備へ

Adobeは2024年4月23日に「Adobe MAX London 2024」イベントで、新しい生成AIイメージモデル「Adobe Firefly Image 3 Foundation モデル」を発表し、ベータ版を公開しました。この新モデルは、Adobe Photoshopベータ版およびAdobe Firefly web版で使用可能です。

主な新機能としては、自動スタイライズ機能が強化され、新しいスタイルエンジンにより高品質で多様なスタイルの画像を自由に生成できるようになりました。

また、構成参照とスタイル参照を用いて、ユーザーが参照画像に基づいて新しい画像を迅速に生成でき、より高品質な出力が可能です。これにより、プロンプト作成のための試行錯誤が不要になり、より細かなディテールを含んだ画像生成が可能となっています。

さらに、PhotoshopのFirefly機能も進化しており、生成塗りつぶし機能が強化され、「画像を生成」機能が新たに追加されました。これにより、テキスト入力だけで完全な画像を作り出すことが可能になり、背景生成や類似画像の生成も容易になっています。これらの新機能により、クリエイティブな作業がより効率的で、高品質な結果を生み出すことが可能となります。

【3】動画生成AI関連のニュース

OpenAIの「Sora」をテストしている映像作家が明かす「その特徴と限界」【プロンプト全文も】

この記事では、映像制作者ポール・トリロ氏がOpenAIの生成AI「Sora」を使用して映像作品を制作した経験について語っています。トリロ氏はSoraのテストを通じて、従来の方法では難しいビジュアルやアイデアを探求しており、このAIを使って実現したかった野心的なプロジェクトについて詳しく述べています。

記事の中でトリロ氏は、Soraが必ずしもすべてを完全に理解してくれるわけではなく、時には入力したアイデアを混乱させる結果を生み出すこともあると指摘しています。また、映像をより映画的にするために特定の言葉を使って試行錯誤を重ねていることも明かしています。

トリロ氏はSoraを使いこなすためには、求める美しさを実現できるかどうかを確認しながら、特定の言葉とその反対の言葉を組み合わせる必要があると述べています。また、生成された映像が公開前にOpenAIの承認を得る必要があり、ヌードや暴力、著作権で保護された内容は禁止されているとも指摘しています。このテクノロジーを広告など他の分野に応用する際には、創造的な活用が求められるとしています。

リアル市長は英語が苦手なので…アバター市長が政策を発信 AI得意の横須賀市、外国人向けにYouTube動画

横須賀市は、市長である上地克明氏のアバターを生成AIを用いて作成し、YouTubeで英語による施策紹介動画の配信を開始しました。この試みは全国の自治体では初めてのことであり、言葉の壁を越えて情報を発信することを目的としています。

市内には在日米海軍の基地関係者約2万人を含む7000人の外国人が暮らしており、市長のアバターは市の定住促進策などを流ちょうな英語で説明しています。このアバターは、市長自身の映像を基に米国の動画生成AIツール「HeyGen」を使って声やしぐさ、表情などを学習し、英訳文を加えて作成されました。

今後は毎月の市長会見の内容や、観光案内、災害時の情報提供などにもアバターを活用する予定です。市長は英語が苦手としていますが、外国人からは「思いが伝わる」との反応を得ており、緊急事態でも感情豊かにメッセージを伝える手段として期待されています。

AIで配信動画にプロダクトプレイスメント、RembrandがYouTuberに新たな収入もたらす広告モデル

この記事では、Rembrandが提案する新しい広告モデルについて紹介しています。このモデルでは、AIを用いてYouTubeなどの動画配信サービスでプロダクトプレイスメント(製品の露出)を自動生成し、動画中に自然に組み込む技術が用いられています。この技術により、視聴者が気づかないうちにブランドのメッセージが伝えられ、従来の広告挿入が引き起こす視聴の中断や不快感を避けることが可能です。

Rembrandは、広告挿入の手間とコストを削減するために、ブランドとクリエイターのマッチングを自動化するプラットフォームを提供します。このプラットフォームを通じて、クリエイターは登録し、動画ジャンルやチャンネルリンクなどを提供することで、適切な広告案件とマッチングされます。そして、視聴回数に応じて収益を得ることができます。

また、Rembrandは、APIビジネスを目指し、広告の自動挿入技術を他のストリーミングサービスやエンターテインメント業界にも提供する計画です。これにより、プロダクトプレイスメントのプロセスを革新し、広告業界に新たな動きをもたらす可能性があります。

【4】モバイルAI関連のニュース

アップル、次期iOSへのAI機能搭載でオープンAIと協議-関係者

アップルがOpenAIとの間で次期iOSにAI機能を搭載するための協議を再開したことを報じています。

アップルは年内にiPhoneに追加される新機能にOpenAIの技術を使用する可能性について話し合いを進めており、具体的には次期iPhone用基本ソフト「iOS 18」にどのようにこれらの機能を統合するかが議題です。

さらに、アップルはアルファベット傘下のグーグルとも「Gemini」チャットボットのライセンスに関する協議を続けており、最終的にどのパートナーを選択するかは未定です。この動向は、アップルがAI技術をさらに積極的に取り入れようとしていることを示しています。

グーグルの次世代スマホ、Pixel 9では「オンデバイスのAI処理を強化」か

この記事では、Googleの次世代スマートフォンであるPixel 9とPixel 9 Proに関する情報が紹介されています。Googleはこれらの新モデルでオンデバイスのAI処理機能を強化する見通しです。具体的には、端末内で完結する画像生成やテキストの合成・編集、AIベースの検索やディスカッションなどが含まれます。

Googleは、これらの機能をデバイス内で処理することにより、プライバシー保護とパフォーマンスの向上を図るとしています。これにはTensor Mobileチップセットの進化が寄与しており、より多くのAIサービスを端末内で実行できるようになることが期待されています。

また、Googleはこれらの技術をPixelシリーズに限定して提供後、将来的には外部のパートナーへの提供も検討していることが示されています。これにより、AI技術の普及と端末の機能拡張が進むことが予想されます。

【朗報】Pixel 8a。「7年アプデ保証」「人気AI機能」などPixel 8から継承か


ChatGPTと“声”で会話する方法解説書が発売 ~ブラウザーやAlexaにも組み込める!

書籍『ChatGPTと音声で会話する3つの方法』がインプレスから発売されました。この本は、OpenAIの音声合成APIを利用してChatGPTに音声インターフェースを追加する方法を詳しく解説しており、プログラミング経験がない読者でも取り組めるように、環境構築の手順を丁寧にガイドしています。

具体的には、Pythonを用いた基本的な音声対話の実現方法、Google Chromeの音声認識と音声合成機能の使用方法、そしてAlexaのスキルをカスタマイズしてChatGPTを組み込む方法が紹介されています。これにより、Alexaを通じてChatGPTと音声で対話することが可能になります。


【5】その他のニュース

「TikTok禁止法案」に米大統領が署名 気になるこれからにまつわる5つの疑問

記事では、アメリカ大統領がTikTokの売却を要求する法案に署名したことについて説明しています。この法案はTikTokが270日以内にアメリカを拠点とする所有者に売却されるか、アメリカ国内での運営が禁止されることを定めています。TikTokのCEOはこの法案を憲法違反と非難し、法的措置を取る意向を表明しています。

さらに、TikTokは中国の所有権を保持しようとする法廷闘争に勝つ可能性や、アメリカ国内での運営がどれほどの期間続くかについても議論しています。法案が国家安全保障を理由に支持される可能性が高く、TikTokが勝訴するための課題が多いことが示唆されています。

また、TikTokが売却される場合の潜在的な買い手としてOracleやMicrosoftなどが名前が挙げられていますが、各社にはそれぞれ問題があり、簡単な解決策ではないことが強調されています。最終的に、TikTokの未来は多くの不確実性に包まれており、関連する多くの法的および政治的問題が存在することが指摘されています。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内が届きます。また「指示文」と送信して頂ければ、「本当にしごとに役立つ指示文20選」ががもらえます。

AIのある暮らし公式LINE

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!

公式グッズの販売はこちらから


この記事が気に入ったらサポートをしてみませんか?