見出し画像

GPT-4の新バージョンが登場/Google 消しゴムマジックが無料化/Apple の新AI SiriがiPhoneアプリのUIを理解できるようになるかも/GoogleがAI研修動画生成「Google Vids」と新世代AIアシスタント「Gemini for Google Cloud」を発表/教育者向けAIコース「Generative AI for Educators」【週刊AIのニュース 2024年4月15日号】

こんにちは。AIのある暮らしです。

2024年4月8日〜4月14日の「週刊AIのニュース」をお届けします。


【1】文章生成AIニュース

OpenAI、改良版「GPT-4 Turbo」を有料版「ChatGPT」で提供--回答の質が向上

OpenAIは、有料版「ChatGPT」で使用可能な「GPT-4 Turbo」の改良版を提供開始しました。この新バージョンは、以前のGPT-4 Turboよりも直接的で冗長性が低く、会話的な言葉を用いた回答が生成されることが特徴です。具体的には、文章の作成や数学的問題解決、論理的推論、コーディングにおいて日々の回答が改善されます。

この改良版は、様々なベンチマークでパフォーマンスが向上しており、より自然に感じる回答を生成する能力があります。また、改良版GPT-4 Turboは、ユーザーがより簡潔で直接的なコミュニケーションを期待する現代のニーズに応えるよう設計されています。これにより、ChatGPT Plus、ChatGPT Team、ChatGPT Enterpriseに登録しているユーザーがこの新しいモデルを利用できるようになっています。

ChatGPTは医師の10倍の速さで事務作業をこなす

ChatGPT-4が医師の事務作業を効率化する可能性があることが新たな研究で示唆されました。この研究では、ChatGPTが医師と比較して10倍の速度で患者の退院時報告書を作成し、その質も専門家パネルによって同等と評価されました。

この結果は、医師の時間を節約し、患者への対応にもっと集中できるようにするため、AIの利用が医療現場で非常に有効であることを示しています。

研究はスウェーデンのウプサラ大学病院で行われ、その詳細は「Acta Orthopaedica」に掲載されています。今後、実際の患者データを用いた更に大規模な研究が予定されており、AIが医師の事務作業負担をどの程度軽減できるかが検証される予定です。

「Claude 3」は本当に「ChatGPT」より優れているのか? 使い込んで分かった強みと弱み

新しいチャット型生成AI「Claude 3」について、その性能とChatGPTとの比較が行われています。Claude 3はAnthropic社によって開発され、特にその日本語の生成能力が高く評価されています。試験的な使用では、Claude 3が生成する日本語はChatGPTよりも自然で、ビジネス文書などでも高い実用性があるとされています。

Claude 3には、「Opus」、「Sonnet」、「Haiku」という三つのモデルがあり、特に「Opus」モデルは、その高い日本語力で多くのユーザーから好評を得ています。ただし、このOpusモデルは有料プランでのみ利用可能です。一方で、無料プランの「Sonnet」や「Haiku」も日本語の不自然さが少ないとされていますが、Opusほどの印象はないとのことです。

このように、Claude 3は高い日本語生成能力を持ち、ビジネス文書作成など特定の用途でChatGPTを上回る可能性を持っていますが、実際の使用にあたってはどのモデルを選択するか、また有料プランへの加入を検討する必要があるとしています。

アップルが開発した「GPT-4を凌ぐ」AIとは…「ReALM」はコンテキストを理解する

アップルは、GPT-4を超える新しいAIシステム「ReALM」を開発しました。ReALM(Reference Resolution As Language Modeling)は、画面上の画像や会話のコンテキストを理解できる能力を持ち、より自然なユーザーインターフェースとの対話を実現することを目的としています。

このシステムは、特にスクリーン上の情報を解読し、そのコンテキストを把握することに優れているため、Siriのようなアシスタントがユーザーの要求をより正確に理解し、適切に対応するのを助けることができます。

ReALMはテキストだけでなく、画像からの情報抽出も行うことができ、例えば画面に表示された薬局のリストから特定の薬局への電話を指示するなどのタスクを容易にこなします。これにより、ユーザーは自然な言葉での指示が可能となり、エージェントとの会話がスムーズに行えるようになります。

【2】画像生成AI関連のニュース

漫画制作での生成AI活用の現状とは? 漫画家「うめ」さん作成の100ページ超の資料が無料公開中

経済産業研究所は、「漫画制作における生成AI活用の現状:2024春」という資料を無料公開しました。この資料は漫画家の小沢高広さんによって作成され、商業漫画制作における生成AIの活用事例や考察が含まれています。小沢さんは、生成AIが漫画家の事務作業を助けることは可能であるが、創造的な作業には限界があると指摘しています。具体的には、AIが生成するハルシネーション(もっともらしいウソ)の問題や、生成内容の質に対する懸念が述べられています。

資料では、生成AIを活用して漫画制作の効率を上げる方法が紹介されており、具体的な使用例としては、キャラクターのセリフ生成や背景のスケッチなどが挙げられています。また、生成AIが漫画家の仕事を奪うのではないかという議論にも言及しており、現段階ではAIによる完全な代替は難しいが、将来的な可能性については開かれた問題としています。

このように、小沢さんは生成AIを漫画制作の一部として有効活用しているものの、その限界と潜在的なリスクにも注意を払いながら、さらなる研究と開発が必要であると強調しています。

“大ヒット商品”に隠された「画像生成AI」の秘密とは? デザイナーが明かす

生成AIを活用してファッションデザインを行う新しいアプローチが注目されています。特に、画像生成AIを使用してヒット商品を生み出したデザイナー、Opé M氏の事例が紹介されています。

彼は元々、OpenAIのDall-Eを使用してデザインを始め、その後Midjourneyに移行しました。これらのツールを使用して、2023年のニューヨークで開催された「New York AI Fashion Week 2023」のコンペティションで3位に入賞し、そのデザインはすぐに売り切れとなりました。

Opé氏は、生成AIがデザインプロセスを支援するものであり、創造性を脅かすものではないと強調しています。彼によると、生成AIはビジュアルコミュニケーションを効率化し、デザイナーがアイデアを提案し共有する手助けをするツールです。しかし、一部のアーティストからは生成AIがオリジナリティを損なうとの批判もありますが、Opé氏はこれに懐疑的な立場をとっています。

この事例から、ファッション業界における生成AIの利用は、創造性を促進すると同時に、その受容にはまだ課題があることが示されています。AIをどのように活用するかは、業界全体での議論が必要とされるテーマの一つです。

【3】動画生成AI関連のニュース

OpenAIが開発したSoraで稼ぐ9つの革新的な方法 

OpenAIが開発したテキスト動画生成AI「Sora」を活用した9つのビジネス事例が紹介されています。このAIは動画制作プロセスを効率化し、デジタルコンテンツの収益化の可能性を拡大します。例として、カスタム動画作成サービスや、AIを使ったインタラクティブなストーリーテリングプラットフォームの提供、バーチャルイベントの制作サービスなどが挙げられています。これらのサービスは、個々のニーズに応じてパーソナライズされた動画コンテンツを提供し、ユーザー体験を向上させることを目指しています。

Soraの利用は、バーチャルツアーやAI駆動型フィットネスコーチングプログラムなど、多様な分野に拡がっています。これにより、新しい形のビジュアルコンテンツが生まれ、顧客に新鮮な体験を提供できるようになります。また、フリーランスのクリエイターにとっては、高品質な動画を迅速に制作するための強力なツールとしても機能します。

これらの事例は、AIの進化がクリエイティブな仕事のあり方をどのように変えていくかを示唆しており、将来的にはより多くの業界でAIの活用が進む可能性があります。

グーグル、AIで社内向けの研修動画を生成できる「Google Vids」

Googleが新たに「Google Vids」というAIを用いた社内研修動画生成サービスを発表しました

Google Vidsは非常に使いやすく、ユーザーがスタイルを選択すると、AIがストックビデオ、画像、BGMを組み合わせてスタイルに合ったドラフトを自動生成します。ナレーションに関しても、ユーザーが提供した音声またはGoogle Vidsにプリセットされた音声のどちらにも対応しています。

このサービスはブラウザからアクセス可能なクラウドサービス形式で提供され、Google ドキュメントやGoogle スプレッドシートなどの他のGoogleサービスと連携可能です。

さらに、他のユーザーと共同で編集作業を行うこともできます。Googleは6月にWorkspace Labsでこのサービスのテスト版を公開する予定で、正式版はGeminiのGoogle Workspaceプランを通じて提供される予定ですが、正式版の公開時期や料金についてはまだ発表されていません。

テキストや写真から動画生成、編集もすぐ。オールインワン動画生成AIプラットフォーム「Clipfly」の実力

中国のスタートアップ企業、恒図科技(Everimaging)は最近「Clipfly」という新しい動画生成AIプラットフォームをリリースしました。

Clipflyは、テキストや静止画像から動画を生成し、その動画を編集するオールインワンの機能を提供することで、ユーザーが一つのプラットフォーム上で動画制作の全工程を完了できるように設計されています。

このプラットフォームは、動画の生成から編集までをシームレスに行えるため、クリエイターが煩雑な作業手順を省略できるようにすることを目的としています。ユーザーはプロンプトを入力して静止画像を生成し、その画像から動画クリップを作成後、動画エディターを使用して字幕や音楽を挿入し、最終的な編集を行うことができます。また、Clipflyは画像の補正機能も持ち、高品質な動画制作を支援します。

段CEOによると、Clipflyは特にショート動画広告などで活用され、生成したビデオクリップの採用率を向上させることが期待されています。このプラットフォームは、クリエイターが求める多彩なビデオクリップを次々に生成することができ、特に動画広告の分野での利用が見込まれています。


【4】モバイルAI関連のニュース

Appleがスマホの画面を認識できるマルチモーダルLLM「Ferret-UI」を発表、SiriがiPhoneアプリのUIを理解できるようになる可能性も

Appleが新たに開発したマルチモーダル大規模言語モデル「Ferret-UI」についての論文をarXivで公開しました。Ferret-UIは、特にスマートフォンのアプリUIを理解することを目的として設計されたAIシステムです。このシステムは、スマートフォンの縦長のアスペクト比と小さなUI要素に特化しており、AIがアイコン認識やテキスト検索、ウィジェットのリスト化などのタスクを効率的に処理できるようになっています。

Ferret-UIの重要な技術の一つに、「any resolution」があります。これは、画面の解像度に関係なくUIの詳細を正確に認識できるようにする技術です。また、このAIは大量の具体的なUIサンプルを学習することで、さまざまなUIを正しく理解できるようにトレーニングされています。

この技術の応用により、将来的にはSiriなどのAIアシスタントがiPhoneアプリのUIをより深く理解し、操作することが可能になるかもしれません。また、アクセシビリティの向上や、開発者がアプリのUIをより迅速に評価するためのツールとしても利用できる可能性があります。

Google、消しゴムマジックなどAI機能をPixel以外でも無料化

Googleは、5月15日からすべてのGoogleフォトユーザーが、消しゴムマジック、写真ぼかし補正、ポートレートライトなどのAI機能を無料で利用できるようにすると発表しました。これまでは、これらの機能はGoogle PixelユーザーやGoogle Oneの有料サービス加入者のみが利用可能でしたが、今後はGoogleフォトを使用する全ユーザーがアクセスできます。

さらに、昨年Pixel 8とPixel 8 Proで導入された「Magic Editor」も、全Pixelデバイスで使用可能になります。また、AndroidやiOSのGoogleフォトユーザーも、毎月10回まで無料で保存できるようになりますが、それ以上の保存を希望する場合は、Pixelデバイスを使用するか、Google Oneのプレミアムプランに加入する必要があります。

これらの機能は段階的に展開され、最小要件を満たすデバイスに対して数週間かけて実施されます。この変更により、より多くのユーザーが高度な編集機能を利用できるようになり、Googleフォトの使い勝手が向上することが期待されます。

【5】その他のAI関連のニュース

Google Cloud、Gemini LLMベースの新世代AIアシスタント「Gemini for Google Cloud」を発表

Google Cloudが新世代のAIアシスタント「Gemini for Google Cloud」を発表しました。このAIアシスタントは、Googleの大規模言語モデル(LLM)であるGeminiを基にしており、開発者やGoogle Cloudサービス、アプリケーションに対するサポートを提供します。

Gemini for Google Cloudは、セキュリティ、コンプライアンス、プライバシーの面で強化された企業向けのAI機能を備えており、ユーザーがより効果的に作業を行い、より深いデータの洞察を得られるよう支援します。また、ソフトウェアデリバリー支援など、具体的な機能も提供されています。

Google、無料で学べる教育者向けAIコース「Generative AI for Educators」開始 MIT RAISEと共同開発

GoogleとMIT RAISE(Responsible AI for Social Empowerment and Education)は共同で、教育者がAIについて学べる新しい無料コース「Generative AI for Educators」を開始しました。このコースは、教師が授業準備や個別指導の時間を節約し、授業や学習活動を強化するために生成AIツールの使用方法を学ぶことが目的です。

コース内容には、授業計画や教材作成、個別学習の内容調整、日常的なタスクの効率化など、具体的な生成AIの活用スキルが含まれています。参加者は自分のペースで約2時間の学習を行い、コースを完了すると証明書を取得できます。現在のコース言語は英語のみですが、将来的には他の言語でも提供される予定です。この取り組みは「有用で責任あるAI教育を推進する」という目標の一環として提供されています。

公式LINE登録で特典がもらえます


AIのある暮らし公式LINEに登録いただくと「AIの最新情報」「勉強会の募集」の案内が届きます。また「指示文」と送信して頂ければ、「本当にしごとに役立つ指示文20選」ががもらえます。

さいごに

ここまでお読みいただきありがとうございました。

また今後もしごとや暮らしに役立つAI情報を発信していく予定ですので、アカウントのフォローをお願いいたします。

それではまた次の投稿でお会いしましょう!

公式グッズの販売はこちらから


この記事が気に入ったらサポートをしてみませんか?