【9/16-9/22】生成AI活用事例/研究開発-Weeklyまとめ
今週のAIに関する活用事例や研究開発情報の備忘録記事です。
活用事例
・Pictoriaがライブドアと連携し、AIキャラクターによるニュース配信を開始
・生成AI Top 50
・IBMのWatsonxが新しい生成AIモデルとガバナンスツールを取得
・動画生成AIのRunway、無制限利用と新機能を提供する制作者向けプログラムを発表
・Amazon がGoogleなどに対抗し、ビジュアル検索、AR 検索など導入
・BCG と Anthropic がクライアントに責任ある生成AIを提供するため提携
・UIをBootstrap、商用利用可能なAIを活用した生成型UIシステム
・開発者に高速、手頃な価格、カスタマイズ可能な大規模言語モデルを提供
・Google、Google Cloud経由でGemini AIへのアクセスを試験的に開始
・OpenAIがgpt-3.5-turbo-instructをリリース
・MeshyAI自動テクスチャ機能
・ゲーム業界、生成AIで激変の兆し 圧倒的王者Steamに挑むEpic Games
・Agility Robotics、年間1万台の人型ロボットを製造する準備が整う
・質問できるチャットボットだけではなく、3Dスキャンの点検の自動化なども出来る。
・3D Gaussian Splatting の概要|npaka
・GoogleのAIチャットボットが、Gmailの受信トレイやドライブのストレージで見つけた情報をもとに質問に答えることができるように
・元ファーウェイの天才エンジニア、工場作業も家事もできる人型ロボット発表。「コスト400万円に抑える」
・Outschool教師を支援するAI搭載ツールを発表
・TikTok、AIコンテンツに自動的にラベル付けする新しいツールと技術を発表
・Catch+Release、AIを活用したユーザー作成コンテンツの検索を開始
・RunwayのGen:48
・接客教育を目的にしたロープレAIの実証実験開始
・Shopifyより、iPhoneで簡単3Dモデル作成
・SequoiaのAI x ヘルスケアのカオスマップ
・Amazonがカメラや画像認識を活用しない無人レジのシステムをローンチ
・生成AI x 医療
・EY、顧客のAI導入を促進するプラットフォーム「http://EY.ai」をローンチ——独自LLMも近日公開
・Stayway、生成AIを活用した補助金クラウド提供に向け実証実験を開始
・OpenAIにファインチューニングUIが登場
・OpenAIからDALLE3が発表
・数ヶ月前に発表された、StanfordとGoogle共著のGenerative Agents論文を独自改良しながら、世界最大のアイドルフェスで実験した話
・ShortwaveのAIアシスタント
・JusticeText、公選弁護人の証拠書き起こしにAIを活用
・元Meta AI副社長、AI学習アプリとチャットボット「Sizzle」を発表
・Uber Eats、2023年後半にGoogleのPaLM2搭載のチャットボットをローンチへ
・AmazonがAlexaに生成AIを近々採用
・GitHub Copilot Chatツールを個人向けに提供開始
・中国の動画サイトでAIがさまざまな機能を提供
・AI生成インフルエンサーが24時間稼ぎ続ける中国ライブコマース新事情
・動画からアニメーションを生成するAIサービスの比較
・日本初のAIタレントが誕生
・要約AIが効率化
・無料でGPT4越え!?ついに来たXwin-LM|shi3z
研究開発
・大規模言語モデルの因果推論能力をテストするベンチマークデータセットを提案
・自動運転に対するLLMの道徳的判断の傾向を調査
・ドイツやスペインなどの研究者が新しい画像生成AI「Würstchen v2」をリリース
・TECA: テキストガイドによる合成3Dアバターの生成と編集
・Soccer Sceneのための動的なNeRF
・Gaussian SplattingのGitHubリポジトリ
・アリババ、AIモデルTongyi Qianwenを一般公開
・Patronus AI が間違いが許容されない業界用の LLM 評価ツールを考案
・音声AIを開発するcoquiによる、音声合成モデルXTTIのモデルウェイトを公開
・Gaussian-Splatting をUnityで動かす記事
・RETFound: 網膜画像からの汎化可能な疾患検出のための基盤モデル
・MS、タンパク質生成AI「EvoDiff」をオープンソース化
・IBMが、MoLMのオープンソースを発表
・画像をダイナミックな動画に変えたり、物体とインタラクションできるようにするなど
・SyncDreamer:シングルビュー画像からマルチビューの一貫した画像
・自動運転でAIの考え方を示すモデルLINGO-1
・BCGとハーバードやMIT等によるGPT4を使用したタスク実験
・自律言語エージェントのためのオープンソースフレームワーク
・LayoutNUWA:大規模言語モデルの隠れたレイアウト専門知識を明らかに
・CulturaX:167言語、6.3兆トークンの大規模言語モデルのための、クリーンで膨大な多言語データセット
・Flash Attentionを使ったLLMの推論の実験
・なぜ日本はGPUのない「富岳」でLLMを研究するのか 外国に後れを取らないための“現実的な理由”
・自律言語エージェントを構築するためのフレームワーク Agents を試す|npaka
・Google DeepMindのAlphaFoldがミスセンス突然変異の病原性を89%の精度で予測
・OpenAI Red Teaming Networkの公募を発表
・MSより、視覚言語能力を持つマルチモーダル基盤モデルの分類と進化についてのサーベイ論文
・各LLMの精度評価を支援するスタートアップの台頭
・マルチリンガルな言語モデル入門
・ControlNet-XS
・ローカルLLM のリリース年表|npaka
・GPT-4を上回るオープンなLLM誕生? 中国研究者らが「Xwin-LM」公開
・検証の連鎖が大規模言語モデルの幻覚を減らす
・音声言語表現学習のための大規模データセット
・SceneDreamerの学習コードと、中で使われているseg2imageモデル(SPADE)へのアクセスが公開
・FreeU: 数行のコードで生成品質を改善
この記事が気に入ったらサポートをしてみませんか?