【9/16-9/22】生成AI活用事例/研究開発-Weeklyまとめ

2023年9月22日 18:09

今週のAIに関する活用事例や研究開発情報の備忘録記事です。

活用事例

・Pictoriaがライブドアと連携し、AIキャラクターによるニュース配信を開始

【本日リリース✨】
Pictoriaは、ライブドアと連携し「ライブドアニュース24」にて24時間365日ニュースを配信するAIキャラクターを開発いたしました！
本日β版が配信スタートです！
AIによるまったく新しいニュース番組、ぜひご覧ください！
詳細はコチラ▽https://t.co/YubR0Bz1fV
— Pictoria公式 (@Pictoria_Inc) September 14, 2023

・生成AI Top 50

生成AI Top 50(by a16z)
- トラフィック全体の6割がChatGPT
- Top50社の8割は1年以内の創業
- 利用モデルは独自LLM、ファインチューニング、一般LLMが3分の1ずつ
- Webがほとんど（モバイルは極少）
- 9割は売上有りで大半がサブスク https://t.co/CBRfj3aYJi pic.twitter.com/L22Nrtsalc
— 久保田雅也@ベンチャーキャピタル (@kubotamas) September 14, 2023

・IBMのWatsonxが新しい生成AIモデルとガバナンスツールを取得

IBMのWatsonxが新しい生成AIモデルとガバナンスツールを取得
- Llama 2 と Hugging Face の StarCoder をサポート
- 独自のビジネスニーズに合わせてモデルを調整できるチューニングスタジオ
- テストのための合成データジェネレーターも搭載https://t.co/HuoTtEC4xq
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023

・動画生成AIのRunway、無制限利用と新機能を提供する制作者向けプログラムを発表

動画生成AIのRunway、無制限利用と新機能を提供する制作者向けプログラムを発表

- 一部のユーザーに対して「Runway Creative Partner Program」を開始すると発表
- 無制限プラン、100万クレジット、新機能への早期アクセスなどを提供https://t.co/BKzidBkxSC
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・Amazon がGoogleなどに対抗し、ビジュアル検索、AR 検索など導入

Amazon がGoogleなどに対抗し、ビジュアル検索、AR 検索など導入https://t.co/XquUiurX8f pic.twitter.com/1PNskj0U9U
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・BCG と Anthropic がクライアントに責任ある生成AIを提供するため提携

BCG と Anthropic がクライアントに責任ある生成AIを提供するため提携

- クライアントはAnthropicのAIを活用
- AnthropicのAIは、信頼性が高く、解釈可能で、コントロール可能
- 成長、効率性、イノベーションの主要な課題に関して、Claudeを使用したテストプログラムを促進https://t.co/emztKEIxhz https://t.co/wAzV4vkAYE
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・UIをBootstrap、商用利用可能なAIを活用した生成型UIシステム

気になる。UIをBootstrap、商用利用可能なAIを活用した生成型UIシステム。

1. プロンプトを入力→3つのUI提案を行う。Shadcn UIとTailwind CSSに基づいて、コピペ可能なReactコードを生成。
2. UIは細かく調整可能。

AIを使用してUIを迅速かつ効率的に構築・立ち上げる。pic.twitter.com/5aWVCEi5l2 https://t.co/GsQimw6ctT
— しょーてぃー/Experience Designer (@shoty_k2) September 14, 2023

・開発者に高速、手頃な価格、カスタマイズ可能な大規模言語モデルを提供

生成AI Platform https://t.co/AfX2RUBV4r
開発者に高速、手頃な価格、カスタマイズ可能な大規模言語モデルを提供
オープンソースの基盤モデルを使用し、最大20-120倍のコスト削減で独自のLoRAアダプタをデプロイ可能https://t.co/Kv7sCn7tm7 https://t.co/qwyBZJ9Qn7
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・Google、Google Cloud経由でGemini AIへのアクセスを試験的に開始

Google、Google Cloud経由でGemini AIへのアクセスを試験的に開始 https://t.co/aiQ0CeFi8S @datacentercafeより
— あるふ (@alfredplpl) September 18, 2023

・OpenAIがgpt-3.5-turbo-instructをリリース

gpt-3.5-turbo-instructがリリース pic.twitter.com/pIp2ocdgs4
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・MeshyAI自動テクスチャ機能

っていうMeshyAIの自動テクスチャ機能のことをnoteに追記しましたhttps://t.co/gNgUXobxOG
— nakashun / Witchpot (@nakashun_t) September 18, 2023

・ゲーム業界、生成AIで激変の兆し　圧倒的王者Steamに挑むEpic Games

ゲーム業界、生成AIで激変の兆し　圧倒的王者Steamに挑むEpic Games
アスキーにSteamでの生成AI使用をしたゲームのリジェクト問題を書きました。逆にEpicGamesが全面受け入れの判断をする理由や米のAI権利を巡る問題の解説です。https://t.co/qcLsDM4sFs
— 新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) September 19, 2023

・Agility Robotics、年間1万台の人型ロボットを製造する準備が整う

Agility Robotics、年間1万台の人型ロボットを製造する準備が整うhttps://t.co/iocY3zYfMA
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・質問できるチャットボットだけではなく、3Dスキャンの点検の自動化なども出来る。

製造エンジニア向けのAIツール。

質問できるチャットボットだけではなく、3Dスキャンの点検の自動化なども出来る。https://t.co/LIWkqTiLwM pic.twitter.com/bfK7ST9NOm
— Tetsuro Miyatake (@tmiyatake1) September 19, 2023

・3D Gaussian Splatting の概要｜npaka

3D Gaussian Splatting の概要｜npaka @npaka123 #note https://t.co/4kQ1ifJKa2
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 19, 2023

・GoogleのAIチャットボットが、Gmailの受信トレイやドライブのストレージで見つけた情報をもとに質問に答えることができるように

GoogleのAIチャットボットが、Gmailの受信トレイやドライブのストレージで見つけた情報をもとに質問に答えることができるようにhttps://t.co/i77sJyhQi5
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・元ファーウェイの天才エンジニア、工場作業も家事もできる人型ロボット発表。「コスト400万円に抑える」

元ファーウェイの天才エンジニア、工場作業も家事もできる人型ロボット発表。「コスト400万円に抑える」https://t.co/lE7fnLzhZw
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・Outschool教師を支援するAI搭載ツールを発表

Outschool教師を支援するAI搭載ツールを発表
- Outschoolは、子供向けのアカデミック・クラスや興味に基づいたクラスを提供するオンライン学習プラットフォーム
- 生徒の進捗レポートを作成するツール、AIティーチングアシスタントを発表https://t.co/e23aFFQuNd
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・TikTok、AIコンテンツに自動的にラベル付けする新しいツールと技術を発表

TikTok、AIコンテンツに自動的にラベル付けする新しいツールと技術を発表https://t.co/G3DImuNDKD pic.twitter.com/NEOe1k0T5a
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・Catch+Release、AIを活用したユーザー作成コンテンツの検索を開始

Catch+Release、AIを活用したユーザー作成コンテンツの検索を開始

- 自然言語クエリでユーザー作成コンテンツを探せるAI搭載の検索
- 企業がマーケティングキャンペーン用にクリエイターコンテンツのライセンスを取得するのを支援https://t.co/KWQ9Z2oQ8P
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・RunwayのGen:48

RunwayのGen:48
- 2日間のショートフィルムコンペティションhttps://t.co/kjwecd9NBb https://t.co/i0oll7GkFu
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・接客教育を目的にしたロープレAIの実証実験開始

接客教育を目的にしたロープレAIの実証実験開始しました！https://t.co/2Xvy4TUfYf
— いとう！@AIを1日1つ作る (@itosinitosin123) September 19, 2023

・Shopifyより、iPhoneで簡単3Dモデル作成

Shopifyより、iPhoneで簡単3Dモデル作成

必要物
- 良い照明環境
- 商品周辺を360度撮影
- iOS 17と最新バージョンの@Shopifyアプリを使用したiPhone Pro
- 20分以内の待ち時間https://t.co/PmmBPrFFi1 https://t.co/NO9Fws5Qfm pic.twitter.com/LVxgCPVnfk
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・SequoiaのAI x ヘルスケアのカオスマップ

SequoiaのAI x ヘルスケアのカオスマップ。https://t.co/iwPrIXSU6a pic.twitter.com/aRhAdsWCRq
— Tetsuro Miyatake (@tmiyatake1) September 20, 2023

・Amazonがカメラや画像認識を活用しない無人レジのシステムをローンチ

Amazonがカメラや画像認識を活用しない無人レジのシステムをローンチする。

各アイテムにRFIDタグが付いているので、お店を出るゲートを通る際に自動的にタグを読み込み、その後にクレジットカードもしくは手首認証によって支払いを行う仕組みとなる。https://t.co/5bhjTh9d5h pic.twitter.com/3EPd52uYPe
— Tetsuro Miyatake (@tmiyatake1) September 20, 2023

・生成AI x 医療

生成AI x 医療

フロント
- 患者エンゲージメント。特に服薬アドヒアランス向上。薬の服薬や再診を促すメッセージや電話の自動化
- 医療ドキュメント作成。患者と医師のやり取りをEHR記入を自動化。システムオブレコードとしての強力なポジショニング
-…
— 久保田雅也@ベンチャーキャピタル (@kubotamas) September 19, 2023

・EY、顧客のAI導入を促進するプラットフォーム「http://EY.ai」をローンチ——独自LLMも近日公開

EY、顧客のAI導入を促進するプラットフォーム「https://t.co/vPKVUa8Th8」をローンチ——独自LLMも近日公開 https://t.co/5kUv0dNBvJ @thebridge_jpより
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・Stayway、生成AIを活用した補助金クラウド提供に向け実証実験を開始

Stayway、生成AIを活用した補助金クラウド提供に向け実証実験を開始
- 小規模事業者持続化補助金の事業計画書作成の検証で、人より作成時間が100分の1
- AIによる補助金の比較検討や絞り込み、高品質な自動書類作成などを目指すhttps://t.co/dNyIWZitly pic.twitter.com/7hNsfvO0Y9
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・OpenAIにファインチューニングUIが登場

OpenAIにファインチューニングUIが登場

- 数ヶ月後にはUIからチューニングを作成できるように
- 同時トレーニングの制限を1から3に増加 https://t.co/vQe52bFnxy pic.twitter.com/7ikvtFMkIt
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・OpenAIからDALLE3が発表

OpenAIからDALLE3が発表
・物体間の関係性やニュアンスなど複雑なプロンプトを反映
・chatGPT上で使えてインタラクティブな画像生成
・実在のアーティストの画風の画像は出さないように調整
DALLE3はChatGPTPlus向けに10月に公開予定https://t.co/P3oUVDYagM pic.twitter.com/L9QPcPEFjK
— hiromichi kamata (@kamata1729) September 20, 2023

・数ヶ月前に発表された、StanfordとGoogle共著のGenerative Agents論文を独自改良しながら、世界最大のアイドルフェスで実験した話

弊社ながら、おもしろいテックブログです！
DAOの実現には、LLMがマストだと思っていて、その実験の話です。PluralityDAOの実現。

数ヶ月前に発表された、StanfordとGoogle共著のGenerative Agents論文を独自改良しながら、世界最大のアイドルフェスで実験した話。https://t.co/iJCClTjamT
— Yuya Ishikawa / Gaudiy (@yuya_gaudiy) September 20, 2023

・ShortwaveのAIアシスタント

ShortwaveのAIアシスタント
- 自然言語クエリで受信トレイの検索が可能
- 例: "先週SaaSスタートアップについて話していたメールは何ですか？"
- 文章の改善、会話の要約、メールの簡潔化など
- カレンダーにアクセスすることで、会議の草案をスケジューリングhttps://t.co/GsFdBcIb9n
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・JusticeText、公選弁護人の証拠書き起こしにAIを活用

JusticeText、公選弁護人の証拠書き起こしにAIを活用

- ボディカム映像や取調べ動画などを書き起こす
- 弁護士がタイムスタンプ付きのメモを取ったり、ビデオクリップを作成したり、証拠を共有可能
- ChatGPT搭載のMirandaAIは、証拠開示について自由に質問可能https://t.co/jy3nmUuMmL pic.twitter.com/F0w1fBctq0
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・元Meta AI副社長、AI学習アプリとチャットボット「Sizzle」を発表

元Meta AI副社長、AI学習アプリとチャットボット「Sizzle」を発表

- 数学の方程式や単語問題の解答を段階的に生成する無料のAI学習アプリ
- 採点、ステップを再生成、1つの問題に対して複数の解答を表示、課題の写真をアップロードなど、4つの新機能を発表https://t.co/iWlkDSsQmJ pic.twitter.com/bkvR2k0lFQ
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・Uber Eats、2023年後半にGoogleのPaLM2搭載のチャットボットをローンチへ

Uber Eats、2023年後半にGoogleのPaLM2搭載のチャットボットをローンチへ

- 米国、英国、オーストラリア、カナダ向けに公開
- 最初は、お得な情報の発見、お気に入り料理を簡単再注文など
- その後、食事計画、食料品のセール発見、レシピから食材を注文などを計画https://t.co/wp1F5r46QL
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・AmazonがAlexaに生成AIを近々採用

AmazonがAlexaに生成AIを近々採用

- リアルタイム情報へのアクセス、スマートホームの効率的なコントロールなど
- 新モデルは、ボディランゲージや人のアイコンタクトやジェスチャーを考慮した体験を可能にhttps://t.co/rN1LJSKHjL
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・GitHub Copilot Chatツールを個人向けに提供開始

GitHub Copilot Chatツールを個人向けに提供開始https://t.co/JIEukUV2fs pic.twitter.com/FoXydztKan
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・中国の動画サイトでAIがさまざまな機能を提供

【こぼれ話】中国でAIは早くもより身近に。ビリビリではコメント欄で動画の要旨をまとめるAIが登場し短くまとめ、快手はコメント欄でAIで生成した絵を投稿でき、ビリビリや抖音はAIアシスタントで動画検索など、今中国で動画サイトとAIはより密接になっている、という記事ですhttps://t.co/6pEkyR9dAM pic.twitter.com/kIey9t99UO
— 36Kr Japan@中国テック・スタートアップ専門メディア (@36krJ) September 21, 2023

・AI生成インフルエンサーが24時間稼ぎ続ける中国ライブコマース新事情

AI生成インフルエンサーが24時間稼ぎ続ける中国ライブコマース新事情
- わずか数分の動画からAIが生成したもので、24時間年中無休で働き続けることができるhttps://t.co/qxDAEI09A6 pic.twitter.com/zcihA9AqJj
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・動画からアニメーションを生成するAIサービスの比較

動画からアニメーションを生成するAIサービスの比較が面白い

Move AIが一番動きが滑らかに見えるpic.twitter.com/SQaiMqYCCj
— IVAN@AR × Marketing (@van_eng622) September 21, 2023

・日本初のAIタレントが誕生

【速報：日本初のAIタレントが誕生！】

伊藤園お～いお茶のCMで
日本初の『AI生成タレント』
が起用されました。

CMの表現方法として
老後の姿と現在の姿が描かれてるのも
AIとの相性ピッタリですね！

これを機に、日本でも
AIタレントの波が来るのかも🤔

みんなはAIタレントどう思う？ pic.twitter.com/oYcHLu6VZv
— しんやん｜AIツール×ChatGPT (@yesmanblog) September 10, 2023

・要約AIが効率化

>後処理時間が長い3つの業務領域 (お問い合わせ、ご意見・ご要望、介助申込) に対し、電話要約AIを利用すると後処理時間が18％〜54%効率化 https://t.co/OCkVSFk2vX pic.twitter.com/iUbXHNMxen
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・無料でGPT4越え!?ついに来たXwin-LM｜shi3z

研究開発

・大規模言語モデルの因果推論能力をテストするベンチマークデータセットを提案

LLMに因果推論能力はあるか？https://t.co/Lamr15vAP3

大規模言語モデルの因果推論能力をテストするベンチマークデータセットを提案
17の既存の大規模言語モデルを評価
現状のモデルは因果推論能力が低いことがわかった
— さくさくむら (@Sakkusakumura) September 14, 2023

・自動運転に対するLLMの道徳的判断の傾向を調査

プレプリントです。自動運転に対するLLMの道徳的判断の傾向を調査しています。LLMと人間の傾向は大まかには一致しますが、顕著な違いがあるものもありました。また、人と比較するとLLMは揺るぎない判断を示す場合がありました。https://t.co/R53PQCapLz
— Kazuhiro Takemoto (@kztakemoto) September 14, 2023

・ドイツやスペインなどの研究者が新しい画像生成AI「Würstchen v2」をリリース

ドイツやスペインなどの研究者が新しい画像生成AI「Würstchen v2」をリリースした

使ってみたところ、二次元イラストには向いてないが、他の領域では質が高そう。Stable Diffusionよりも学習コストが大幅に少ないため、より多くの組織がこのようなモデルを学習可能とのことhttps://t.co/8HoQccybNZ pic.twitter.com/MGjn54esd3
— 小猫遊りょう（たかにゃし・りょう） (@jaguring1) September 14, 2023

・TECA: テキストガイドによる合成3Dアバターの生成と編集

TECA: テキストガイドによる合成3Dアバターの生成と編集

Github: coming soon
PJ: https://t.co/tpHoUYyvwM https://t.co/eL3aDWJj20 pic.twitter.com/yRe69xnc8U
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023

・Soccer Sceneのための動的なNeRF

Dynamic NeRFs for Soccer Scenes

paper page: https://t.co/8KlWSFGU71

The long-standing problem of novel view synthesis has many applications, notably in sports broadcasting. Photorealistic novel view synthesis of soccer actions, in particular, is of enormous interest to the… pic.twitter.com/6sAhy9xxvC
— AK (@_akhaliq) September 14, 2023

・Gaussian SplattingのGitHubリポジトリ

https://t.co/oxuq7DevGP https://t.co/smokLQE2o3
— 逆瀬川 (@gyakuse) September 13, 2023

・アリババ、AIモデルTongyi Qianwenを一般公開

アリババ、AIモデルTongyi Qianwenを一般公開
- 近い将来オープンソース版を公開し、無料で商用利用できる
- ECプラットフォームのタオバオは、アリババのモデルを活用したQAをテスト中https://t.co/1a0L1huJEh
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023

・Patronus AI が間違いが許容されない業界用の LLM 評価ツールを考案

Patronus AI が間違いが許容されない業界用の LLM 評価ツールを考案

- 製品を一般公開し、さらに 300 万ドルのシードラウンドを発表
- モデルがビジネス上の機密情報や不適切な出力を検出https://t.co/hq6tvvgIBA pic.twitter.com/vLoToAAlE0
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023

・音声AIを開発するcoquiによる、音声合成モデルXTTIのモデルウェイトを公開

音声AIを開発するcoquiによる、音声合成モデルXTTIのモデルウェイトを公開
- 3秒クローニング
- 多言語音声合成
- クロス言語音声クローニング
- 24khz
デモ: https://t.co/qt7SsuWJHw
モデル: https://t.co/c3hu8smSk9 https://t.co/LVOWjFtbGr
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 14, 2023

・Gaussian-Splatting をUnityで動かす記事

Gaussian-Splatting をUnityで動かす記事を書きました！！
サンプルデータも込みなので，是非やってみてください！！！

｜aster https://t.co/eBFOk0QcKP #zenn #Unity #NeRF #3DGS #GaussianSplatting #3DScan
— Aster@NeRFを広める人 (@Aster_NeRF) September 14, 2023

・RETFound: 網膜画像からの汎化可能な疾患検出のための基盤モデル

RETFound: 網膜画像からの汎化可能な疾患検出のための基盤モデル

- 160万枚のラベル無し網膜画像に対して自己教師あり学習により汎化可能な表現を学習
- 疾患検出タスクに対し、少ないラベル付きデータで複数の比較モデルを凌駕https://t.co/3QEmGPV53j
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・MS、タンパク質生成AI「EvoDiff」をオープンソース化

MS、タンパク質生成AI「EvoDiff」をオープンソース化

- タンパク質配列があれば「忠実度高く」「多様な」タンパク質を生成できる
- ターゲットタンパク質の構造情報を必要としないため、通常最も手間のかかる部分を省くことが可能

github: https://t.co/0eOapFcBuo
記事: https://t.co/BO1UT5BAVL
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・IBMが、MoLMのオープンソースを発表

IBMが、MoLMのオープンソースを発表

- MoE(Mixture of experts)ベースの言語モデルのコレクション
- 40億から80億のパラメータを持つhttps://t.co/hxsamBPllB https://t.co/lGNz4oDBah
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・画像をダイナミックな動画に変えたり、物体とインタラクションできるようにするなど

Generative Image Dynamics

画像をダイナミックな動画に変えたり、物体とインタラクションできるようにするなど
論文: https://t.co/kooR0JQLLX
demo: https://t.co/roqL5grnMS https://t.co/J3pqDAQgjO pic.twitter.com/NaWxfdFtYP
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・SyncDreamer：シングルビュー画像からマルチビューの一貫した画像

SyncDreamer：シングルビュー画像からマルチビューの一貫した画像
のコードとデモが公開

github: https://t.co/NKTdEE8kWu
demo: https://t.co/ZVkKiXlqlI https://t.co/nwamTyXDWS pic.twitter.com/w4mkpSsPlc
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 15, 2023

・自動運転でAIの考え方を示すモデルLINGO-1

自動運転でAIの考え方を示すモデルLINGO-1が面白い。

何を見ていて、次の3秒間でどういうアクションを何故取るのかを解説してくれる。

モデルの説明を行うシステムは今後大事になる気がする。https://t.co/UJZn4uYygF pic.twitter.com/t9k3tCeqd8
— Tetsuro Miyatake (@tmiyatake1) September 16, 2023

・BCGとハーバードやMIT等によるGPT4を使用したタスク実験

BCGとハーバードやMIT等によるGPT4を使用したタスク実験

- BCGのコンサルティング758名で実験
- 18種類のコンサルタスクが対象
- AIを使用したコンサルは、12.2％多く仕事を終え、 25.1％早く仕事を完了し、 40％高い品質

記事: https://t.co/vItoLQamhv
paper: https://t.co/6IT6F5XAGE https://t.co/2OADqpnuWG pic.twitter.com/VvoNRDzrtc
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 18, 2023

・自律言語エージェントのためのオープンソースフレームワーク

自律言語エージェントのためのオープンソースフレームワーク
- 短長期記憶、ツール使用、Web、マルチエージェント通信などを含む機能をサポート
- 自然言語で設定ファイルを埋めるだけでシステムをカスタマイズ
- ターミナル、Gradio、バックエンドなどにデプロイ
github: https://t.co/LgG5fjIHtL https://t.co/I7rY7fLoab pic.twitter.com/gJw68pOj9Y
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・LayoutNUWA：大規模言語モデルの隠れたレイアウト専門知識を明らかに

LayoutNUWA：大規模言語モデルの隠れたレイアウト専門知識を明らかに

- レイアウト生成をコード生成タスクとして扱いレイアウト生成のパフォーマンスを大幅に向上
- 大規模言語モデルに内在するレイアウトの専門知識を効果的に利用
github: https://t.co/BZjZSRPgKR
論文: https://t.co/zFfOWKmxpF https://t.co/nu3ST6qnEo pic.twitter.com/I6KhPD9Hnf
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・CulturaX：167言語、6.3兆トークンの大規模言語モデルのための、クリーンで膨大な多言語データセット

CulturaX：167言語、6.3兆トークンの大規模言語モデルのための、クリーンで膨大な多言語データセットhttps://t.co/foFN9mB5c8 https://t.co/iDvJX44jfJ
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 19, 2023

・Flash Attentionを使ったLLMの推論の実験

Flash Attentionを使ったLLMの推論の実験が丁寧に解説されている。

Flash Attentionを使ってLLMの推論を高速・軽量化できるか？ https://t.co/r2Id7x8qWf #Qiita
— m__k (@m_k_696) September 19, 2023

・なぜ日本はGPUのない「富岳」でLLMを研究するのか　外国に後れを取らないための“現実的な理由”

『開発したLLMは最終的にGitHubやHugging Faceで公開するが』マジで？神

なぜ日本はGPUのない「富岳」でLLMを研究するのか　外国に後れを取らないための“現実的な理由” https://t.co/qmxhdMOu1a
— Torishima (@izutorishima) September 18, 2023

・自律言語エージェントを構築するためのフレームワーク Agents を試す｜npaka

自律言語エージェントを構築するためのフレームワーク Agents を試す｜npaka @npaka123 #note https://t.co/HSH5Weqvz4
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 19, 2023

・Google DeepMindのAlphaFoldがミスセンス突然変異の病原性を89%の精度で予測

GoogleDeepMind がAlphaFold を微調整し、ヒトのタンパク質の機能に影響を与える可能性がある遺伝子変異、「ミスセンス突然変異」の病原性や良性を予測するAlphaMissenseを発表。
7,100 万のミスセンス変異体の内人間の専門家によってはわずか 0.1% が分類されていたが、今回89%を分類。 https://t.co/7mz2ViCsyb
— bioshok(INFJ) (@bioshok3) September 19, 2023

・OpenAI Red Teaming Networkの公募を発表

OpenAI Red Teaming Networkの公募を発表
- OpenAI モデルの安全性を向上させることに関心のあるドメインエキスパートの参加を呼びかけhttps://t.co/X4dZfpCDrt https://t.co/YVOCJntATt pic.twitter.com/RCwfQ2FfXj
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・MSより、視覚言語能力を持つマルチモーダル基盤モデルの分類と進化についてのサーベイ論文

MSより、視覚言語能力を持つマルチモーダル基盤モデルの分類と進化についてのサーベイ論文
- 専門モデルから汎用アシスタントへの移行に焦点https://t.co/gqnJxwVzqB https://t.co/TumupnODrv pic.twitter.com/WWOfNptn4q
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・各LLMの精度評価を支援するスタートアップの台頭

各LLMの精度評価を支援するスタートアップの台頭
Martianなどhttps://t.co/piR2wY58hQ
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・マルチリンガルな言語モデル入門

多言語の呪い(curse of multilinguality)：多言語モデルに混ぜる言語数を増やしていくとあるところまでは性能が上がるが、それ以降は性能が下がる
という話があるらしいので、日本語LLMを強化するのに英語以外の他の言語混ぜると性能上がるかは試す価値ありそう？https://t.co/TQYZFtdo6H
— Seitaro Shinagawa (@sei_shinagawa) September 20, 2023

・ControlNet-XS

ControlNet-XS
- ControlNetのサイズとアーキテクチャ設計を調査
- FIDスコアでControlNetよりも優れた結果を達成
- StableDiffusion-XLとStableDiffusion 2.1を制御するコードをopenrailライセンスで提供

論文, github, モデル: coming soon
PJ: https://t.co/Mow6tj8AMK https://t.co/yIZthPKt5M pic.twitter.com/hqnJrP1wMa
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 20, 2023

・ローカルLLM のリリース年表｜npaka

ローカルLLM のリリース年表｜npaka @npaka123 #note https://t.co/GPGEzK4Dwt
— 布留川英一 / Hidekazu Furukawa (@npaka123) September 20, 2023

・GPT-4を上回るオープンなLLM誕生？　中国研究者らが「Xwin-LM」公開

GPT-4を上回るオープンなLLM誕生？　中国研究者らが「Xwin-LM」公開https://t.co/HZiUv67Xf0
— ITmedia NEWS (@itmedia_news) September 20, 2023

・検証の連鎖が大規模言語モデルの幻覚を減らす

検証の連鎖が大規模言語モデルの幻覚を減らす
(1)最初の応答を起草
(2)検証のための質問を計画し、回答
(3)最終的な検証済みの応答を生成https://t.co/OhVsVJDAez https://t.co/0ITpk7RtRC pic.twitter.com/kuM8fsgMZp
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・音声言語表現学習のための大規模データセット

音声言語表現学習のための大規模データセット
- 公開ツールやAPIに基づく自動音声キャプション生成パイプラインを提示
- 190万以上の音声テキストペアからなる、Auto-ACDと名付けられた大規模で高品質な音声言語データセットを構築

PJ: https://t.co/rQmzaF7ouD https://t.co/KV4s9kTO61 pic.twitter.com/mA9mpIEzzW
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・SceneDreamerの学習コードと、中で使われているseg2imageモデル（SPADE）へのアクセスが公開

SceneDreamerの学習コードと、中で使われているseg2imageモデル（SPADE）へのアクセスが公開https://t.co/LXaA2WSEWX https://t.co/A7YfGQHJjW pic.twitter.com/Dptm4hdVaq
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

・FreeU: 数行のコードで生成品質を改善

FreeU: Free Lunch in Diffusion U-Net
- Stable Diffusion、DreamBooth、ModelScope、Rerender、ReVersionに統合でき、数行のコードで生成品質を改善

PJ: https://t.co/p0oH6SMLaq
github(紹介のみ): https://t.co/lEnlNzuaKL https://t.co/Hl1f5PrE3H pic.twitter.com/iI3jgfZZyk
— 納村聡仁 / Osamura Akinori (@akinoriosamura) September 21, 2023

この記事が気に入ったらサポートをしてみませんか？