見出し画像

【簡単AI論文】OS-COPILOT: TOWARDS GENERALIST COMPUTER AGENTS WITH SELF-IMPROVEMEN

この論文の主な内容は、コンピューターと自然な言葉でやりとりできるAIアシスタントを作るための方法を提案しているということです。


AIアシスタントとは、人間がコンピューターでやりたいことを言うと、それを代わりにやってくれるプログラムのことです。


例えば、インターネットで調べ物をしたり、エクセルやパワーポイントを使って作業をしたり、ゲームをしたりするときに、AIアシスタントに頼めば、手伝ってくれるというイメージです。




しかし、現在のAIアシスタントは、特定のソフトやウェブサイトにしか対応していないことが多く、コンピューターの中にあるさまざまな要素とやりとりできるものはほとんどありません。


この論文では、OS-Copilotという枠組みを使って、コンピューターの中のウェブやコード、ファイル、動画、音声、さまざまなアプリなどとやりとりできるAIアシスタントを作ることができると主張しています。


OS-Copilotは、コンピューターの操作を自然な言葉に変換したり、逆に自然な言葉をコンピューターの操作に変換したりするためのツールを提供してくれるものです。




この論文では、OS-Copilotを使って、FRIDAYというAIアシスタントを作っています。


FRIDAYは、コンピューターでやりたいことを言われると、それを小さなタスクに分けて、一つずつやっていくという方法で動きます。


例えば、「パワーポイントでOS-Copilotの紹介スライドを作って」と言われたら、以下のようなタスクに分けて実行します。


  • パワーポイントを起動する

  • 新しいスライドを作る

  • スライドのタイトルに「OS-Copilotの紹介」と書く

  • スライドの本文に「OS-Copilotは、コンピューターの中のさまざまな要素とやりとりできるAIアシスタントを作るための枠組みです」と書く

  • スライドにOS-Copilotのロゴの画像を挿入する

  • 画像のサイズと位置を調整する


FRIDAYは、これらのタスクをやるために、OS-Copilotが提供するツールを使います。


ツールとは、コンピューターの操作をするためのコードや関数のことです。


例えば、パワーポイントを起動するためには、launch_app("PowerPoint")というツールを使います。


このツールは、コンピューターに「パワーポイントを開いて」という命令を伝えるためのものです。


FRIDAYは、OS-Copilotに最初から用意されているツールだけでなく、自分で新しいツールを作ったり、学んだりすることができます。


これによって、FRIDAYは、様々なアプリに対応できるようになります。




この論文では、FRIDAYの性能を評価するために、GAIAというベンチマークを使っています。


GAIAとは、コンピューターでやりたいことを言うと、それを正しくやってくれるかどうかを判定する問題集のことです。


例えば、「インターネットで今日の天気を調べて」と言ったら、インターネットを開いて、天気予報のサイトにアクセスして、今日の天気を教えてくれるというのが正しい答えです。


GAIAには、難易度によってレベル1からレベル3までの問題があります。


この論文では、FRIDAYがレベル1の問題で40.86%、レベル2の問題で20.13%、レベル3の問題で6.12%の正解率を達成したと報告しています。


これは、他のAIアシスタントよりも高い性能であることを示しています。

この記事が気に入ったらサポートをしてみませんか?