Discord サーバー「AI・ロボット・化学channel」を立ち上げてみました
はじめに
AI・ロボット・化学の研究や勉強に関連したDiscordのサーバーを暫定で立ち上げてみました。
以下のリンクから、誰でも参加することができます。
目的
次の3つのモチベーションがあります。
AI・ロボット・化学などに関連する情報共有や困りごとの相談
筆者が進めているAI・ロボット・化学研究の協力者の募集
関連する「自由研究」のサポート
キーワード
#大規模言語モデル
#マルチモーダルAI
#自律型AI
#ロボットアーム
#自家製ロボット
#電子工作
#化学実験
対象者
上記のキーワードにピンときた方が想定の参加者です。
サーバーに参加するにあたり、年齢・肩書・経験などは特に問いません。
何かやりたいことがある、助けて欲しい、活動の様子をみたい、助言はできそう、Webに記事を書きたいなど、なんでもOKです。
目的(詳細)
1. AI・ロボット・化学などに関連する情報共有や困りごとの相談
関連分野に興味がある、勉強してみたい、何か困りごとがある、などの共通の目的を持った方が集う場を作るというのが、趣旨です。
(バイオ系の方が多いですが、ラボオートメーションに関する団体やdiscordサーバーとして、Laboratory Automationがあります。オススメです)
答えられる範囲で、筆者も回答します。
2. 筆者が進めているAI・ロボット・化学研究の協力者の募集
こちらが筆者個人としては最大のモチベーションです。
大規模言語モデルやロボットを使って化学合成をするシステムを作っており、日経新聞などにも取材していただきました(23年11月)。
遊び心を大切にしながら、研究を進めています。
ただ、筆者は化学の専門教育を受けてきたこともあり、AIやロボットまで手が回らない事態にしばしば直面します。例えば上記の動画では、試薬を湿気から守るための自動開閉ボックス(bluetooth box)、注射針の使用、LLMやマルチモーダルAIを用いた、便利かつ信頼性あるインターフェースの構築などが、もっぱらの課題です。
一連の課題を、スキマ時間 (或いは場合によっては全力投球!?)で手伝ってくれる方を募集しています。
成果は逐次、オープンソースで公開することで、publicな知見を増やす予定です。
特定の研究成果に繋がった場合は、論文の謝辞などに記載させて頂くかもしれません。
やりたいことの詳細はページ下部にリストアップしました。
(競合・同業者の方も、discordに参加することで、筆者の研究動向をリアルタイム把握できるか可能性がありそうです)
3. 「自由研究」のサポート
「GPT-4で専門データを読ませたチャットボットを試作したい」のような、ちょっとしたアイデアを検証するための「自由研究」をサポートするリソースを提供できる可能性があります(応相談: 主にAPI料金。場合によっては、ロボットアームやGPUサーバーetcも利用可?)
成果は逐次、オープンソースで公開して頂くことで、publicな知見を増やす予定です。
筆者が進めているAI・ロボット・化学研究のTODO(詳細: 23/11/29時点)
最新版はこちらを参照。
現時点でのTODOをリストアップしてみました。
細々としたアイデアはたくさんあるのですが、全くマンパワー不足で途方にくれている状況です。
記載のロボットアームをレールに載せて動かしてみる作業などは、とても楽しい時間のはずなのですが、残念ながら多忙で手が回っていません。
とりあえず触ってみて、「試してみた」的な記事を書いてもらって、雰囲気を筆者やネット上で共有したいと思っています。
ソフトウェア関連
マニアックな知識を記憶・理解している大規模言語モデルを作る
科学論文などからのRAG
科学論文の追加学習/ファインチューニング
専門記事やDiscordのチャットログetcを学習したchatbotの構築
ロボット操作を自然言語で行うためのインターフェースを作る
画像系基盤モデルでガラス器具などを認識できるか試す
auto-gptのような自律型のaiシステムで、どこまで操作ができるかを見極める
ROS2+ロボットアーム+シミュレータをpythonで簡単に使うための環境を整備する
ハード関連
最小スペックのマシンで70bモデルをフルパラメータファインチューニングしてみたい(DeepZero3 + SSD offload?)
コンシューマ向けGPUを大量(例: 8枚)刺した格安マシンでLLMをファインチューニングできるか?
ロボット関連
bluetoothで蓋を開閉可能なドライボックスを作る
dobot magician+レールキットを立ち上げる
カチャカを立ち上げてapiで動かしてみる
unlimitedhandなどでロボットアームを遠隔操作を検討する
dobot mg40を立ち上げてpythonで操作できるようにする
crane x7をros2 + pythonで制御できるようにする
シリンジをwifiで操作する電子システムを作る
ガラス器具(サンプル瓶)をdobotの吸引 or 多軸グリッパで移動するapiを作る
ガラス器具を3次元的に認識して3dマップを作る(ROS2 or 独自システム)
mycobot + agvを立ち上げる
サンプル瓶にゴム栓をする機構を作る
独自ロボット用のアルミフレーム台座をmisumiのサイトを通して作る
電子天秤をpythonで扱うapiを作る
オープンソースの3dプリンタシステム(jubilee)を拡張して実験器具を作る
画像認識系のdeep learningを活用しながら、マイクロピペットのチップのつけ外しを試す
…
備考・メモ
ソフトウェア関連の作業は、基本的にオンラインで行えると思います。
ハードウェア関連は、実地での作業となります。セキュリティの問題が絡むので、基本的には東工大の関係者(例えば学部生の方)にお願いすることになりうです。
大規模言語モデルやロボットを触って研究に展開&Web発表できるので、研究や就活etcでも役に立つ可能性があります。
ベンチャーキャピタルから連絡をもらったこともあるので、まじめに起業したい方も歓迎です(私も一緒に億万長者になりたいです)。
ゆくゆくは、作業して頂いた方に対して、お小遣い程度の謝礼を払える仕組みを作れればと思っています。
東工大の関係者であれば、研究費からRA費を出せる可能性があります。
それ以外の方については、何らかの団体を作って支払うスキームを作る必要がありそうです。検討中です。
経緯
以下、サーバーを立ち上げた経緯となります。
ーーー
材料実験をしてくれるAIロボットを作るのが、筆者の最近の目標です。
チャレンジングな課題ではありますが、GPT-4のような大規模言語モデル(LLMを)の出現により、ソフトウェア面での実装の道筋は見えてきたように思います※。
※例えばユーザーが「◯◯を合成して」と頼んだ場合、LLMが過去データを適切に参照しながら、1)合成スキームを考え, 2) 実験のフローチャートを作り, 3) ロボットシステムの制御コードを生成することが原理的に可能です。
現行のGPT-4(23年11月時点)では回答精度に課題がありますが、1-3)は比較的ルールや経験則が通用しやすいタスクなので、「実験結果の予測」などと比べると、難易度が低い可能性があります。
一方で実際問題として、LLMに対する専門知識の付与、データ検索(RAG)、自律化、ハルシネーションの抑制、ロボットシステムの制御(マルチモーダル化)といった、細々とした課題があります。
また、実際に化学実験を行うためのハードウェアが(おそらくは真の)ボトルネックであり、汎用ロボットアームの活用や、専用の機構を、場合によっては泥臭く構築していく必要があります。
プロ研究者が叡智を結集すれば、おそらく素晴らしい成果が出るのですが、AI・ロボット・化学の研究者は各々の分野の課題で意外と忙しく、お互いに顔を合わせる機会も多くありません※。
※海外ではAI・ロボット・化学の専門家を集めた研究グループがあったりします(例えばこちら)。日本では、2023年時点、あまり(というか全く?)見かけません。
なので、とりあえず、肩書や年齢などにこだわらず、このあたりのトピックに興味のある・詳しそうな方が集まってくれると嬉しい、というのが、discordサーバーを作ったという経緯となります。
特にAI・ロボット周りはチャンスが多く眠っているので、若い人でも活躍のチャンスがたくさんあると思います。
運営者の情報
筆者は東工大で助教をやっています。専門は化学・実験科学です。
最近(23年秋)の自慢は、東大 松尾研のLLMサマースクールのコンペでたまたま入賞したことです。
Google検索で、大規模言語モデルのLlama2をファインチューニングする方法を調べたりすると、筆者の記事が上の方に出てきます(23/11/29時点)。
AI・ロボット・化学周りで、このような、誰かの役に立つ(かもしれない)文章を一緒に書いてくれる人を募集しています。
さいごに
discordのURLを再掲します。
興味がある方は、discord / note / twitter / mailなどでお問い合わせください。
(とりあえず見切り発車で立ち上げてみた状況です。うまく回らなかった場合は、予告なく活動を休眠・サーバー停止する可能性がありますので、ご了承ください)
この記事が気に入ったらサポートをしてみませんか?