alexweberk

AI / 機械学習 / LLM 関連で学んだ内容やニュースに関して共有していければ思い…

18 フォロー 110 フォロワー

Anthropic API で Claude 3 のツール活用Function Callingを試す

今回は、Anthropic API を使ってGPT-4超えと話題の Claude 3 のツール活用（Function Calling）を試してみます。 Claude 3 では、GPT-4 同様、ツールの定義をすることで L…

alexweberk

2か月前

画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

GPT-4V を使って画像から表を抽出し、Instructor を使って表を整形するサンプルコード。Instructor 自体の docs を参照して試してます。 # ライブラリのインストール!pip …

alexweberk

4か月前

日本語も意外と理解できるOpenChat-3.5-1210を試す

Trying openchat/openchat-3.5-12107B パラメータ級でトップクラス（？）のベンチマークを握る OpenChat3.5-1210 を Colab で試してみました。意外に日本語が使えてびっく…

alexweberk

4か月前

Swallow 13B Instruct HFをColabで試す

Llama 2 ベースの新しい日本語特化言語モデル Swallow 13B Instruct HFをColabで試しました。リリース記事: https://tokyotech-llm.github.io/ https://zenn.dev/toky…

alexweberk

4か月前

リリースされたばかりの Gemini Pro API を試してみる

Gemini Pro の API を試してみたいと思います。 API キーはこちらから取得 → https://ai.google.dev/ 参考: https://ai.google.dev/tutorials/python_quickstart セッ…

alexweberk

4か月前

Microsoft から出た小型モデル Phi-2 を Colab で試す

Microsoft から出た小型モデル Phi-2 を使ってみたいと思います。 Model: https://huggingface.co/microsoft/phi-2 リリース記事: https://www.microsoft.com/en-us/rese…

alexweberk

4か月前

Mistralの日本語ファインチューンモデル、「shisa-7b-v1」をColabで試してみました

今回はshisa-7b-v1をColabで試しました。 Mistral 7B をベースに、日本語生成に向くよう対応させたトークナイザーを用い、その後に airoboros-3.1 や ultrafeedback_binari…

alexweberk

5か月前

最近公開された大規模言語モデル DeepSeek-LLM-67B-chat を Colab で試してみた

今回は、DeepSeek-LLM-67B-chat を Colab で試してみたいと思います。中々大きなモデルサイズなので Colab といっても無料枠では厳しく、今回は A100 の GPU 付きで実行し…

alexweberk

5か月前

新しく出たOpenAIのGPT-4V, Dalle-3, JSONモードAPIを試す

2023 年 OpenAI Dev Day で発表された新しい API を色々と試してみたいと思います。今回試すのは、 JSON Mode DALLE-3 での画像生成 GPT-4V の画像認識 API の３つで…

alexweberk

6か月前

calm2-7b-chat をColabで試す

CyberAgent から昨日公開された新しい LLM モデル cyberagent/calm2-7b-chat を試してみました。 Apache-2.0 で商用利用可、コンテキストの長さも 32K とかなり長いので、…

alexweberk

6か月前

llm-jpをColabで試す

少し出遅れてしまったが、新たにリリースされた日本語 LLM「llm-jp」を試してみたいと思います。複数バージョンがありますが、「jaster を含むものは回答がそっけない」と…

alexweberk

6か月前

Zephyr-7b-alpha を無理やり日本語で試す

今回試してみる Zephyr-7B-alpha は、Hugging Face 社によって開発された言語モデルのシリーズで、 mistral-7b に対するファインチューンとなっています。 ChatGPT で生成…

alexweberk

6か月前

RAG における埋め込みモデルの比較

LLM を使った RAG を行う際に埋め込みモデルが必要となりますが、どの程度差がでるのか 4 種類ほどの埋め込みモデルを使って検証してみたいと思います。今回試す埋め込み…

alexweberk

7か月前

SynthIA-7B-v1.3 を Colab で試してみる

今回は Mistral-7B をベースにファインチューニングされた `migtissera/SynthIA-7B-v1.3` を使ってみたいと思います。 Huggingface: https://huggingface.co/migtissera/S…

alexweberk

7か月前

話題のMistral 7B Instruct を試す

今回は話題の Mistral 7B の Instruct 版を試してみます。 Mistral 7B は 7.3B パラメータモデルで、Llama 2 13B を全てのベンチマークで、Llama 1 34B を多くのベンチマ…

alexweberk

7か月前

alexweberk

2024年3月11日 09:48

Anthropic API で Claude 3 のツール活用Function Callingを試す

今回は、Anthropic API を使ってGPT-4超えと話題の Claude 3 のツール活用（Function Calling）を試してみます。

Claude 3 では、GPT-4 同様、ツールの定義をすることで LLM にツールの活用をさせることができます。
Anthropic 自体が出しているツール活用用の Python のレポジトリーがありましたので、それをフォークして使ってみます。

もっとみる

alexweberk

2024年2月25日 14:23

最新の Google Gemma モデルを MLX を使ってローカルでファインチューニング

画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

GPT-4V を使って画像から表を抽出し、Instructor を使って表を整形するサンプルコード。Instructor 自体の docs を参照して試してます。

# ライブラリのインストール!pip install instructor -Uqq

Instructorライブラリを使って、GPT4Vから返り値として得たいフォーマットを指定します。

from io import StringI

もっとみる

alexweberk

2023年12月22日 09:42