alexweberk

AI / 機械学習 / LLM 関連で学んだ内容やニュースに関して共有していければ思い…

Anthropic API で Claude 3 のツール活用Function Callingを試す

今回は、Anthropic API を使ってGPT-4超えと話題の Claude 3 のツール活用（Function Calling）を試してみます。 Claude 3 では、GPT-4 同様、ツールの定義をすることで LLM にツールの活用をさせることができます。 Anthropic 自体が出しているツール活用用の Python のレポジトリーがありましたので、それをフォークして使ってみます。今回試すにあたって、Web 検索を試したかったので、同時に Brave Se

最新の Google Gemma モデルを MLX を使ってローカルでファインチューニング

今回は、最新の Google Gemma モデルを Apple Silicon に最適化されたライブラリ MLX を使ってローカルで実行したり、ファインチューニングしてみましたのでその手順を紹介します。 MLX 関連の情報はドキュメンテーションが分かりづらいものも多かったので色々試した経緯も共有しながら少しでも何かの参考になれば幸いです。実際に使った Jupyter Notebook を Gist にアップロードしていますので、そちらも参考にしてください。 →Google

alexweberk

2か月前

48
画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

GPT-4V を使って画像から表を抽出し、Instructor を使って表を整形するサンプルコード。Instructor 自体の docs を参照して試してます。 # ライブラリのインストール!pip install instructor -Uqq Instructorライブラリを使って、GPT4Vから返り値として得たいフォーマットを指定します。 from io import StringIOfrom typing import Annotated, Anyfrom p

alexweberk

3か月前

11
日本語も意外と理解できるOpenChat-3.5-1210を試す

Trying openchat/openchat-3.5-12107B パラメータ級でトップクラス（？）のベンチマークを握る OpenChat3.5-1210 を Colab で試してみました。意外に日本語が使えてびっくりです。体感でも GPT-3.5 くらいの品質があり、利便性のあるモデルだと思いました。モデル: https://huggingface.co/openchat/openchat-3.5-1210 セットアップ!pip install acceler

alexweberk

4か月前

8

Anthropic API で Claude 3 のツール活用Function Callingを試す

alexweberk

1か月前

最新の Google Gemma モデルを MLX を使ってローカルでファインチューニング

48

alexweberk

2か月前
画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

11

alexweberk

3か月前
日本語も意外と理解できるOpenChat-3.5-1210を試す

8

alexweberk

4か月前

Swallow 13B Instruct HFをColabで試す

Llama 2 ベースの新しい日本語特化言語モデル Swallow 13B Instruct HFをColabで試しました。リリース記事: https://tokyotech-llm.github.io/ https://zenn.dev/tokyotech_lm/articles/d6cb3a8fdfc907 モデル: https://huggingface.co/tokyotech-llm/Swallow-13b-instruct-hf セットアップ!pip

alexweberk

4か月前

1
Swallow 13B Instruct HFをColabで試す

1

alexweberk

4か月前
リリースされたばかりの Gemini Pro API を試してみる

Gemini Pro の API を試してみたいと思います。 API キーはこちらから取得 → https://ai.google.dev/ 参考: https://ai.google.dev/tutorials/python_quickstart セットアップ!pip install -q -U google-generativeai import pathlibimport textwrapimport google.generativeai as genai#

alexweberk

4か月前

19
リリースされたばかりの Gemini Pro API を試してみる

19

alexweberk

4か月前
Microsoft から出た小型モデル Phi-2 を Colab で試す

Microsoft から出た小型モデル Phi-2 を使ってみたいと思います。 Model: https://huggingface.co/microsoft/phi-2 リリース記事: https://www.microsoft.com/en-us/research/blog/phi-2-the-surprising-power-of-small-language-models/ Satya さんがオープンソースにすると言っていたらしいですが、Huggingface

alexweberk

4か月前

12
Microsoft から出た小型モデル Phi-2 を Colab で試す

12

alexweberk

4か月前
Mistralの日本語ファインチューンモデル、「shisa-7b-v1」をColabで試してみました

今回はshisa-7b-v1をColabで試しました。 Mistral 7B をベースに、日本語生成に向くよう対応させたトークナイザーを用い、その後に airoboros-3.1 や ultrafeedback_binarized などを機械翻訳したデータセットに DPO も用いてファインチューニングさせたモデルということで、なかなか楽しみなことをしているモデルです。モデル: https://huggingface.co/augmxnt/shisa-7b-v1 同時に、

alexweberk

4か月前

9
Mistralの日本語ファインチューンモデル、「shisa-7b-v1」をColabで試してみました

9

alexweberk

4か月前
最近公開された大規模言語モデル DeepSeek-LLM-67B-chat を Colab で試してみた

今回は、DeepSeek-LLM-67B-chat を Colab で試してみたいと思います。中々大きなモデルサイズなので Colab といっても無料枠では厳しく、今回は A100 の GPU 付きで実行してみました。また、モデルは AWQ 化されたものを使用します。元のモデル: https://huggingface.co/deepseek-ai/deepseek-llm-67b-chat AWQ 版: https://huggingface.co/TheBlok

alexweberk

4か月前

12
最近公開された大規模言語モデル DeepSeek-LLM-67B-chat を Colab で試してみた

12

alexweberk

4か月前
新しく出たOpenAIのGPT-4V, Dalle-3, JSONモードAPIを試す

2023 年 OpenAI Dev Day で発表された新しい API を色々と試してみたいと思います。今回試すのは、 JSON Mode DALLE-3 での画像生成 GPT-4V の画像認識 API の３つです。他のも後ほど試したいと思います。準備!pip install openai -Uqq from google.colab import userdataapi_key = userdata.get('OPENAI_API_KEY') サンプルコー

alexweberk

5か月前

15
新しく出たOpenAIのGPT-4V, Dalle-3, JSONモードAPIを試す

15

alexweberk

5か月前
calm2-7b-chat をColabで試す

CyberAgent から昨日公開された新しい LLM モデル cyberagent/calm2-7b-chat を試してみました。 Apache-2.0 で商用利用可、コンテキストの長さも 32K とかなり長いので、ビジネス応答などにも使えるかと思います。 Huggingface: https://huggingface.co/cyberagent/calm2-7b-chat 早速試したいと思います。Colab上でT4 GPUで動かしてみてます。モデルのダウンロード

alexweberk

5か月前

23
calm2-7b-chat をColabで試す

23

alexweberk

5か月前
llm-jpをColabで試す

少し出遅れてしまったが、新たにリリースされた日本語 LLM「llm-jp」を試してみたいと思います。複数バージョンがありますが、「jaster を含むものは回答がそっけない」ということを Twitter で聞いた気がしたので、今回はそれを含まないものを試してみたいと思います。 Colabで試してみるモデルのダウンロード !pip install transformers accelerate sentencepiece --quiet %timeimport torc

alexweberk

6か月前

17
llm-jpをColabで試す

17

alexweberk

6か月前
Zephyr-7b-alpha を無理やり日本語で試す

今回試してみる Zephyr-7B-alpha は、Hugging Face 社によって開発された言語モデルのシリーズで、 mistral-7b に対するファインチューンとなっています。 ChatGPT で生成した会話系の合成データセットの UltraChat 等を使っており、Direct Preference Optimization (DPO) という手法を使ってトレーニングされています。 DPO ついてはまだ完全に理解できていませんが、RLHF (Reinforceme

alexweberk

6か月前

9
Zephyr-7b-alpha を無理やり日本語で試す

9

alexweberk

6か月前
RAG における埋め込みモデルの比較

LLM を使った RAG を行う際に埋め込みモデルが必要となりますが、どの程度差がでるのか 4 種類ほどの埋め込みモデルを使って検証してみたいと思います。今回試す埋め込みモデル: intfloat/multilingual-e5-large cl-nagoya/sup-simcse-ja-large pkshatech/GLuCoSE-base-ja openai/text-embedding-ada-002 こちらの記事内のベンチマークの結果でいうと各モデルは

alexweberk

6か月前

44
RAG における埋め込みモデルの比較

44

alexweberk

6か月前
SynthIA-7B-v1.3 を Colab で試してみる

今回は Mistral-7B をベースにファインチューニングされた `migtissera/SynthIA-7B-v1.3` を使ってみたいと思います。 Huggingface: https://huggingface.co/migtissera/SynthIA-7B-v1.3 Colabで実行必要なライブラリをインストール # 必要なライブラリをインストール!pip install transformers langchain accelerate bitsandby

alexweberk

6か月前

5
SynthIA-7B-v1.3 を Colab で試してみる

5

alexweberk

6か月前
話題のMistral 7B Instruct を試す

今回は話題の Mistral 7B の Instruct 版を試してみます。 Mistral 7B は 7.3B パラメータモデルで、Llama 2 13B を全てのベンチマークで、Llama 1 34B を多くのベンチマークで上回り、CodeLlama 7B のコード性能に迫りながらも英語タスクでも優れた性能を維持しているという強者です。また、Grouped-query attention (GQA)と Sliding Window Attention (SWA)を利用し

alexweberk

7か月前

11
話題のMistral 7B Instruct を試す

11

alexweberk

7か月前

最近の記事

Anthropic API で Claude 3 のツール活用Function Callingを試す

最新の Google Gemma モデルを MLX を使ってローカルでファインチューニング

画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

日本語も意外と理解できるOpenChat-3.5-1210を試す

Anthropic API で Claude 3 のツール活用Function Callingを試す

最新の Google Gemma モデルを MLX を使ってローカルでファインチューニング

画像からテーブル構造の抽出を GPT4V と Instructor を使って実現する

日本語も意外と理解できるOpenChat-3.5-1210を試す

Swallow 13B Instruct HFをColabで試す

Swallow 13B Instruct HFをColabで試す

リリースされたばかりの Gemini Pro API を試してみる

リリースされたばかりの Gemini Pro API を試してみる

Microsoft から出た小型モデル Phi-2 を Colab で試す

Microsoft から出た小型モデル Phi-2 を Colab で試す

Mistralの日本語ファインチューンモデル、「shisa-7b-v1」をColabで試してみました

Mistralの日本語ファインチューンモデル、「shisa-7b-v1」をColabで試してみました

最近公開された大規模言語モデル DeepSeek-LLM-67B-chat を Colab で試してみた

最近公開された大規模言語モデル DeepSeek-LLM-67B-chat を Colab で試してみた

新しく出たOpenAIのGPT-4V, Dalle-3, JSONモードAPIを試す

新しく出たOpenAIのGPT-4V, Dalle-3, JSONモードAPIを試す

calm2-7b-chat をColabで試す

calm2-7b-chat をColabで試す

llm-jpをColabで試す

llm-jpをColabで試す

Zephyr-7b-alpha を無理やり日本語で試す

Zephyr-7b-alpha を無理やり日本語で試す

RAG における埋め込みモデルの比較

RAG における埋め込みモデルの比較

SynthIA-7B-v1.3 を Colab で試してみる

SynthIA-7B-v1.3 を Colab で試してみる

話題のMistral 7B Instruct を試す

話題のMistral 7B Instruct を試す