見出し画像

ベクトルデータベースってどれだけ世の中にあるのか?

Clip source: Vector Databases (are All The Rage) | by Christoph Bussler | Google Cloud - Community | Aug, 2023 | Medium
(映像はDalle-Eで作成)
この記事は、昨今AIの浸透で広く知られるようになったベクトルデータベースの動向について調査をしたらすごい量の情報が出てきた、という内容。
ベクトルデータベース、と称してる技術は下記のリストの通り、大量に発生しているのが現状。突然急にこんな量が現れたわけではなく、その背景には、AI技術、特に自然語処理を行うために数値情報をベクトル的に管理する技術が必要になり、それを機能としてサポートしている、というデータベースベンダーの発表が多く現れた、という話。
データをメモリ上に管理する部分(ストレージエンジン)のレベルも含めてベクトルデータに特化したアーキテクチャを持って開発されたものもあれば、従来のRDBやNoSQLのデータベースエンジンの上にベクトルデータの表記と管理ができる技術(ベクトルインデックス)も存在していて、下記のリストはそのミックス。
よく見ると、たいていのデータベース技術が「ベクトル対応」している、という事がわかります。
ベクトルデータベース、というのはベクトル数値の表記/記録はもちろんのこと、そのRead/Writeの性能の高さ、メモリ消費の効率、スケーラビリティ、メタデータ管理機能、バックアップ/リストア機能、データセキュリティ、AIツールとの連携(LangChain、LlamaIndex、ChatGPTプラグイン、等)他との統合(ETL、BI、可視化ツール、等)、等、要件は多岐にわたり、従来のデータベースとは違う特性を要求されるケースが多いです。
この記事でリストアップしたベクトル機能をサポートしているデータベースはこれだけ上がってます。
一つ一つを解説し、それぞれの特徴を調査するのはあまり意味がありません。
まずはこれだけの量が出てきている、ということを認識するリスト、という事で理解しましょう。
この中で、いわゆる純粋にベクトルデータベースとして開発されているものが点在してます。強いてあげれば、その純正ものと、既存データベース技術にベクトル表記機能を追加したもの、の区別くらいはしてもいいかな、と思いますが、それはもう少し時間があった時に、。、、、

後続の記事として、ベクトルデータベース技術の最近の動向について紹介していきます。

この記事が気に入ったらサポートをしてみませんか?