ベクトルデータベース(Vector Database)

AI | IT用語集

この用語をシェア

ベクトルデータベースとは

ベクトルデータベース(Vector Database)とは、テキスト・画像・音声などのデータを数値ベクトル(埋め込み / Embedding)として格納し、ベクトル間の類似度に基づく高速な近傍探索(Nearest Neighbor Search)を実現するデータベースシステムです。

ChatGPTやClaudeなどの大規模言語モデル(LLM)が普及する中で、RAG(Retrieval-Augmented Generation)システムの核心的なコンポーネントとして急速に注目を集めています。2024〜2025年にかけてAI市場の急拡大とともに、ベクトルDBは現代のAIインフラに不可欠な存在となりました。

仕組みと基本概念

埋め込み(Embedding)とは

テキストや画像などのデータを高次元の数値ベクトルに変換したものです。意味的に似たデータは、ベクトル空間上でも近い位置に配置されます。例えば「猫」と「ネコ」は意味が同じため、ベクトル空間上でも近くなります。

類似性検索の仕組み

ベクトルデータベースは以下の手順でデータを検索します。

  1. クエリ(検索したい文や画像)を埋め込みモデルでベクトルに変換
  2. データベース内の全ベクトルとの類似度を計算(コサイン類似度、ユークリッド距離など)
  3. 最も類似度の高い上位N件を返す(k-NN / ANN検索)

全ベクトルと総当たりで比較する完全探索(Exact-NN)は精度は高いですが遅いため、近似最近傍探索(ANN: Approximate Nearest Neighbor)アルゴリズム(HNSW、IVF、LSHなど)で高速化するのが一般的です。

主要なベクトルデータベース一覧

サービス 特徴 向いている用途
Pinecone フルマネージドクラウド、高速 エンタープライズ本番環境
Weaviate OSS、GraphQL対応、マルチモーダル 柔軟な構成が必要な場合
Chroma 軽量・ローカル対応、Python親和性高 PoC・開発環境・小規模
Milvus OSS、大規模スケール対応 数十億件規模のデータ
pgvector PostgreSQL拡張、既存DBと統合 既存Postgres環境への追加
Qdrant Rust製、高性能・低レイテンシ リアルタイム性重視の用途

通常のデータベースとの違い

比較項目 RDB(MySQL等) ベクトルDB
データ形式 行・列(構造化データ) 高次元ベクトル
検索方法 完全一致・範囲検索(SQL) 意味的類似性検索(ANN)
得意な検索 「name = '田中'」のような正確な検索 「この文章に意味が近いものは?」
主な用途 業務システム、トランザクション処理 RAG、レコメンド、画像検索

主な活用シーン

  • RAGシステム:企業内ドキュメントを格納し、LLMが参照して回答生成
  • セマンティック検索:キーワードではなく意味で検索するエンジン
  • レコメンドエンジン:商品・コンテンツの類似性に基づく推薦
  • 重複検出:類似した文書・コードの検出(コピーコンテンツ、コードクローン)
  • 顔認識・画像検索:画像ベクトルの類似検索
  • 異常検知:正常パターンから逸脱したベクトルを検出

2025〜2026年の最新動向

  • マルチモーダルベクトルDB:テキスト・画像・音声・動画を統合して管理・検索
  • ハイブリッド検索の普及:ベクトル検索+BM25全文検索を組み合わせて精度向上
  • 既存DBへの統合:pgvector (PostgreSQL)、MySQL Vector、MongoDB Atlas Vectorなど
  • GraphRAGとの統合:グラフデータベースとベクトルDBを組み合わせた高度な知識検索
  • コスト最適化:クアンタイゼーション(量子化)でベクトルのメモリ使用量を削減
  • ServerlessベクトルDB:使用量に応じた自動スケールでコスト効率化

関連用語・参考リンク

よくある質問(FAQ)

Q. ベクトルデータベースとは何ですか?

テキスト・画像・音声などのデータを数値ベクトルとして格納し、意味的な類似性に基づいた高速検索を行うデータベースシステムです。RAGシステムの知識ベースとして活用されます。

Q. 無料・オープンソースのベクトルDBはありますか?

はい。Chroma、Weaviate、Milvus、Qdrantはオープンソースで無料利用可能です。特にChromaはLangChainとの連携が簡単で、PoCや小規模システムに最適です。PostgreSQL拡張のpgvectorも無料で使えます。

Q. ベクトルDBは通常のDBとどう違いますか?

通常のRDBはSQLで完全一致や範囲検索を行いますが、ベクトルDBはコサイン類似度などで「意味的に近いデータ」を検索します。「このドキュメントに似た文書は?」「この商品に似た商品は?」という曖昧な検索が得意です。

Q. RAGシステムでベクトルDBはどう使いますか?

①ドキュメントを埋め込みモデルでベクトル化してDBに保存、②ユーザーの質問をベクトル化して類似文書を検索、③取得した文書をLLMのプロンプトに含めて回答生成、という流れです。これにより社内文書や最新情報を参照したAIシステムを構築できます。

この用語についてもっと詳しく

ベクトルデータベースに関するご質問や、システム導入のご相談など、お気軽にお問い合わせください。

カテゴリ

AI IT用語集