ベクトル検索とRAGとは AI検索技術の基本とSalesforce活用事例を分かりやすく解説
目次
- 1. VectorDB(ベクトルデータベース)とは
- 1.1 ベクトル形式とは
- 1.2 ベクトル化による類似検索の仕組み
- 2. なぜVectorDBが必要なのか?
- 2.1 1. 非構造化データの活用が可能
- 2.2 2. より高度な検索が可能
- 3. VectorDBにデータを格納する仕組み
- 3.1 1. チャンク化
- 3.2 2. ベクトル化
- 3.3 3. 格納
- 4. RAG(Retrieval Augmented Generation)とは?
- 4.1 RAGの仕組み
- 4.2 RAGの価値とユースケース
- 5. Salesforce Data CloudとAgentforceでの実現
- 5.1 Salesforce Data Cloud
- 5.2 Salesforce Agentforce
- 5.3 統合されたエコシステムの価値
- 6. まとめ
AI技術の急速な発展とともに、「ベクトル検索」や「RAG」といった用語を耳にする機会が増えてきました。しかし、これらの技術について「なんとなく分かるけど、詳しく説明してと言われると…」という方も多いのではないでしょうか。今回は、これらの技術について分かりやすく解説していきます。
VectorDB(ベクトルデータベース)とは
VectorDBとは、あらゆるデータをベクトル形式で格納し、類似検索を可能にするデータベースのことです。
ベクトル形式とは
ベクトル形式とは、ものや言葉の概念を数値で説明するために、多次元のベクトルに対象物を位置させ、特定の空間内での対象物の位置や方向を数値を使って表すことができる形式です。
分かりやすい例として、ソファを考えてみましょう。ソファをベクトル形式で表現する場合、幅・奥行・高さの3軸の情報があれば、なんとなく特定の空間内の大きさや形をイメージできます。これを3次元ベクトルになおすと(140, 142.5, 89)のような3つの数値の並びで表すことができます。
しかし、これだけではどんな家具で、どんな色で、どんな素材かは判別できません。3次元では足りないのです。
ベクトル化による類似検索の仕組み
実際には、もっと多くの次元を使って、あらゆるものをベクトル化することで、位置関係が近い=意味が近いということが判断できるようになります。これにより、従来のキーワード検索とは異なる**類似検索(セマンティック検索)**が可能になります。
例えば、Embedding Projectorという可視化ツールでは、「mickey」と検索すると、意味的に類似する「mouse」が一番近くにプロットされていることが確認できます。これは、文字列としては全く異なる単語でも、意味的な関連性をベクトル空間上の距離として表現できることを示しています。
なぜVectorDBが必要なのか?
VectorDBが注目される理由は、主に以下の2つです。
1. 非構造化データの活用が可能
これまでのデータベースでは、主に構造化データ(表形式のデータなど)を扱ってきました。しかし、現実世界の情報の多くは、テキスト、画像、音声などの非構造化データです。
従来の全文検索では、文書の中身を検索対象として、特定のキーワードが含まれているレコードを見つけることしかできませんでした。一方、ベクトル検索では、テキスト、画像、音声などのデータを数値のベクトルに変換し、そのベクトル空間での位置関係(類似性)をもとに検索を行うことができます。
2. より高度な検索が可能
キーワード検索では、完全一致や部分一致でしか検索できませんが、ベクトル検索では意味的な類似性に基づいた検索が可能です。これにより、ユーザーが意図した情報により近い結果を取得できるようになります。
VectorDBにデータを格納する仕組み
VectorDBにデータを格納するには、以下の3つのステップが必要です。
1. チャンク化
長いテキストや文書を、適切なサイズの小さな塊(チャンク)に分割します。例えば、長い文章を段落ごとや一定の文字数ごとに区切ります。
2. ベクトル化
各チャンクを数値のベクトルに変換します。これは、AI技術を使って文章の意味を数値で表現する処理です。
3. 格納
生成されたベクトルをデータベースに保存します。
Salesforce Data Cloudでは、このチャンク化とベクトル化の工程を「検索インデックス」と呼んでいます。ただし、データ取り込みの方式やチャンク化には注意すべきポイントがあるため、適切な設計が重要です。
RAG(Retrieval Augmented Generation)とは?
RAGとは、AIからより良い結果を得るために、キーワード検索で取得した結果だけでなく、Vector検索した結果も含めてプロンプトを充実させる技術です。
RAGの仕組み
RAGは以下のステップで動作します。
- 質問を投げる: ユーザーが質問や要求を入力
- 関連情報を検索(Retrieve): ベクトル検索を使って関連する情報を取得
- プロンプトを強化(Augment): 検索データを質問に付与してプロンプトを充実化
- 回答文を生成(Generate): コンテキストを理解した上でLLMが回答を生成
このプロセスにより、単純にLLMに質問するよりも、より正確で文脈に適した回答を得ることができます。
RAGの価値とユースケース
RAGの真の価値は、技術そのものよりも**「何のためにRAGという技術を利用するのか」というユースケース**にあります。
例えば、以下のような場面でRAGが威力を発揮します。
- 社内ナレッジベースの活用: 膨大な社内文書から適切な情報を素早く見つけて回答
- 顧客サポートの強化: 過去の問い合わせ履歴や製品マニュアルを参照した的確な対応
- コンテンツ推薦: ユーザーの興味や行動履歴に基づいた精度の高い推薦
- 研究開発支援: 関連する論文や特許情報を効率的に調査
Salesforce Data CloudとAgentforceでの実現
これらの技術は、Salesforce のプラットフォームでも積極的に活用されています。
Salesforce Data Cloud
Data Cloudは、Salesforceが提供する統合データプラットフォームで、VectorDBとRAG技術を組み込んでいます。主な機能には以下があります。
- 統合データ管理: CRM データ、外部データ、非構造化データを一元管理
- リアルタイム処理: ストリーミングデータの即座な処理と分析
- セマンティック検索: ベクトル検索による意味的な情報検索
- AI活用基盤: Einstein AIやAgentforceへのデータ提供基盤として機能
Data Cloudでは、チャンク化とベクトル化の工程を「検索インデックス」として提供し、企業が保有する様々なデータソースを AI で活用できる形に変換します。
Salesforce Agentforce
Agentforceは、Salesforceの最新AI エージェントプラットフォームで、RAG技術を活用して以下の機能を提供します。
- 自律的な顧客対応: 顧客からの問い合わせに対して、関連するナレッジベースや過去の履歴を参照しながら自動回答
- 営業支援: 顧客情報や製品情報を総合的に分析し、最適な提案やネクストアクションを提示
- サービス最適化: 過去のサービス履歴やマニュアルを参照して、技術的な問題の解決策を自動提案
- マルチチャネル対応: チャット、メール、音声など様々なチャネルでの一貫した対応
Agentforceは、Data Cloud上に蓄積されたデータをRAG技術で活用することで、単なるチャットボットを超えた、実際のビジネスプロセスを理解し実行できる AI エージェントとして機能します。
統合されたエコシステムの価値
Data CloudとAgentforceが連携することで、以下のような価値を提供します。
- データの民主化: 技術的な専門知識がなくても、自然言語でデータにアクセス可能
- コンテキスト理解: 顧客の過去の履歴や状況を踏まえた適切な対応
- 継続的学習: 新しいデータやフィードバックを基に、エージェントの精度が向上
- スケーラブルな自動化: 人間のエージェントと同等の品質で、24時間365日対応
まとめ
ベクトル検索とRAGは、従来の検索技術では実現できなかった「意味的な理解」を可能にする革新的な技術です。特に非構造化データが爆発的に増加している現代において、これらの技術の重要性はますます高まっています。
Salesforce Data CloudとAgentforceは、これらの最新技術を企業が実用的に活用できる形で提供しており、顧客体験の向上と業務効率化を同時に実現します。
重要なのは、技術そのものよりも「どのような課題を解決したいのか」「どのような価値を提供したいのか」という目的を明確にすることです。適切なユースケースを見つけることで、これらの技術は強力なビジネスツールとなります。
________________________________________
フロッグウェル株式会社について
フロッグウェル株式会社では、Salesforce Agentforceの導入支援を行っております。RAGをはじめとした最新のAI技術を活用し、お客様のビジネス課題の解決をサポートいたします。Agentforceの導入をご検討の際は、ぜひお気軽にご相談ください。
<Salesforce>
弊社ではSalesforceをはじめとするさまざまな無料オンラインセミナーを実施しています!
>>セミナー一覧はこちら
また、弊社ではSalesforceの導入支援のサポートも行っています。ぜひお気軽にお問い合わせください。
>>Salesforceについての詳細はこちら
>>Salesforceの導入支援実績はこちらからご覧いただけます!
医療業界に特化した営業支援、顧客管理(SFA/CRM)のコンサルティングも提供しております。こちらもぜひお気軽にお問い合わせください。
>>顧客管理(SFA/CRM)のコンサルティングの詳細はこちら