AI/RAG 이론

벡터 데이터베이스 : Graph Index

_쿡북_ 2025. 7. 14. 13:27

1. Graph Index란?

Graph Index는 각 벡터를 노드(node)로 보고, 유사한 벡터끼리 엣지(edge)로 연결하여 그래프 형태의 인덱스를 구성하는 방식입니다.
검색할 때는 그래프 위를 탐색하며 점점 더 유사한 벡터로 이동하는 식으로 근접 벡터를 찾습니다.
대표적인 구현은 HNSW (Hierarchical Navigable Small World)입니다.

2. Graph Index의 동작 원리 (HNSW 기준)

주요 개념

  • 노드(Node): 저장된 벡터
  • 엣지(Edge): 유사한 노드 간 연결
  • 탐색(Traversal): 이웃 벡터 중 더 가까운 쪽으로 이동
  • 레벨(Level): 계층 구조를 통해 탐색 효율 향상

 

  • 상위 레벨에서 대략적인 위치 탐색
  • 하위 레벨로 내려가며 근접 노드들 사이를 이동
  • 최종적으로 Top-K 유사 벡터 탐색

 

3. Graph Index의 장점과 단점

항목                                 장점                                                                            단점
🔍 검색 정확도 매우 높음 (거의 정확 검색에 가까움) -
🚀 검색 속도 빠름 (정확도보다 약간 느릴 수 있음) 삽입 시 구조 재조정 필요
🔁 실시간 삽입 일부 구현은 지원 HNSW는 삽입/삭제 비용이 큼
🧠 구현 복잡도 효율적인 탐색 알고리즘 구조와 튜닝이 복잡
 

4. 다른 인덱스와 비교

 
인덱스 방식                                             특징                                  정확도    속도               사용 예  
Hash Index (LSH) 해시로 버킷 분류 낮음 매우 빠름 빠른 근사 검색
IVF (Inverted File) 클러스터 기반 중간 빠름 FAISS
Graph (HNSW) 그래프 탐색 기반 높음 빠름 Qdrant, NMSLIB, FAISS
PQ (Product Quantization) 압축 기반 정밀 검색 높음 중간 대규모 압축 검색

 

[AI를 활용해 작성되었습니다]
공감버튼이 큰힘이 됩니다.