1. Graph Index란?
Graph Index는 각 벡터를 노드(node)로 보고, 유사한 벡터끼리 엣지(edge)로 연결하여 그래프 형태의 인덱스를 구성하는 방식입니다.
검색할 때는 그래프 위를 탐색하며 점점 더 유사한 벡터로 이동하는 식으로 근접 벡터를 찾습니다.
대표적인 구현은 HNSW (Hierarchical Navigable Small World)입니다.
2. Graph Index의 동작 원리 (HNSW 기준)
주요 개념
- 노드(Node): 저장된 벡터
- 엣지(Edge): 유사한 노드 간 연결
- 탐색(Traversal): 이웃 벡터 중 더 가까운 쪽으로 이동
- 레벨(Level): 계층 구조를 통해 탐색 효율 향상
- 상위 레벨에서 대략적인 위치 탐색
- 하위 레벨로 내려가며 근접 노드들 사이를 이동
- 최종적으로 Top-K 유사 벡터 탐색
3. Graph Index의 장점과 단점
항목 장점 단점
🔍 검색 정확도 | 매우 높음 (거의 정확 검색에 가까움) | - |
🚀 검색 속도 | 빠름 (정확도보다 약간 느릴 수 있음) | 삽입 시 구조 재조정 필요 |
🔁 실시간 삽입 | 일부 구현은 지원 | HNSW는 삽입/삭제 비용이 큼 |
🧠 구현 복잡도 | 효율적인 탐색 알고리즘 | 구조와 튜닝이 복잡 |
4. 다른 인덱스와 비교
인덱스 방식 특징 정확도 속도 사용 예
Hash Index (LSH) | 해시로 버킷 분류 | 낮음 | 매우 빠름 | 빠른 근사 검색 |
IVF (Inverted File) | 클러스터 기반 | 중간 | 빠름 | FAISS |
Graph (HNSW) | 그래프 탐색 기반 | 높음 | 빠름 | Qdrant, NMSLIB, FAISS |
PQ (Product Quantization) | 압축 기반 정밀 검색 | 높음 | 중간 | 대규모 압축 검색 |
[AI를 활용해 작성되었습니다]
공감버튼이 큰힘이 됩니다.
'AI > RAG 이론' 카테고리의 다른 글
벡터 데이터베이스 : 양자화 기법(SQ, PQ) (1) | 2025.07.14 |
---|---|
벡터 데이터베이스 : Hash Index란 (0) | 2025.07.14 |
RAG 구현시 고려사항 : (6) 멀티턴 대화(ConversationBufferMemory) (0) | 2025.07.11 |
RAG 구현시 고려사항 : (5) RAG 성능 최적화 전략 (1) | 2025.07.11 |
RAG 구현시 고려사항 : (4) 프롬프트 설계 및 Generator 고려사항 (4) | 2025.07.11 |
댓글