RAG 구현시 고려사항 : (3) Retriever 설계 고려사항

AI/RAG 이론

_쿡북_ 2025. 7. 11. 13:28

3. Retriever 설계 고려사항

Retriever는 유사한 문서를 정확하고 빠르게 찾기 위한 핵심 컴포넌트입니다. 아래는 Retriever를 구성할 때 고려해야 할 주요 요소들입니다.

역할: 사용자 쿼리와 문서를 의미 기반 벡터로 변환
선택 기준:
- 의미 보존력 (semantic similarity 성능)
- 다국어/한국어 지원 여부
- 추론 속도 vs 정확도
- 오픈소스 vs 상용 API

추천 모델 예시:

모델명특징

역할: 벡터를 저장하고 유사한 벡터를 빠르게 검색
선택 기준:
- 처리 용량 (수천 → 수억 건 이상)
- 필터링 기능 (metadata filtering)
- 클라우드 or 로컬
- 실시간 업데이트 지원 여부

비교 표:

DB특징

구조특징

⚠️ Flat은 소규모 테스트에, IVF/HNSW는 대규모 검색에 적합

방식설명활용 예

Pinecone, Weaviate, Vespa 등에서 지원

목적전략

정확도 향상	좋은 임베딩 + HNSW + Cosine + Reranking
속도 우선	IVF 인덱스 + 낮은 nprobe
필터링 필요	Vector DB에서 metadata filtering 활용
최신 정보 반영	실시간 DB update 기능 고려

고려 요소설명

공감버튼이 큰 힘이 됩니다