AI/RAG 이론
벡터 검색 : Reranking 필요 이유
데이터 쿡북
2025. 7. 11. 12:50
[AI를 활용해 작성되었습니다.]
RAG는 검색 시간을 단축 하기 위해 Approximate Nearnest Neighbor search (ANNs) 기술을 활용하는데 이대 질문과 관계 없는 문서가 검색될 수 있기 때문에 Reranking 관련 정보를 기준으로 순위를 다시 선정해야 한다
[출처] https://www.pinecone.io/learn/series/rag/rerankers/
🔁 Reranking의 원리
📌 1단계: 근사 검색 (ANN - Approximate Nearest Neighbor)
- IVF, HNSW, PQ 등의 인덱스는 전체 데이터 중 일부 후보 벡터만 빠르게 선택합니다.
- 이 과정에서는 정확한 유사도/거리 계산 없이, 대략적으로 "가까울 것 같은" 벡터들을 찾습니다.
- 예: IVF는 쿼리 벡터와 가까운 nprobe 개 클러스터만 보고 그 안에서 후보를 고름.
📌 2단계: Reranking (재정렬)
- 근사 검색 결과(예: Top 100 candidates)에 대해서만 정확한 거리 계산을 수행합니다.
- 일반적으로는 L2 거리 (Euclidean) 또는 Cosine 유사도 같은 정밀한 수치를 사용.
- 그 결과를 바탕으로 진짜 Top-k를 다시 선정합니다.
🎯 왜 필요한가?
항목근사 검색만근사 + Rerank
✅ 속도 | 매우 빠름 | 빠름 |
❌ 정확도 | 낮을 수 있음 | 높아짐 |
활용 예 | rough filtering | 최종 추천, 검색 결과 |
🧠 Rerank이 필요한 대표 사례
사례설명
AI 추천 시스템 | 사용자 유사도 기반 후보 필터링 후, 정확한 콘텐츠 추천 |
검색 엔진 | 대용량 검색 인덱스로 1차 필터 후, 정확도 높은 결과 표시 |
질문-응답 시스템 (RAG) | Retriever가 가져온 문서를 rerank해 최적의 답변 추출 |
📌 요약
항목내용
목적 | 근사 검색 결과를 정밀하게 다시 정렬 |
방법 | 정확한 거리 계산 후 정렬 |
효과 | 검색 품질 향상, Top-k 정확도 증가 |
위치 | 후처리 단계에서 실행됨 |
공감버튼이 큰 힘이 됩니다.