RAG 구현시 고려사항 : (5) RAG 성능 최적화 전략

AI/RAG 이론

_쿡북_ 2025. 7. 11. 13:35

5. RAG 성능 최적화 전략

RAG 시스템은 구조적으로 유연하고 강력하지만, 검색 정확도와 생성 품질은 세부 구성과 튜닝 수준에 따라 천차만별입니다.
이 장에서는 실제 현업 또는 서비스 환경에서 RAG 성능을 최적화하는 방법과 정량적 평가 지표를 소개합니다.

항목 설명 최적화 전략

항목 전략

항목 설명 전략

지표 설명

🧪 추천 도구: BEIR Benchmark, LangChain Evaluation, LlamaIndex Eval

실험 목표 실험 항목 측정 지표

문서 수 최적화	top_k 변화	Recall@k
프롬프트 템플릿 개선	instruction vs no-instruction	정답률, hallucination rate
모델 비교	GPT-4o vs Claude 3	응답 정확도, latency
임베딩 모델 교체	BGE vs Ada vs E5	Recall, MRR

항목 설명

임베딩 캐싱	동일 문서 재처리에 비용 절감
문서 pre-split	길이 기반 chunking, 중복 방지
DB 업데이트 전략	주기적 batch 업데이트 or streaming ingestion
로그 기반 분석	LLM 응답 품질 피드백 loop 구성 (RAG Loop 개선)

영역 최적화 포인트

Retriever	top_k, nprobe, Hybrid, Reranking
Prompt	중복 제거, 명확한 지시어, 요약
Generator	적절한 model 선택과 temperature 튜닝
평가 지표	Recall, MRR, Precision, Latency 등
운영 최적화	캐싱, pre-processing, feedback loop 구성