✅ RAG란? (Retrieval-Augmented Generation)
RAG는 외부 지식을 검색(Retrieval)하여, 생성(Generation)에 활용하는 AI 기술 방식입니다.
즉, "생성형 AI + 검색 시스템"을 결합한 구조입니다.
🔍 개념 요약
RAG는 다음 2단계로 동작합니다:
- Retrieval (검색)
- 주어진 질문에 대해, 벡터 DB 또는 문서 저장소에서 관련 문서나 정보를 검색합니다.
- 주로 FAISS, Weaviate, Elasticsearch, Pinecone 등이 사용됩니다.
- Generation (생성)
- 검색된 문서를 기반으로, LLM(예: GPT)이 답변을 생성합니다.
- 이때 검색된 문서를 context로 넣어 정확도와 신뢰도를 높입니다.
✅ 왜 필요한가?
기존 LLM(예: GPT-3.5, GPT-4)은 고정된 지식만 갖고 있어서:
- 최신 정보 반영 어려움
- 기업 내부 문서 반영 불가
- 정확하지 않은 “환각(hallucination)” 문제 발생
→ RAG는 이를 해결하기 위해 외부 정보에 접근할 수 있도록 설계된 구조입니다.
📌 RAG 구조 그림 (개념도)
User Query
↓
[Retriever: 문서 검색] ←——— 문서 벡터 DB
↓
[Generator: LLM이 생성 (GPT 등)]
↓
Answer with grounded context
✅ 기존 방식과 RAG 비교
항목 | 전통 LLM 응답 | RAG 기반 응답 |
지식 출처 | 모델 학습 시점에 고정된 지식 | 실시간 검색한 문서 (최신 정보 가능) |
최신성 | 낮음 | 높음 |
맞춤형 응답 (기업 내부 문서 등) | 불가능 | 가능 |
환각(hallucination) | 자주 발생 | 줄어듦 (검색된 문서에 기반) |
적용 예시 | GPT 단독 사용 | 검색 + GPT 통합 사용 (ex. ChatPDF, Copilot 등) |
✅ RAG 도입 시 고려할 점
고려 요소 | 설명 |
Retrieval 품질 | 검색 결과가 정확해야 답변 품질도 높아짐 |
Index 구조 | 문서를 어떻게 벡터화하고, chunk할 것인지 |
LLM 입력 길이 | 너무 많은 context를 넣으면 비용·속도 증가 |
정합성 검증 | 여전히 100% 정확하진 않기에, 답변 평가가 중요 |
✅ RAG 사용 예시
- ChatGPT + 기업 내 문서 연결 (ChatGPT RAG Plugins)
- Copilot for Docs: 개발자 문서 기반 응답 생성
- 법률, 의료, 금융 분야 맞춤형 챗봇
- Customer Support 자동화
✅ 결론 요약
✅ RAG의 핵심 장점 |
💡 LLM + 외부지식 조합 |
📚 최신 정보 반영 가능 |
🧠 환각 줄이고 정확성 증가 |
🏢 기업 맞춤형 도입 가능 |
'Dev > AI' 카테고리의 다른 글
확률 기반 모델(probabilistic model) (0) | 2025.06.29 |
---|---|
랭체인(LangChain) (0) | 2025.06.27 |
딥러닝(Deep learning) (0) | 2025.06.26 |
감독학습 비감독학습 강화학습 (0) | 2025.06.26 |
Self-Attention 매커니즘 설명 (0) | 2025.05.16 |