본문 바로가기
Dev/AI

검색 증강 생성(Retrieval-Augmented Generation; RAG)

by Luigi.yoon 2025. 6. 26.

✅ RAG란? (Retrieval-Augmented Generation)

RAG는 외부 지식을 검색(Retrieval)하여, 생성(Generation)에 활용하는 AI 기술 방식입니다.
즉, "생성형 AI + 검색 시스템"을 결합한 구조입니다.

 

출처 : https://www.jiniai.biz/2023/09/14/llms-rag-%EB%B0%8F-ai%EB%A5%BC-%EC%9C%84%ED%95%9C-%EB%88%84%EB%9D%BD%EB%90%9C-%EC%A0%80%EC%9E%A5-%EA%B3%84%EC%B8%B5/


🔍 개념 요약

RAG는 다음 2단계로 동작합니다:

  1. Retrieval (검색)
    • 주어진 질문에 대해, 벡터 DB 또는 문서 저장소에서 관련 문서나 정보를 검색합니다.
    • 주로 FAISS, Weaviate, Elasticsearch, Pinecone 등이 사용됩니다.
  2. Generation (생성)
    • 검색된 문서를 기반으로, LLM(예: GPT)이 답변을 생성합니다.
    • 이때 검색된 문서를 context로 넣어 정확도와 신뢰도를 높입니다.

✅ 왜 필요한가?

기존 LLM(예: GPT-3.5, GPT-4)은 고정된 지식만 갖고 있어서:

  • 최신 정보 반영 어려움
  • 기업 내부 문서 반영 불가
  • 정확하지 않은 “환각(hallucination)” 문제 발생

→ RAG는 이를 해결하기 위해 외부 정보에 접근할 수 있도록 설계된 구조입니다.


📌 RAG 구조 그림 (개념도)

User Query
   ↓
[Retriever: 문서 검색] ←——— 문서 벡터 DB
   ↓
[Generator: LLM이 생성 (GPT 등)]
   ↓
Answer with grounded context
 

✅ 기존 방식과 RAG 비교

항목 전통 LLM 응답 RAG 기반 응답
지식 출처 모델 학습 시점에 고정된 지식 실시간 검색한 문서 (최신 정보 가능)
최신성 낮음 높음
맞춤형 응답 (기업 내부 문서 등) 불가능 가능
환각(hallucination) 자주 발생 줄어듦 (검색된 문서에 기반)
적용 예시 GPT 단독 사용 검색 + GPT 통합 사용 (ex. ChatPDF, Copilot 등)
 

✅ RAG 도입 시 고려할 점

고려 요소 설명
Retrieval 품질 검색 결과가 정확해야 답변 품질도 높아짐
Index 구조 문서를 어떻게 벡터화하고, chunk할 것인지
LLM 입력 길이 너무 많은 context를 넣으면 비용·속도 증가
정합성 검증 여전히 100% 정확하진 않기에, 답변 평가가 중요
 

✅ RAG 사용 예시

  • ChatGPT + 기업 내 문서 연결 (ChatGPT RAG Plugins)
  • Copilot for Docs: 개발자 문서 기반 응답 생성
  • 법률, 의료, 금융 분야 맞춤형 챗봇
  • Customer Support 자동화

✅ 결론 요약

✅ RAG의 핵심 장점
💡 LLM + 외부지식 조합
📚 최신 정보 반영 가능
🧠 환각 줄이고 정확성 증가
🏢 기업 맞춤형 도입 가능

'Dev > AI' 카테고리의 다른 글

확률 기반 모델(probabilistic model)  (0) 2025.06.29
랭체인(LangChain)  (0) 2025.06.27
딥러닝(Deep learning)  (0) 2025.06.26
감독학습 비감독학습 강화학습  (0) 2025.06.26
Self-Attention 매커니즘 설명  (0) 2025.05.16