Skip to content

Instantly share code, notes, and snippets.

@kimyongin
Created January 3, 2025 06:54
Show Gist options
  • Save kimyongin/92a53a646c94511ffc8f4421b7803ac4 to your computer and use it in GitHub Desktop.
Save kimyongin/92a53a646c94511ffc8f4421b7803ac4 to your computer and use it in GitHub Desktop.

LLM 모델 유형과 활용 사례 비교

범용 LLM

  • 특징:
    • 모든 도메인에 대한 데이터를 학습.
    • 적당한 응답 품질 보장.
  • 장점:
    • 다양한 도메인 질문에 유연하게 대응 가능.
    • 새로운 도메인 지식 없이도 적절한 응답 생성.
  • 단점:
    • 특정 도메인 질문에서 문맥 불명확성 발생 가능 (예: "Java"는 Coffee? Programming?).
    • 최신 데이터 반영이 어려움 (재학습 필요).
    • 비용: 초기 학습 비용이 매우 높으며, 유지보수 비용도 큼.

특화 LLM

  • 특징:
    • 특정 도메인 데이터만 학습.
    • 도메인 내 높은 응답 품질 제공.
  • 장점:
    • 특정 도메인 질문에 대한 예측 가능성과 높은 정확도.
    • 상대적으로 작은 모델 사이즈로 효율성 높음.
    • 비용: 범용 LLM 대비 초기 학습 비용이 낮음(그럼에도 고비용임).
  • 단점:
    • 도메인 외 질문에 대한 응답 품질이 낮음.
    • 새로운 도메인 지식 추가가 어려움 (재학습 필요).

기존 LLM에 특정 도메인 데이터 추가 학습

1. 파인 튜닝 (Fine-tuning)

  • 특징:
    • 모델의 모든 가중치를 업데이트.
    • 도메인 데이터를 기반으로 학습 비용이 매우 높음.
  • 장점:
    • 높은 응답 품질.
    • 특정 도메인에 완전히 최적화.
  • 단점:
    • 고비용.
    • 범용성을 일부 잃을 수 있음.

2. 어댑터 학습 (Adapter Learning)

  • 특징:
    • 모델의 일부 가중치만 업데이트.
    • 기존 모델의 범용성을 유지하면서 도메인 확장.
  • 장점:
    • 효율적이고 비교적 저비용.
    • 기존 범용 모델의 장점을 유지.
  • 단점:
    • 파인 튜닝만큼 깊은 도메인 최적화는 어려움.

3. 프롬프트 엔지니어링 (Prompt Engineering)

  • 특징:
    • 학습 과정 없이 프롬프트 설계만으로 모델 성능 최적화.
    • 도메인 지식을 쿼리 시에 추가 입력.
  • 장점:
    • 비용 없음.
    • 실시간 수정 가능.
  • 단점:
    • 쿼리가 길어지고 복잡해질 수 있음.

범용 LLM + RAG

  • 특징:
    • 도메인 데이터에 대한 벡터 DB를 구축하여 범용 모델에 연결.
    • RAG는 외부 데이터를 검색하여 LLM이 응답 생성 시 참조.
  • 장점:
    • 도메인 지식 및 유저 데이터를 실시간 반영 가능.
    • 재학습 없이 신규 데이터를 저비용으로 업데이트.
    • 비용: 벡터 DB 구축 및 유지 비용이 발생하지만, 모델 재학습 비용 대비 매우 저렴.
  • 단점:
    • 외부 데이터 조회로 인해 응답 속도가 느릴 수 있음.
    • 오프라인 환경에서는 작동 불가.

활용 사례

활용사례#1: 범용 LLM + 신규질병 RAG

  • 적용 시나리오:
    • 범용 LLM이 일반 의학 지식을 바탕으로 기본적인 질병 질문에 응답.
    • 최근 발생한 특정 질병 정보는 RAG에서 보완.
  • 예시:
    • "최근에 발견된 OOO 질병에 대해 알려주세요" → 범용 LLM이 RAG 데이터를 검색해 응답.
  • 장점:
    • 최신 데이터를 효과적으로 처리.
    • 범용 모델을 재학습할 필요 없음.
  • 단점:
    • 응답 속도가 느릴 수 있음.
    • 비용: RAG 업데이트 비용이 있지만 재학습보다 저렴.

활용사례#2: 범용 LLM + 신규질병 RAG + 개인의료기록 RAG

  • 적용 시나리오:
    • 범용 LLM은 의학적 일반 지식을 바탕으로 도메인 데이터를 검색.
    • 개인 의료 기록 RAG에서 유저 데이터를 검색해 맞춤형 진단 제공.
  • 예시:
    • "내 심박수와 체온을 기반으로, 내가 OOO 질병일 가능성이 있나요?" → LLM이 도메인과 개인 데이터를 결합해 응답.
  • 장점:
    • 개인화된 맞춤형 서비스 제공.
    • 동적 데이터 반영 가능.
  • 단점:
    • 개인정보 보호와 보안 필요.
    • 응답 속도가 느려질 가능성.
    • 비용: 개인 RAG 구축 및 유지 비용이 추가되지만 유연성이 높음.

적용 가능성 평가

기능 범용 LLM 특화 LLM 범용 LLM + RAG
도메인 적합성 적당한 수준 특정 도메인에 최적화 특정 도메인에 추가 확장 가능
최신 데이터 반영 재학습 필요 재학습 필요 RAG를 통해 빠르게 반영
개인화 응답 제한적 제한적 개인 데이터 RAG로 확장 가능
응답 속도 빠름 빠름 다소 느림
비용 효율성 고비용 (범용 모델 유지) 상대적 저비용 초기 저비용, 유지보수 용이
오프라인 동작 가능 가능 외부 데이터 의존으로 불가능

결론

  • 최신성과 개인화를 중시한다면: 범용 LLM + RAG.
  • 고정된 도메인에서의 예측 가능성을 중시한다면: 특화 LLM.
  • 도메인 지식을 지속적으로 업데이트할 필요가 없다면: 범용 LLM 또는 특화 LLM.

RAG는 특히 실시간 데이터 및 개인화된 응답을 지원하는 데 강점이 있으며, 다양한 도메인과 환경에 적합한 하이브리드 접근 방식을 제공합니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment