본문 바로가기
Dev/Article

MLOps(Machine Learning Operations)

by Luigi.yoon 2025. 3. 17.

MLOps(Machine Learning Operations)는 머신러닝 시스템의 개발(Development)과 운영(Operations)을 통합하는 일련의 기술 및 조직적 방법론입니다. DevOps의 개념을 머신러닝 개발에 적용한 것으로, 모델 개발부터 배포, 모니터링, 재학습까지의 전체 파이프라인을 자동화하고 안정화하는 것이 목적입니다.


🔹 MLOps 정의

MLOps는 머신러닝 모델의 개발, 배포, 모니터링, 관리, 재학습 자동화를 지원하는 프로세스, 도구, 문화를 말하며, 다음을 포함합니다:

  • 데이터 수집 및 전처리 파이프라인
  • 모델 학습 및 검증
  • 모델 버전 관리
  • 모델 서빙 및 배포 자동화
  • 운영 중인 모델 모니터링
  • 지속적 재학습(CI/CD/CT for ML)

 


 

 

 

📊 MLOps Lifecycle

단계 이름 주요 작업 사용 도구 예시
1 Data Preparation
(데이터 준비)
- 데이터 수집
- 결측치/이상치 처리
- 피처 엔지니어링
- 데이터 분할(Train/Test)
Pandas, Spark, Tecton, Feast
2 Model Training
(모델 학습)
- 알고리즘 선택
- 하이퍼파라미터 튜닝
- 모델 학습 및 버전 관리
TensorFlow, PyTorch, scikit-learn, MLflow
3 Model Evaluation
(모델 평가)
- 정확도, F1, RMSE 등 성능 평가
- 기준 미달 시 재훈련
MLflow, WandB, EvidentlyAI
4 Deployment
(모델 배포)
- 모델 서빙(API/배치)
- A/B 테스트
- 롤백 전략 마련
Seldon Core, KFServing, BentoML, Docker, K8s
5 Monitoring & Maintenance
(모니터링 및 유지보수)
- 예측 품질 추적
- 데이터/모델 드리프트 탐지
- 알람 설정 및 운영 대응
Prometheus, Grafana, WhyLogs, DataDog
6 Retiring & Replacing Models
(모델 폐기 및 교체)
- 성능 저하 모델 폐기
- 재학습 또는 새 모델 배포
- 모델 버전 롤백/관리
MLflow Registry, SageMaker Model Registry
 
 

 


🔸 MLOps 도입 효과

  • ✔ 모델 배포 주기 단축 (수주 → 수일)
  • ✔ 신속한 버전 롤백 및 테스트
  • ✔ 운영 중 성능 저하 탐지 가능
  • ✔ 반복 가능하고 재현 가능한 파이프라인

🔹 결론: 왜 MLOps가 필요한가?

머신러닝 시스템은 단순한 코드가 아닌, 데이터 품질, 모델 버전, 환경 설정, 재현성 등 많은 요소에 의해 좌우됩니다. 따라서 개발과 운영의 경계를 허물고, 지속적으로 개선 가능하며, 안정적인 머신러닝 시스템을 유지하려면 MLOps는 필수적입니다.

'Dev > Article' 카테고리의 다른 글

GitOps(Git-based Operations)  (0) 2025.03.17
DataOps(Data Operations)  (0) 2025.03.17
데브옵스(DevOps)  (0) 2025.03.17
헥사고날 아키텍처 (Hexagonal Architecture)  (0) 2025.03.17
소프트웨어 Architect 종류와 개념  (0) 2025.03.17