Book

[북 리뷰] MLOps 도입 가이드

mokpolar 2022. 5. 29. 11:41
반응형

내가 이 책을 받은 시점에 내가 개인적으로 아는 어떤 MLOps 조직의 리더도 이 책을 구입하고 이미 읽은 상태였다.

어쩌다 이 책에 대한 얘기가 나와서 이 책에 대한 평을 듣게 되었는데 그의 한 줄 소감은,

“책이 가벼워서 쭉 쉽게 읽어보기 좋은데 MLOps 플랫폼 관련해서 애매모호 했던 부분에 대해 전체적으로 개념을 잡아주는 책이다.”

였다.

 

모르는 사람이 들으면 간단하면서도 사정을 아는 사람이 들으면 더 깊게 들리는 말인 것 같다.

그건 아직은 MLOps 플랫폼 구성에 있어 정립하기 애매모호한 측면이 많기 때문인데.. 

 

그 이유는 책에 나온 아래 도식을 보면 알 수 있을 것 같다. 

일반적인 조직 내 머신러닝 모델 생애주기에 대한 사실적 도식화라고 표현한 그림이다. 

 

 

조직 관점에서 바라보는 머신러닝 모델의 생애주기라는건 보다 큰 범위를 생각해야 하고 엮여있는 이해관계자가 많다는 사실을 알 수 있다.

 

이 책의 대상 독자는

상용 환경에서 머신러닝 적용 실무를 담당하는 데이터 분석 팀 혹은 IT 운영 팀의 관리자.. 라고 되어 있는데
MLOps 가 왜 필요하고 전체적으로 어떻게 돌아가는지를 배우고 싶은 사람이면 누구나 읽고 싶을 것이라고 생각한다. 

 

책의 내용

이 책은 정말 가볍다. 책의 페이지 수는 200페이지에 불과해 접근하기가 더 좋다. 

각 이해관계자를 위해 쓰였기에 공통적인 이해를 돕기 위한 목적이 있는 듯한데, 그래서 읽기 쉽다. 

머신러닝 모델의 생애주기와 엮여 있는 이해관계자라면 가벼운 마음으로 책을 들어도 좋을 것 같다. 

 

책의 구성은 

  • MLOps 가 왜 필요하고 왜 중요하며 왜 어려운지를 먼저 설명한다. 위에 첨부한 도식에서 볼 수 있듯이 프로젝트의 전체를 볼 수 있게 하는 데 목적이 있는 것 같다. 
  • 여기서 다루는 MLOps는 "엔터프라이즈" 수준의 MLOps이며 그에 관련한 고려사항들이 안내되어 있다. 
  • 그 다음 챕터는 아주 좋다고 생각하는데, MLOps와 관련된 이해관계자들과 그들의 역할 및 MLOps에 대한 요구사항을 표로 보여준다. 
  • 그리고 각 이해관계자들에 대해 상세히 설명한다. 이 부분이 아주 재미있다. 여기서 나열하는 이해관계자들은 아래와 같다. 
  • 직무 전문가, 데이터 과학자, 데이터 엔지니어, 소프트웨어 엔지니어, DevOps, 모델 리스크 관리자, 머신러닝 아키텍트
  • 이들의 요구 사항이 무엇이고 역할이 무엇이고 이들에게 필요한게 무엇인지를 상세히 작성해서 그들의 입장을 이해하게 만들어준다.
  • MLOps의 생애주기와 각 단계에 대한 설명이 이어진다. 죽 읽어나가면서 MLOps의 생애주기를 다시 한번 이해하고 점검할 수 있다. 
  • 전체적인 생애주기를 위에서 조망하는 느낌이라 이 책에서 명시한 독자가 관리자인 이유를 이해할 수 있다. 
  • 다만, 실무를 접하지 못한 상태에서는 다소 추상적으로 느껴질 수도 있다. 
  • 이후로는 실제 MLOps를 적용하는 방법으로 모델 개발, 상용화 준비, 상용 배포 모니터링 루프 등을 각각 독립적인 챕터로 다룬다. 
  • 실제로 어떤 솔루션이나 오픈소스를 적용해야 한다는 내용이 아니다. 어떤 단계들에 어떤 도전과제들이 있고 어떤 식으로 수행해야 한다는 가이드라인이다. 
  • 아마 진행중인 프로젝트가 있다면 이 책들을 보면서 아 이런 것들을 고려해야 하는구나, 아 이 부분이 빠졌구나 하는 깨달음을 얻을 수 있지 않을까 하는 생각이 든다. 

 

 

MLOps 도입을 고려 중인 조직이라면 관련자들에게 이 책을 배포해서 다 읽힌 다음 MLOps에 대한 이해도를 같이 올린 다음에 일을 시작해도 좋을 것 같다. 

 

— “한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다 —

반응형