코딩하는 임초얀

[서평] 머신러닝 시스템 구축 실전 가이드 본문

카테고리 없음

[서평] 머신러닝 시스템 구축 실전 가이드

초얀 2024. 2. 1. 06:10

제이펍의 인공지능 시리즈로 나온 도서로, 일본 도서의 번역본이다.
딱 한 달 전에 출간된 따끈따끈한 도서!

 

 

머신러닝 시스템 구축 실전 가이드

비즈니스 시나리오로 체득하는 머신러닝 시스템 구축 노하우 과제 설정, 워크플로 설계, 시스템 구축과 개발 등 머신러닝 제품을 실제 비즈니스로 만들기 위해 알아야 할 모든 것을 다룬다. 머

jpub.tistory.com


내가 꼽은 이 도서의 특징

  • 분류: MLOps
  • 부제인 '비즈니스 사례로 배우는 머신러닝 제품 설계/구축/운용'이 중요한 키워드이다. 총 4개의 챕터, 즉 4가지 사례를 직접 구현할 수 있도록 짜여진 도서이다. 개인적으로 이게 장점이자 단점이라고 생각한다. '이론서 vs. 실전적용' 은 취향에 따라 갈리는 문제이니.
  • 사례를 얼마나 구체적으로 다뤄주는지는 도서의 목차를 보면 감이 오실텐데, 팀원을 어떻게 구성해야 하는지부터 각 사례의 해석과 anomaly detection, word vector와 심지어 마지막에는 MobileNet까지 활용한다..!!!!
  • 전혀 번역서 같지 않은 자연스러운 문장 및 문단 구성!!! 읽는데 전혀 방해되지 않는다. 정말 친절하게 설명되어 있어 술술 읽히는 건 덤이다.
  • 책에 제공된 코드를 GitHub에도 제공해주신다! (역자 제공) 또한, 코드를 실행하는 데 사용한 SW 종류 및 버전까지(!) 명시되어있다.
  • 표지에도 코딩하는 고양이가, 사례 중에도 고양이 앱이 등장하는데 저자인 시부이 유스케가 고양이 집사라서 그렇다.

 

이 책에 관심 있는 분들이라면 제일 관심 있어하실 정보는 아마도, 도서의 '대상 독자 및 사전 지식' 부분일 것이다. 아래는 그 부분을 그대로 인용하여 적어둔 것이니, 본인이 원하는 도서이다!하면 바로 시도해보시길 바란다ㅎㅎ

  • 이 책은 AI 엔지니어나 시스템 엔지니어를 주 대상 독자로 합니다. ML을 효과적으로 활용하기 위해 특정한 비즈니스 상황을 가정하고, ML을 사용하는 상황이나 요건, ML을 사용하는 워크플로와 시스템, 개발/운용 팀의 구성에 관해 설명합니다.
  • ML 시스템에 대한 광범위한 설계, Python을 이용한 ML 시스템 구현 예시를 함께 설명하며, ML을 실질적으로 활용하기 위한 방법론이나 운용 및 개선 노하우도 다룹니다.
  • 코드 재현성을 담보하기 위해 Docker와 Kubernetes를 활용합니다.
  • 언어는 주로 Python(v3.10)을 활용합니다. 일부 안드로이드 앱을 개발하는 데에는 Kotlin도 사용했습니다.
  • Python library 관리에는 Poetry를 사용합니다.
  • ML library로는 TensorFlow, ScikitLearn, LightGBM을 사용합니다. 데이터 처리 library로는 pandas, NumPy, pandera 등을 사용합니다.
  • 시스템 구현 시 워크플로 엔진으로는 Argo Workflows, 검색 엔진으로는 Elasticsearch, ML 관리에는 MLflow, 웹 화면에는 Streamlit, 웹 API로는 FastAPI 등 다양한 SW를 활용합니다.

기울임체로 작성한 내용을 보면 알겠지만, 이 책에서는 ML 시스템 구축을 하나부터 열까지 모두 담고 있다..!!

 

 

내가 정리한 이 도서의 구성

  • 챕터1의 경우 사례 해결보다는 팀 구성 등 인적 자원 관리에 대한 내용을 주로 다룬다. 한 팀을 이끌 정도가 되는 직책인 매니저(?)분들께 필요한 내용.
  • 챕터2~4의 경우 하나의 사례씩 할애하여 각 사례 별로 어떻게 시스템을 구축하면 되는지 예제 코드와 함께 상세하게 설명해준다. 현업자가 회사 적용 때문에 참고하기에는 사례가 너무 구체적이라 시간 투자를 많이 해야할 것 같아서, 현업자보다는 현업자 지망생(?)에게 더 도움이 될 것 같다.
Comments