はじめに
2021年にMLOps勉強会で発表されて公開された資料をもとにツールごとに発表内容をまとめてみました。 *2022年1月の発表が最近あり、且つ有用な資料もありましたので2件も記載しています。
クラウド
GCP / Vertex AI / Kubeflow
もともとはGCP AI platformとして展開されていたが2021/5月にVertex AIとして提供されることを発表された。 Kubeflow, TFXなどもこちらに含むこととしています。
tutorial
Kubeflow Pipelinesのサンプル by Aseiさん *Aseiさんが転職されてメンテナンスされているかは不明
発表資料
露木さん / 実践Continuous Training
Nakagawaさん / メルペイの与信モデリングにおける特徴量の品質向上の施策
中山さん / Vertex Pipelinesを障ってみた
Kohamaさん / Polyaxon + Kubeflow を利用した効率的な継続的モデルインテグレーション
Aseiさん / 機械学習パイプラインの要件と Vertex Pipelines
大嶋さん / そのEdgeAIはUXを 改善できるか
Fengさん / JX通信社における実践的MLOps
AWS
特定のソリューションというわけではなく、マネージドサービスを組み合わす感じ。
MLOpsサンプル
発表資料
斎藤さん / 異音検知プラットフォーム開発におけるMLOpsの実際と考察
麻生さん / AWSを活用した機械翻訳のためのGPU並列処理環境の構築
山口さん / 少人数PJにおける MLOps事例
大渕さん / AWSではじめるMLOps
井上さん / AWS IoT Greengrass を活用した機械学習モデルのデプロイ
Azure
WIP
発表資料
女部田さん、伊藤さん / MLflow と ONNX で実現するクラウドネイティブな MLOps
OSS
Data Version Control
公式サイト
Get Started
発表資料
高橋さん / Data Version Control による実験管理の実務での適用事例
Kasaiさん / DVC を活用した機械学習パイプライン開発の高速化
Pytorch Lightning
https://www.pytorchlightning.ai/
tutorials
https://www.pytorchlightning.ai/tutorials
発表資料
Hwangさん / PyTorch Lightningのススメ
Polyaxon
Quick start
https://polyaxon.com/docs/intro/quick-start/
発表資料
Kohamaさん / Polyaxon + Kubeflow を利用した効率的な継続的モデルインテグレーション
Github Action
発表資料
片岡さん / ロボットシステムの開発と運用、本番で一発完動するロボットシステムのために
Ohters
Mercari / ml-system-design-pattern
Github URL
https://github.com/mercari/ml-system-design-pattern
発表資料
澁井さん / MLOpsのはじめ方
MLOps.toys
MLOpsに関わるツールをカテゴリごとにまとめているサイト https://mlops.toys/