はじめに

2021年にMLOps勉強会で発表されて公開された資料をもとにツールごとに発表内容をまとめてみました。 *2022年1月の発表が最近あり、且つ有用な資料もありましたので2件も記載しています。

クラウド

GCP / Vertex AI / Kubeflow

もともとはGCP AI platformとして展開されていたが2021/5月にVertex AIとして提供されることを発表された。 Kubeflow, TFXなどもこちらに含むこととしています。

tutorial

Vertex AI tutorial

Kubeflow Pipelinesのサンプル by Aseiさん *Aseiさんが転職されてメンテナンスされているかは不明

発表資料

露木さん / 実践Continuous Training

Nakagawaさん / メルペイの与信モデリングにおける特徴量の品質向上の施策

中山さん / Vertex Pipelinesを障ってみた

Kohamaさん / Polyaxon + Kubeflow を利用した効率的な継続的モデルインテグレーション

Aseiさん / 機械学習パイプラインの要件と Vertex Pipelines

大嶋さん / そのEdgeAIはUXを 改善できるか

Fengさん / JX通信社における実践的MLOps

AWS

特定のソリューションというわけではなく、マネージドサービスを組み合わす感じ。

MLOpsサンプル

AWS MLOps フレームワーク

発表資料

斎藤さん / 異音検知プラットフォーム開発におけるMLOpsの実際と考察

麻生さん / AWSを活用した機械翻訳のためのGPU並列処理環境の構築

山口さん / 少人数PJにおける MLOps事例

大渕さん / AWSではじめるMLOps

井上さん / AWS IoT Greengrass を活用した機械学習モデルのデプロイ

Azure

WIP

発表資料

女部田さん、伊藤さん / MLflow と ONNX で実現するクラウドネイティブな MLOps

OSS

Data Version Control

公式サイト

https://dvc.org/

Get Started

https://dvc.org/doc/start

発表資料

高橋さん / Data Version Control による実験管理の実務での適用事例

Kasaiさん / DVC を活用した機械学習パイプライン開発の高速化

Pytorch Lightning

https://www.pytorchlightning.ai/

tutorials

https://www.pytorchlightning.ai/tutorials

発表資料

Hwangさん / PyTorch Lightningのススメ

Polyaxon

Quick start

https://polyaxon.com/docs/intro/quick-start/

発表資料

Kohamaさん / Polyaxon + Kubeflow を利用した効率的な継続的モデルインテグレーション

Github Action

発表資料

片岡さん / ロボットシステムの開発と運用、本番で一発完動するロボットシステムのために

Ohters

Mercari / ml-system-design-pattern

Github URL

https://github.com/mercari/ml-system-design-pattern

発表資料

澁井さん / MLOpsのはじめ方

MLOps.toys

MLOpsに関わるツールをカテゴリごとにまとめているサイト https://mlops.toys/