Data + AI Summitで発表されたセッション「Petrobras MLOps Transformation With MLflow and Databricks」では、ブラジルのエネルギー企業PetrobrasのコンサルタントであるBruno Guberfain do Amaral氏が登壇しました。本記事では、同社が手動で非効率だったMLOpsプロセスを刷新し、デプロイ時間を大幅に短縮したそのアーキテクチャと具体的な事例を解説します。
大規模組織が直面するMLOpsの壁
機械学習モデルの価値は、本番環境で継続的に利用されて初めて発揮されます。しかし、Petrobrasもまた、モデルを本番環境へ届けるまでのプロセスに課題を抱えていました。
同社では、データサイエンティストが開発用の実験環境を持つ一方で、本番環境へのデプロイに明確なプロセスがありませんでした。Bruno氏によると、データが分散管理され、他部署への依頼ではExcelファイルで受け渡されるなど、データの鮮度や一貫性を保つのが困難でした。モデルの検証やデプロイも手作業に依存しており、時間がかかるうえにヒューマンエラーのリスクもありました。その結果、多くのモデルがビジネスに活かされる前に埋もれてしまう状況に陥っていたのです。
新アーキテクチャの心臓部:Databricksプラットフォームによる統合
このボトルネックを解消すべく、PetrobrasはDatabricksプラットフォームを全面的に採用し、データ基盤とML基盤を統合するアーキテクチャを構築しました。
講演で示されたアーキテクチャ図では、まずデータプラットフォームとしていわゆるメダリオンアーキテクチャを採用。生データを取り込んだ後、段階的に品質を担保し、集約してビジネスユーザーやアプリケーションが活用できる形に整理しています。これにより、全社で信頼できる単一のデータソースが確立しました。
一方、MLプラットフォームでは複数の環境を用意し、開発から本番までのフローを明確に分離しています。これら2つのプラットフォームを横断的に管理しているのがUnity Catalogで、モデルやデータ資産を一元管理し、アクセス制御やデータリネージをサポートしています。
自動化の鍵を握るCI/CDパイプラインと主要コンポーネント
PetrobrasのMLOps変革で重要なのは、CI/CDパイプラインの導入です。GitHubを起点に、コードの変更から本番デプロイまでを自動化しました。主に以下の3つのコンポーネントがカギを握っています。
- MLflow: モデルのパラメータや評価指標を追跡し、モデル管理基盤として活用されています。これにより、どのデータで学習したかを記録し、再現性を確保しています。
- Databricks Asset Bundles (DABs): 機械学習プロジェクトに必要なコードや設定を一つのバンドルとしてまとめ、インフラ構成をコードで管理します。Gitベースのワークフローとの連携が容易で、自動化を強力にサポートします。
- Unity Catalog: データとモデルのデータガバナンスを担い、CI/CDパイプラインでデプロイされる資産を管理。アクセス権やリネージ情報を自動適用します。
これらを組み合わせることで、Gitリポジトリにコミットすると、DABsで定義されたテストからモデル登録、デプロイまでを自動的に実行する仕組みが完成しました。
事例:政府規制文書の分類モデルにおける自動化
講演では、政府規制文書を分類するモデルを例に、MLOpsフレームワークの効果が紹介されました。
- データ取り込みとアノテーション データチームが構築したパイプラインで、新しい規制文書を定期的に取り込み、社内の専門家が関連性をラベル付けします。
- 継続的再学習 アノテーション結果をもとに、モデルは定期的に自動再学習を行います。
- 自動デプロイ 新バージョンはレジストリに登録され、テストをクリアするとCI/CDパイプラインで本番環境に展開されます。
- 推論と結果反映 デプロイされたモデルが文書の分類を実行し、分類結果をデータプラットフォームに反映。ビジネス部門は常に最新の分類結果を活用できます。
この自動化により、手動チェックから解放され、戦略的業務に集中できるようになりました。
成果とベストプラクティス
この変革により、Petrobrasはデプロイ時間を大幅に短縮し、ヒューマンエラーのリスクも低減。システムの信頼性向上にもつながっています。
また、DABsの標準テンプレートをカスタマイズし、社内ポリシーに合わせたタグ付けルールを強制適用する仕組みも構築。大規模組織でのデータガバナンス統制に役立つ事例と言えるでしょう。
まとめと今後の展望
Petrobrasの取り組みは、データ基盤、ML基盤、CI/CDをシームレスに連携させることで、スケーラブルかつ信頼性の高いMLOps基盤を構築できることを示しています。組織内のボトルネックを洗い出し、こうした統合的アプローチを検討してみてはいかがでしょうか。