AIのカタログ管理
皆さんこんにちは。ACS事業部の亀崎です。 AI関連のニュースがあちこちで取り上げられている現在、皆さんもその使い方だけではなく、その管理方法も気になっているのではないでしょうか。 たとえば、組織内で開発したモデルや推論サーバーはどこで、どのように公開し、その存在を組織内に認知させたらよいでしょうか? Backstageであれば、一般的なWebサーバーなどをカタログとして登録・公開しますが、AIでも同じようなことができるでしょうか。
2025年4月1日にロンドンで開催されたBackstage CON 2025 EUでまさにそうしたテーマを RedHat社のJon Collier氏が「We Built a Unified AI Asset Catalog in Backstage」で発表されていたのでご紹介します。
(John Collier氏のセッションはカタログでAI関連要素の公開を試みたときの内容をまとめたものです)
資料はこちらにアップロードされていました。
Unified AI Asset Catalog in Backstage
アプローチ1: Model as a Component
まず最初に 推論サーバーを System として管理することにします。 モデルはSystemに所属するComponentとして登録します。依存するデータはResourceとして管理します。
このアプローチではいくつか課題が出てきました。
- モデル定義が冗長になる
- 大規模システムでAIアセットが適切に表現されない
- カタログエンティティが意図したものと一致しない
- 推論サーバー固有の情報を取得するのが難しい
アプローチ2: Model Serves as a Componet
次に以下のアプローチを検討します。 推論サーバーをComponentとします。モデルはResource、API GatewayをAPIとして定義します。 このほか、アクセス方法等についてはTechDocsで記述するものとします。また、大規模システムをSystemとして定義し、AIアセットをその一部として扱います。
このアプローチでは多くの部分で意図したものが表現されています。TechDocsもエンティティ情報をよく補完してくれます。
ただ、このアプローチでも、RBACなどまだ課題があります。
今後は発生した課題を含めて機能拡張なども検討しているとのこと。
セッションを聞いて
AIの以外の部分ではありますが、私自身もその情報を管理するならカタログをどう定義すべきか、またそれに対してBackstageに機能拡張するならどういった機能が必要か、を考えていました。 そういったものは一見すると「簡単にできるんじゃない?」と思えるのですが、実際にやってみると細かいところで「ここがうまくいかない」「これ冗長だ」「これは過剰だ」などと出てきて、意外と難しいんだなと感じていたところです。
みなさんはどのように管理することをお考えでしょうか。
AI関連については、日々進化を遂げている領域でもあり、カタログとしてもまだ定まった方式が出ているわけでもないと思います。 今回の先進的な取り組みを参考にしたいと思います。