はじめに
こんにちは。クラウド事業部の早房です。
先日 AWS Certified Machine Learning Engineer - Associate(MLA-C01) を受験し、合格しました!
本記事では、学習に利用した教材や、実際の試験の感想を綴らせていただきます。
本投稿が受験を考えている方々の何かしらの一助となれば幸いです✨
AWS Certified Machine Learning Engineer - Associate(MLA-C01) ついて
2024年10月に正式リリースされた Associate レベルの試験です。
出題範囲は以下です。
• 第 1 分野: 機械学習 (ML) のためのデータ準備 (採点対象コンテンツの 28%)
• 第 2 分野: ML モデルの開発 (採点対象コンテンツの 26%)
• 第 3 分野: ML ワークフローのデプロイとオーケストレーション (採点対象 コンテンツの 22%)
• 第 4 分野: ML ソリューションのモニタリング、保守、セキュリティ (採点対象 コンテンツの 24%)
https://d1.awsstatic.com/ja_JP/training-and-certification/docs-machine-learning-engineer-associate/AWS-Certified-Machine-Learning-Engineer-Associate_Exam-Guide.pdf
「第 1 分野: 機械学習 (ML) のためのデータ準備」では機械学習に利用するデータの前処理や管理方法について問われます。(Glue や kinesis シリーズなど)
そのため、MLAを受験する前に同じくアソシエイトレベルの AWS Certified Data Engineer - Associate(DEA-C01) を取得しておくと、重複する部分が多いのでスムーズに学習を進められるかなと思います。
また、AWS サービス以外の機械学習に関する一般的な知識 (アルゴリズム/モデル評価方法など) も理解しておくのも良いです。この辺りは AWS Certified Machine Learning - Specialty(MLS-C01) を取得しておくと網羅できるかと思います。
ちなみにMLSとMLAの違いは公式に以下の記載があります。
AWS Certified Machine Learning Engineer - Associate は、少なくとも 1 年間の AI/ML 経験を持つ ML エンジニアと MLOps エンジニア向けに設計されたロールベースの認定です。
AWS Machine Learning - Specialty は、データエンジニアリング、データ分析、モデリング、ML の実装と運用にわたるトピックをカバーする専門的な認定です。AWS 上で ML ワークロードを開発、設計、実行した経験が 2 年以上ある方により適しています。 aws.amazon.com
学習期間
20h
学習教材と学習方法
1. AWS Skill Builder
試験のレベルや問題の雰囲気を肌感覚で知るために解きました。 explore.skillbuilder.aws
2. AWS 公式ドキュメント/Black Belt
新しめの試験であり、まだ情報が少ないので今回はいつもよりも公式ドキュメントを読みました。
特に SageMaker は実際に触ったことがなく、細かい機能については全く分かりませんでした。
具体的にどのような機能があるのか、どのような機械学習アルゴリズムが組み込まれているのか、インスタンスからデータソース (学習用データ) へのアクセス管理方法はどのように行うのか?などを確認しました。
3. G検定(ジェネラリスト)公式テキスト
G検定の公式テキストには機械学習アルゴリズムや一般的な知識が載っているので、参考になりました。(特に第三章あたり)
※こちらはMLSの勉強でも役立ちました。
www.shoeisha.co.jp
4. chatGPT
ハルシネーションもかなり減ってきた(ように感じる)ので、個人的な学習ではよく使っています。
今回は Sagemakerの機能の一覧とSageMakerで使用される機械学習アルゴリズムを表でまとめてもらいました。
SageMakerの機能
機能名 | 機能概要 |
---|---|
SageMaker Studio | 統合開発環境(IDE)で、データ準備、モデル開発、トレーニング、デプロイを一元的に管理可能。 |
SageMaker Notebooks | サーバーレスのJupyterノートブックを提供し、簡単にコラボレーションやモデル開発ができる。 |
SageMaker Data Wrangler | データの前処理や可視化をGUIで効率的に行えるツール。データのクレンジングや変換をノーコードで実施可能。 |
SageMaker Clarify | バイアス検出とモデルの説明性を提供し、公平性と透明性を確保するための機能。 |
SageMaker Autopilot | 自動機械学習(AutoML)を実現し、モデルの自動生成と最適化をサポート。 |
SageMaker JumpStart | 事前トレーニング済みのモデルやエンドツーエンドのMLソリューションを提供し、迅速な導入を支援。 |
SageMaker Pipelines | 機械学習ワークフローの自動化ツール。データ処理、トレーニング、評価、デプロイのパイプラインを構築可能。 |
SageMaker Feature Store | 機械学習モデルで使用する特徴量を保存、共有、管理できるリポジトリ。特徴量エンジニアリングの再利用性を向上。 |
SageMaker Model Monitor | デプロイ済みモデルをモニタリングし、予測結果の異常やデータドリフトを検知。 |
SageMaker Neo | モデルの最適化とコンパイルを行い、クラウドやエッジデバイスで高速に実行可能な形式に変換。 |
SageMaker Training | 分散トレーニングとGPU/CPUインスタンスを活用したスケーラブルなモデルトレーニングを実現。 |
SageMaker Inference | モデルのリアルタイム推論やバッチ推論をサポートし、高性能な推論環境を提供。 |
SageMaker Ground Truth | アノテーション済みデータを作成するためのツールで、ラベル付けプロセスを効率化。 |
SageMaker Experiments | 実験追跡ツールで、モデルトレーニングの履歴や結果を整理して比較。 |
SageMaker Debugger | トレーニングプロセスのモニタリングとデバッグを行い、パフォーマンスやエラーの原因を解析。 |
SageMaker Edge Manager | エッジデバイスでのモデル管理と推論をサポートし、デプロイ後のモデルの監視や更新を容易に。 |
SageMaker Canvas | コーディング不要で機械学習モデルを構築できるGUIツール。ビジネスユーザー向けに設計。 |
SageMaker RL(強化学習) | 強化学習のモデルを構築、トレーニング、デプロイするためのフレームワークとツールを提供。 |
機械学習アルゴリズム
アルゴリズム名 | 教師あり/教師なし | 回帰/分類 | 代表的なユースケース |
---|---|---|---|
Linear Learner | 教師あり | 回帰、分類 | 売上予測、顧客離反分析、スパム検出 |
XGBoost | 教師あり | 回帰、分類 | 広告クリック率予測、クレジットリスク評価、売上予測 |
Factorization Machines | 教師あり | 回帰、分類 | レコメンデーションシステム、クリックスルー率予測 |
K-Means | 教師なし | なし(クラスタリング) | 顧客セグメンテーション、異常検知 |
Principal Component Analysis (PCA) | 教師なし | なし(次元削減) | 画像圧縮、特徴量選択、異常検知 |
Random Cut Forest (RCF) | 教師なし | なし(異常検知) | 不正検知、ネットワーク侵入検知、異常トラフィック検出 |
Sequence2Sequence | 教師あり | なし(生成タスク) | 機械翻訳、テキスト要約、チャットボット構築 |
BlazingText | 教師あり | 分類 | テキスト分類、感情分析 |
Neural Topic Model (NTM) | 教師なし | なし(トピックモデリング) | 文書のトピック分析、コンテンツ要約 |
Object2Vec | 教師あり | 回帰、分類 | 商品レコメンデーション、テキストの類似性評価 |
DeepAR | 教師あり | 回帰 | 時系列予測(売上予測、需要予測、株価予測) |
Image Classification | 教師あり | 分類 | 画像認識、物体分類、医療画像診断 |
Semantic Segmentation | 教師あり | 分類 | 自動運転の道路認識、医療画像の領域分割 |
Latent Dirichlet Allocation (LDA) | 教師なし | なし(トピックモデリング) | 文書クラスタリング、ニュース記事の分類 |
IP Insights | 教師あり | なし(異常検知) | IPアドレスの異常検知、不正アクセス検出 |
試験本番
130分で65問、特に時間が足りなくなるという事はなくサクサク解き進めることができました。
また、MLAではケース問題などの新形式の出題もされます。
道中突然遭遇して「おっ」となりましたが、見直しやフラグ付与も他の問題と同じようにできました。
Skill Builder で新形式の問題が体験できるので一度解いておくとどんなものなのかわかるかと思います。
aws.amazon.com
結果
合格
試験当日の 20:00 頃に結果が出ました。
おわりに
直近で取得したDEAとMLSで勉強した内容の記憶が残っていたことも幸いして、無事に合格することができました。
出題内容については詳しく書けませんが、感覚的にはMLSよりもAWSのサービスについて問われることが多かったと感じました。
お知らせ
APCはAWS Advanced Tier Services(アドバンストティアサービスパートナー)認定を受けております。
その中で私達クラウド事業部はAWSなどのクラウド技術を活用したSI/SESのご支援をしております。
www.ap-com.co.jp
https://www.ap-com.co.jp/service/utilize-aws/
また、一緒に働いていただける仲間も募集中です!
今年もまだまだ組織規模拡大中なので、ご興味持っていただけましたらぜひお声がけください。