はじめに
GLB事業部Lakehouse部の阿部です。
先日、Databricks Certified Machine Learning Associateに合格しました!
本記事では、試験の概要と試験対策について解説します。 Machine Learningに入門したい方、DatabricksのMachine Learningのコンポーネントを理解したい方にはオススメの試験となっております。
Data Engineer AssociateとProfessional合格に向けた試験対策については、以下のブログに記載しております。
Data Engineerの試験を検討されている方は、こちらも見ていただけると幸いです。
Databricksに出会って3ヶ月で認定試験に合格しました。 - APC 技術ブログ
Databricks Data Engineer Professional合格方法 - APC 技術ブログ
Databricks Machine Learning Associateとは
試験概要と出題範囲です(Databricks公式ホームページから引用しました)
Databricksを使用して基本的な機械学習タスクを実行する能力を評価します。 これには、Databricks Machine Learningとその機能(AutoML、Feature Store、MLflowの一部の機能など)を理解し、使用する能力が含まれます。 また、機械学習ワークフローにおいて正しい判断を下し、Spark MLを使用してそれらのワークフローを実装する能力も評価されます。 最後に、機械学習モデルのスケーリングに関する高度な特性を理解する能力が評価されます。 この認定試験に合格すると、Databricksとその関連ツールを使用して、基本的な機械学習タスクを完了することができます。
Databricks Machine Learning – 29%
ML Workflows – 29%
Spark ML – 33%
Scaling ML Models – 9%
https://www.databricks.com/learn/certification/machine-learning-associate
具体的な出題範囲は、試験ガイドのExam outlineに書かれています。
もちろん本番の試験もこれらの内容を問う問題が出題されます。
試験勉強に入る前に、こちらに目を通してキーワードの意味を理解しておくと良いでしょう。
勉強方法
試験ガイドのExam outlineでキーワードをチェックした後、具体的な試験対策に入ります。
①Academyのコースを受講
AcademyのMachine Learning Practitioner Learning Planという講座をオススメします。
試験合格に必要な知識を網羅的に学べる内容となっています。
②Udemyによる学習
こちらの模擬試験4回分を2週ほどしました。
問題を解いて公式ドキュメントを見るという勉強が一番よかったです。
試験に慣れることと、本番も類似問題が出題されたためオススメします。
※回答に一部誤りと思われる問題もあったため、公式ドキュメントなどを利用して自分でも確認を徹底すると良いでしょう。
事前にあると試験勉強に良い知識
以下に、試験前に知識があって良かったと思う点について述べます。
まったくの未経験である場合は、Academyのコースを受講することをオススメします。
Sparkの内部構造について
Pysparkのコード理解
Pandas API on Sparkのコード理解
基本的な機械学習の仕組みと評価指標
DatabricksのMachine Learningに関するコンポーネント(Unity Catalogに統合されたFeature Store, MLFLow, AutoMLなど)
要領が良い方は、試験問題を解きながら知識をつけていけば問題ないです。
感想
Machine Learningの復習とMLFLowの良い勉強になりました。
とくにMLFlowについては、手を動かして検証することをオススメします。
最後までご覧いただきありがとうございます。 私たちはDatabricksを用いたデータ分析基盤の導入から内製化支援まで幅広く支援をしております。 もしご興味がある方は、お問い合わせ頂ければ幸いです。
そして、一緒に働いていただける仲間も募集中です!
Lakehouse部では、データエンジニア/データサイエンティストとPMを募集しております。
カジュアル面談または下記の求人一覧からのご応募をお待ちしております。
https://hrmos.co/pages/ap-com/jobs?category=1966482541417734144,1627168775956385793