はじめに
こんにちは。ACS事業部)土居です。
現在Microsoft Buildが開催されております!
AI関連のニュースが非常に多く注目が高いですが、その中でもプレビュー発表されたMicrosoft Fabricについて個人的に気になったので簡単に紹介します。
Microsoft Fabricとは
Microsoft fabricはPower BI、Data Factory、Synapse Analytics が統合されたSaaSとして提供される新サービスです。 これらサービスが全て統合されることにより、データ統合、データ エンジニアリング、データ ウェアハウジング、データ サイエンス、リアルタイム分析、応用可観測性、ビジネス インテリジェンスなど、すべてのワークロードとデータ プロフェッショナル向けのエクスペリエンスを 1 か所に集約して操作ができます。 また、近日にはCopilotによるコード生成やPower BIによる自動レポート作成などもサポートされるようです。
詳細は公式ブログのこちらをご確認下さい。
展開されるワークロードは以下7つとなります。
ワークロード | 詳細 |
---|---|
Data Factory | クラウドおよびオンプレミスのデータ ソースへの 150 以上のコネクタ、データ変換のためのドラッグ アンド ドロップ エクスペリエンス、およびデータ パイプラインを調整する機能を提供します。 |
Synapse Data Engineering | Spark の優れたオーサリング エクスペリエンス、ライブ プールでの即時開始、およびコラボレーション機能が可能になります。 |
Synapse Data Science | データ サイエンティストが高度な AI モデルを構築し、簡単に共同作業し、機械学習モデルをトレーニング、デプロイ、管理するためのエンドツーエンドのワークフローを提供します。 |
Synapse Data Warehousing | オープン データ形式で業界をリードする SQL パフォーマンスを備えた、統合されたレイク ハウスとデータ ウェアハウス エクスペリエンスを提供します。 |
Synapse Real-Time Analytics | 開発者はモノのインターネット (IoT) デバイス、テレメトリ、ログなどからストリーミングされるデータを操作し、大量の半構造化データを高性能かつ低遅延で分析できます。 |
Power BI | 業界をリードする視覚化と AI 主導の分析を提供し、ビジネス アナリストやビジネス ユーザーがデータから洞察を得ることができるようにします。 |
Data Activator(近日公開予定) | データのリアルタイムの検出と監視を提供し、データ内で指定されたパターンを見つけたときに通知とアクションをトリガーできます。 |
Microsoft Fabricを少し触ってみました
公式ドキュメントが公開されています。現在プレビュー試用版が公開されているため少しだけ触ってみました。
以下のURLにアクセスし、「無料体験する」からトライアル開始が可能です。 app.fabric.microsoft.com
試用版は取り消しも可能なので、気軽に申し込みしましょう。
尚、トライアルには容量(CU)が割り当てられています。 Micosoft Fabricは容量単位に基づいてコンピューティングリソースが払い出されるようなので、今後発表されていくであろう価格体系に大きく起因しそうです。
トライアルが始まると、画面左下にMicosoft Fabricの機能を切り替えるアイコンが登場します。
では、こちらのチュートリアルに従って色々試してみます。
ワークスペースの作成
まずはチュートリアル用のワークスペースを作成します。 ワークスペースはアイテムのコレクションを作成する場所になります。Synapse Analyticsでも似たような概念があったので特に問題なさそうです。
データウェアハウスの作成
次に、データウェアハウスを作成してみます。 「新規」-「ウェアハウス」からデータウェアハウス名を指定して作成してみましょう。SQLデータウェアハウスが作成されます。
SQLクエリも叩けるようです。このあたりもSynapse Analyticsと代わりありませんね。
データパイプラインの作成
Data Factoryに該当するデータパイプラインも作成してみます。 こちらは、Data Factoryのホーム画面に切替え、「データパイプライン(プレビュー)」から作成していきます。
パイプラインのアクティビティの追加ができます。よく見たことのあるData Factoryのアクティビティ一覧が表示されてきました。「データのコピー」を選択してみます。
接続先として、いくつかコレクションが表示されます。まだまだ数が少ないですが、これから多く増えていくことを期待します。 また、Micosoft FabricはSaaSですが、データソースとしてオンプレミスや閉域に閉じられた環境への接続などもユースケースとしてありそうです。 プレビューではまだ利用できませんが、接続とゲートウェイという機能が存在します。これらを使って、今後セキュアなデータソースへのアクセスも実現できそうです。
Azure Blob ストレージを利用し、公開されているParquetデータにアクセスしてみます。
宛先を先程作成したデータウェアハウスに指定し、データコピーアクティビティを実行してみました。 こちらも従来のData Factoryと同様の操作感でいけそうです。
Notebookによる分析
Micosoft Fabricでは、デフォルトでMicrosoft OneLakeと呼ばれるデータレイクが用意されています。 データウェアハウスに格納されたデータを、データレイクに配置が可能です。
データレイクのデータに対して、従来Synapse Analyticsで行っていたNotebookを使った分析も可能です。
Power BIによるレポート作成
Micosoft FabricにはPower BIも統合されているため、1つの画面上でPower BIにシームレスに切替えが可能です。 データウェアハウスやデータレイクに格納したデータをPower BIでレポート化することが可能です。
また、AIによるレポートの自動生成も可能です。うまく利用すれば、大きな業務効率改善が期待できますね。
おわりに
いかがだったでしょうか?
Microsoft FabricはData Factory、Synapse Analytics , Power BIが統合されており、従来からこれらのサービスを使っていたユーザーにとっては馴染みやすいものとなっています。
また、AIによるアシスタント機能もこれから充実してくるため、これからデータAIを活用した分析を始めていく方にとってもユーザフレンドリーなサービスです。
是非、今後のGAを期待して待ちたいと思います。
私達ACS事業部はAzureのクラウドネイティブ技術を軸に内製化のご支援をしております。ご相談等ありましたらぜひご連絡ください。
また、一緒に働いていただける仲間も募集中です!
切磋琢磨しながらスキルを向上できる、エンジニアには良い環境だと思います。ご興味を持っていただけたら嬉しく思います。