多くの企業にとって、SAPデータはビジネスの根幹をなす重要な資産です。しかし、その価値を最大限に引き出すことは、これまで決して容易ではありませんでした。今回、DatabricksのプロダクトマネージャーであるBenjamin Mathew氏とDarshana Sivakumar氏、そして顧客事例として登壇したNatura & Coのシニアデータサービスマネージャー、Bernard Leitz氏によるセッション「Breaking Silos Using SAP Business Data Cloud and Delta Sharing for Seamless Access to SAP Data in Databricks」では、この長年の課題に対する画期的な解決策が示されました。本記事では、このセッションで発表されたSAPとDatabricksの新たなパートナーシップが、いかにしてデータ活用の常識を覆すのかを詳しく解説します。
従来のSAPデータ連携が抱えていた根深い課題
セッションの冒頭でMathew氏が指摘したように、これまでSAPデータをDatabricksのような外部プラットフォームで活用するには、多くの困難が伴いました。財務、サプライチェーン、人事といった各部門で利用されるSAPデータは、まさに宝の山です。しかし、これを他のデータと組み合わせて収益予測や在庫最適化といった高度な分析を行うためには、データをSAPシステムから「複製」する必要がありました。
この複製プロセスは、一般的にETL(Extract, Transform, Load)パイプラインを介して行われますが、Mathew氏によれば、これが多くの問題の温床となっていました。
- ガバナンスの欠如: データのコピーが作成されると、誰がそのデータにアクセスし、どのように利用しているのかを追跡することが困難になります。統制の取れていないデータのレプリカが社内に散在する状況は、セキュリティ上の大きなリスクです。
- データのサイロ化と陳腐化: コピーされたデータは、その瞬間に「古い」データとなります。リアルタイム性が失われ、ETLパイプラインが失敗すれば、ビジネスは古い情報に基づいた意思決定を強いられることになります。
- 高コストと運用負荷: 脆弱なETLパイプラインは頻繁に失敗し、その都度、エンジニアが修正作業に追われます。これは直接的な運用コストだけでなく、本来であれば高付加価値な業務に費やすべき時間を奪う機会損失にも繋がります。
- コンプライアンス違反のリスク: サードパーティ製のツールを使ったデータ連携は、SAPが定めるライセンスルールやサポートポリシーに準拠していないケースがあり、コンプライアンス上の懸念がありました。
これらの課題は、データチームを本来の目的である「インサイトの創出」から遠ざけ、ひたすらパイプラインの維持管理という「配管工事」に忙殺させてきました。この記事で紹介する新しいソリューションは、まさにこの構造的な問題を根本から解決することを目指しています。
「ノーコピー・リアルタイム」を実現する新ソリューション
今回発表された解決策の核心は、SAPとDatabricksが公式に提携し、SAP Business Data Cloud (BDC) と Delta Sharing という2つの技術を組み合わせた点にあります。これにより、前述したETLやデータ複製に伴う課題を一掃する、新しいデータ連携の形が生まれました。
このアーキテクチャの最も重要なポイントは、SAPデータを物理的にコピーすることなく、Databricksから直接、リアルタイムに参照できる「ノーコピー共有」を実現したことです。この仕組みを支えているのが、Databricksが開発したオープンなデータ共有プロトコルであるDelta Sharingです。Darshana Sivakumar氏の説明によれば、Delta Sharingはデータそのものではなくメタデータ(データの所在や形式に関する情報)のみを交換するため、受信側(Databricks)は常に提供元(SAP)にある最新のデータにアクセスできます。データの移動が発生するのは、実際にクエリが実行されたときだけです。
そして、このデータ共有のガバナンスを司るのが、Databricksの統合ガバナンスソリューションであるUnity Catalogです。Unity Catalogを通じて、SAPデータと非SAPデータを一元的に管理し、誰がどのデータにアクセスできるかをきめ細かく制御できます。これにより、データのサイロを破壊しつつも、エンタープライズレベルのセキュリティとガバナンスを維持することが可能になります。
双方向データ共有アーキテクチャの全体像
この新しい連携の仕組みをもう少し詳しく見ていきましょう。Mathew氏が示したアーキテクチャは、主に以下の要素で構成されています。
SAP Business Data Cloud (BDC):
SAPが新たに提供するクラウドベースの分析基盤です。SAP DatasphereやSAP Analytics Cloudといったサービス群で構成され、オンプレミスのSAPデータをクラウドに集約し、分析可能な状態に整える役割を担います。特に重要なのが、SAPが管理する「キュレートされたデータプロダクト」です。これは、複雑な生データにビジネス上の意味(セマンティクス)を付与した、すぐに利用可能なゴールドレベルのデータセットです。DatabricksとDelta Sharingによる連携:
BDC上で準備されたデータプロダクトは、Delta Sharingを介してDatabricksに共有されます。Databricksユーザーは、この共有されたデータをあたかも自社のレイクハウスに存在するテーブルのように扱うことができます。物理的なコピーは不要で、アクセスは常にライブデータに対して行われます。双方向性:
この連携は一方通行ではありません。Databricks上で加工されたデータやAIモデルの予測結果などを、同様にDelta Sharingを使ってSAP BDC側へ共有することも可能です。これにより、Databricksで得られたインサイトをSAPの業務プロセスにフィードバックする、真の双方向連携が実現します。SAP Databricks:
このパートナーシップの一環として、「SAP Databricks」という新しいフレーバーも発表されました。これはSAP BDC内にネイティブに組み込まれるDatabricks環境で、SAPエコシステムに特化したAI・分析エンジンとして機能します。
この公式連携により、SAPはこれまでデータ抽出時に課していた「プレミアムアウトバウンドインテグレーション」と呼ばれる手数料を免除するとしています。これはユーザーにとって大きなコストメリットとなるでしょう。
デモ事例:サプライチェーンの価格分析を高速化する
理論だけでなく、この連携が実際にどのように機能するのか、Mathew氏はサプライチェーンの価格分析を題材にしたデモを披露しました。
架空の靴メーカー「Lakehouse Loafers」社は、SAPシステムで仕入先情報(Sam’s Soles, Hallie’s Heels, Leslie’s Laces)を管理しています。一方、各仕入先からは、それぞれのDatabricks環境からDelta Sharing経由で最新の部品価格情報が共有されています。
デモのシナリオは以下の通りです。
データ統合:
Databricks上で、SAPから共有された仕入先マスタデータと、各仕入先から共有された価格データを結合します。従来であれば複雑なETLが必要でしたが、このアーキテクチャではシンプルなSQLを用いて統合ビューを短時間で作成できます。AIによる予測:
統合された価格データに対し、Databricks SQLのAI Forecast関数を適用。これにより、今後5年間の価格推移を予測します。BIによる可視化と意思決定:
予測結果を含むデータをDatabricksのAI/BIダッシュボードで可視化します。すると、「Hallie’s Heels」社の価格が他の仕入先と比較して急激に上昇していることが一目瞭然となりました。さらに、自然言語で対話的に分析できるGenieを使い、「価格変動の標準偏差は?」と質問するだけで、価格の不安定さも数値で確認できました。
この一連の流れは、データの準備からインサイトの発見、そして具体的なアクション(仕入先の見直し検討)までを、リアルタイムデータに基づいてシームレスに行えることを示しています。脆弱なパイプラインに悩まされることなく、ビジネス価値の創出に集中できる世界の到来を予感させます。
顧客事例:Naturaが実現したIPNLイニシアティブの紹介
このソリューションのインパクトを最も雄弁に物語ったのが、ブラジルに本拠を置く世界的な化粧品ブランド、Natura & Coの事例です。同社は120 TBを超える巨大なSAP環境を運用しており、データ活用の先進企業でもあります。
登壇したBernard Leitz氏は、同社のイニシアティブ「IPNL」(Integrated Profit and Loss)を紹介しました。IPNLは、データと社会へのコミットメントを融合させた取り組みとして説明されました。
Naturaは、このIPNLを算出する際、従来は数多くの異なるデータソースを組み合わせるために約3ヶ月を要していましたが、SAP BDCとDatabricksの連携導入後は、そのプロセスをわずか2週間に短縮できたといいます。これによりチームは集計作業から解放され、より戦略的な分析や新たな価値創造に注力できるようになりました。
まとめと次のステップ
今回のセッションで明らかになったのは、SAPとDatabricksのパートナーシップが、単なるツール連携以上の、データ活用のパラダイムシフトをもたらす可能性を秘めているということです。「サイロの破壊」というセッションタイトルの通り、このソリューションはSAPデータと非SAPデータの壁を取り払い、ETLやデータコピーという長年の呪縛からデータチームを解放します。
講演者によれば、このDelta Sharingを介した統合機能は、2025年Q3にリリースが予定されています。導入を検討する企業は、まず前提条件となるSAP Business Data Cloudのセットアップについて、自社のSAPアカウントチームに相談することから始めるとよいでしょう。
SAPという巨大な資産を、リアルタイムかつガバナンスの効いた形で、Databricksの強力なAI・分析プラットフォームと融合させる。Naturaの事例が示したように、その先には、これまで不可能だったスピードでの意思決定や、まったく新しい価値創造が待っています。この動きがエンタープライズデータ活用の未来をどう変えていくのか、今後も目が離せません。