APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

What's New with Data Sharing and Collaboration(データ共有とコラボレーションの最新情報)

伝統的なデータ共有の制約を克服する

伝統的なデータとAIの共有とコラボレーションの障壁を乗り越える道筋は、私たちをDatabricksというプラットフォームへと導きました。

伝統的なデータ共有の課題

データと人工知能(AI)の資産は、しばしば組織的なサイロ化により分断されています。この断片化は、効率的な共有とコラボレーションを阻害します。データチームは、データとAIの資産について安全で効果的なコラボレーションのために、これらの組織的な境界を超えることができるツールを持っていません。結果として、現在の市場ソリューションでは不一致で制約のある方法しか提供されないため、ビジネスの価値は限定的です。

さまざまなベンダーがそれぞれ異なる提供方法を使用しているため、企業は重複したデータや古いデータ、プライバシーとセキュリティのリスク、共有データの一貫性の損失に直面しています。さまざまな企業がさまざまなプラットフォームを利用しているため、これらのプラットフォームすべてが互いに互換性を持つわけではないため、この断片化はさらに悪化します。

構造化されていないデータは、伝統的な方法では共有できないデータタイプの範囲外にあるため、課題のリストに追加されます。AIモデルなどの重要なデータを共有する能力がなければ、企業はAIのユースケースを開放することに苦労します。

Databricksのエコシステムの重要な機能であるDelta Sharingは、これらの問題に対してオープンで柔軟な解決策を提示し、異なる組織間でデータとAI資産への安全なアクセスを提供します。

オープンな協調プラットフォームの導入:Databricks

Databricksは、データとAI資産のスムーズで安全な共有を可能にするオープンで統一されたプラットフォームを導入します。Lakehouseアーキテクチャに基づいて構築され、すべてのデータに対して安全で統一されたベースを提供し、個々のデータの独自の特性を認識し理解するデータインテリジェンスエンジンを使用します。このシステムの鍵となるものはDelta Sharingで、これによりベンダーロックインなしで内部的にも外部的にもデータ資産を共有することが可能になります。

このシステムはデータのオンボーディングプロセスを大幅に簡素化するため、イノベーションを加速します。それによりリアルタイムの更新情報を提供し、レプリケーションやデータ移動の必要性を否定しながら、データとAIの資産の活発な共有が可能となります。

Databricksは、パートナーや顧客とに関わらず使用できるオープンでベンダーニュートラルなプラットフォームを提供します。これは、オープンでクロスプラットフォームなエコシステムを促進し、企業がデータ共有と協調作業に取り組む方法を根本的に変えます。このシステムが整っているおかげで、データチームはAIモデルやコードを含む全てのタイプのデータを、様々なプラットフォームを通じてパートナーと共有することができます。

Databricksによる協調的なデータ共有

Databricksは、統一されたデータ共有と協力機構を導入することで、データ共有を深化させます。この新しいデータ共有のためのアーキテクチャは、セキュリティを維持し、データの一貫性を確保することによって、データ管理の複雑さを軽減します。その結果、データの理解と使用がより直感的で簡素化するので、ビジネスはデータ関連の業務を進展させることができます。

結論として、伝統的なデータ共有の制約を克服することで、Databricksは新たな可能性の世界へと扉を開きました。オープンで、柔軟で、安全なコラボレーションを通じて、組織はデータとAI共有の潜在能力を完全に活用できるようになり、これにより、健康管理、金融などの分野でのイノベーションを推進します。この新しいアプローチは、企業がデータ共有をどのように捉え、どう対処するかの方式を根本的に変えました。

Databricksマーケットプレイスの拡大

ブロックチェーン業界のニーズに応える革新的なアプローチの一環として、Alliumはコスト効率的なデータストレージおよび共有ソリューションの作成に取り組んでいます。Alliumは豊富なデータスキーマとリアルタイムの通知を採用し、Delta SharingとCloudflare R2を統合しました。結果として、この組み合わせはAlliumにとって、年間約645,000ドルという予測コストで安全で予算に優しいデータ共有ソリューションを提供しています。

Databricksはデータ共有と協働の最前線に立ち、旗艦製品であるDelta Sharingで常に境界を押し広げています。Delta Sharingは、安全なクロスクラウドとクロスプラットフォーム共有のために明示的に設計された最初のプロトコルとして評価され、強力な新機能で継続的に進化しています。

最近のアップデートでは、Delta Sharingは現在、頑強なアセットタイプの共有を提供しています。これにはAIモデル、大量の非表形式データ、ストリーミングテーブル、マテリアライズドビューが含まれます。これはLakehouse Federationを通じて可能になりました。これはDatabricksのデータ共有と協働に対する革新的なアプローチです。さらに、Cloudflareとの新たなパートナーシップにより、エグレス料金のない共有が可能となり、データ共有コストを大幅に削減しました。

協働の精神をさらに進めるために、TableauとのコネクタがDelta Sharingに導入されました。これによりデータ共有エコシステムが拡大し、ユーザーがプラットフォームとのインタラクションを強化することが可能になりました。

Delta SharingにAIモデル共有機能が追加されたことは、高度なデータプロセスを持つ組織にとって興奮するものです。この機能は、AIモデルの学習と提供の間に切断を提供します。その結果、モデルは集中的な環境で訓練され、異なるクラウドや地域間でシームレスに共有できます。これはコストメリット、より良いリソース利用、および推論遅延の短縮とともに提供されます。

さらに、共有モデルはDatabricks AIと完全に互換性があります。これにより、モデルの提供とDatabricks SQLおよびNotebooksからのAI関数の呼び出しを利用したリアルタイム推論が可能になります。

全体的に、Databricksはその提供を継続的に強化し、全てのユーザー -データ科学者、エンジニア、ビジネスプロフェッショナルともに -データ共有と協働の新たな機会を提供しています。

Databricksマーケットプレイスにおける成長とイノベーション

最近「データ共有とコラボレーションの新動向」についてのセッションで、私は新しいデータ共有の進展を解きほぐす機会を持ちました。今日は、「Databricksマーケットプレイスにおける成長とイノベーション」についての議論に更に深く踏み込むことを楽しみにしています。

Databricksマーケットプレイスは、昨年の一般公開以来、大きな成長を遂げています。より多くの製品タイプが導入され、データとAI製品調達の範囲が大幅に拡大しました。そして、彼らは最近、プライベートエクスチェンジのローンチを先駆けて行いました。これにより、プロバイダーは製品を特定の顧客にターゲットとして提供することが可能となり、Databricksマーケットプレイスは本当にオーダーメイドのソリューションの場となっています。

Databricksのマーケットプレイスが他のマーケットプレイスと一線を画すのは、単に表形式のデータ製品を提供するだけでなく、先を見据えた取り組みがあるからです。これは、深層分析とAIソリューションを求める消費者を大いに制約する可能性があるため、不可欠なアプローチです。Databricksマーケットプレイスは、この挑戦に革新的に対応し、独自のAIモデルとオープンソースのAIモデルを含む様々なデータとAI製品をサポートしています。

安全かつオープンなコラボレーションの精神に加えて、マーケットプレイスにAIモデル共有機能が統合されたことは注目すべき発展です。この協力的なアプローチを証明するかのように、ローンチパートナーのJon Snow Labsは、最新の、すぐに使用できるAIモデル60種類を導入しました。また、Databricksがオープンソースの基礎モデルを積極的にサポートしていることにも言及すべきです。彼らは、MetaAIによって開発されたLAMA3モデルなど、人気のあるモデルをマーケットプレイスでキュレーションし、公開しています。

Databricksマーケットプレイスにおけるこれらの革新的な更新は、データ共有とコラボレーションの基準を大幅に引き上げます。このような進歩が分析とAIプロジェクトに及ぼす影響を考えると、Databricksマーケットプレイスから生まれる今後の開発を密接に見つめていくことが不可欠です。このエキサイティングな旅の進行状況を、私たちが更にお伝えしていきますのでお楽しみに!


Databricksのクリーンルームにおけるプライバシーとコンプライアンス

データプライバシーが極めて重要なこの時代において、団体は特定のデータ共有のニーズに対応する効率的なソリューションが必要です。Databricksは'クリーンルーム'という概念を提案し、このチャレンジに取り組んでいます。

クリーンルームは、二者間の安全なデータ交換のための伝送路として機能します。例えば、パブリッシャーと広告主がいるとします。両者ともに暴露したくない機密のユーザーデータを持っていますが、協力して洞察を引き出す必要があります。このシナリオでは、Databricksのクリーンルームがプライバシーを保証しつつこれらの行動を容易にしています。

クリーンルームは特定のタイプの組織やビジネスモデルに依存していません。広告、小売、金融、ヘルスケアやライフサイエンスなど、様々な業界がDatabricksのクリーンルームのユニークな応用を見つけ、プライバシーに焦点を当てたデータニーズを扱っています。Databricksはプライバシーにフォーカスしたソリューションを作り出す重要性を理解しており、これがクリーンルームという概念を生み出した要因となりました。

Databricksのクリーンルームが優れている3つの特徴:

  1. Pythonとの互換性:DatabricksのクリーンルームはSQLにのみ限定されていません。マシン学習とAIの領域で重要な言語であるPythonをサポートするように設計されています。

  2. 協力的機能性:クロスクラウドとクロスプラットフォームの共有が可能であり、Databricksのクリーンルームをあらゆる組織にとって多目的なソリューションにします。

  3. スケーラブルな運用:強力なプライバシー保護機能と多目的な機能性を提供しながらも、Databricksのクリーンルームはパフォーマンスやスケーラビリティを犠牲にしません。どんな規模でも効率的に運用するように設計されています。

結論として、Databricksのクリーンルームはデータプライバシーと共有に新たな視点を提供します。彼らは多目的性とスケーラビリティを組み合わせており、今日のデータ駆動型組織にとって最適なソリューションです。前進するにつれてDatabricksのクリーンルームがどのように進化していくのか注目することが重要です。データプライバシーがより多くの組織にとって増大する懸念となる中、これらのようなソリューションはますます重要になるでしょう。



Databricks Data + AI Summit(DAIS)2024の会場からセッション内容や様子をお伝えする特設サイトをご用意しました!DAIS2024期間中は毎日更新予定ですので、ぜひご覧ください。

www.ap-com.co.jp

私たちはDatabricksを用いたデータ分析基盤の導入から内製化支援まで幅広く支援をしております。
もしご興味がある方は、お問い合わせ頂ければ幸いです。

www.ap-com.co.jp

また、一緒に働いていただける仲間も募集中です!
APCにご興味がある方の連絡をお待ちしております。

www.ap-com.co.jp