APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

DatabricksのUnity Catalogを活用したMLOps(2編、検証)

はじめに エーピーコミュニケーションズGDAI事業部Lakehouse部の鄭(ジョン)です。 この記事では、DatabricksのUnity Catalogを活用したMLOpsの実践方法をご紹介します。 シリーズ第2回となる今回は、Databricks の Unity Catalog(UC)を活用してシンプルな …

Databricksで自分の無料RAGチャットボットを作ってみましょう-!

はじめに エーピーコミュニケーションズGDAI事業部Lakehouse部の鄭(ジョン)です。 この記事では、DatabricksのFree Editionを利用してRAGチャットボットを作成する方法をご紹介します。 今回のチャットボットは、Unity Catalogに保存されているテーブルを利…

DatabricksのUnity Catalogを活用したMLOps(1編、概念・事例紹介)

はじめに エーピーコミュニケーションズGDAI事業部Lakehouse部の鄭(ジョン)です。 この記事では、DatabricksのUnity Catalogを活用したMLOpsについてご紹介いたします。 シリーズ投稿の第1回として、基本的な概念と実際の運用事例を取り上げます。 本記事は…

DAIS2025参加レポート:サンフランシスコ出張

はじめに GDAI事業部Lakehouse部の鄭(ジョン)です。今年もDatabricksの最新技術情報をいち早くキャッチするため、アメリカ・サンフランシスコで開催された Data + AI Summit 2025(以下DAIS) に参加してきました。 弊社ではDAISのセッションをレポートして…

Delta LakeとIcebergは統一されるのか?オープンテーブルフォーマットの未来を紐解く

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 データレイクハウスの世界で今、最も注目されて…

SAPデータのサイロを破壊せよ:DatabricksとSAP Business Data Cloudが実現する「ノーコピー・リアルタイム」連携の全貌

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 多くの企業にとって、SAPデータはビジネスの根幹…

金融機関におけるAzure Databricks運用術:Erste Groupが語るセキュリティとコスト最適化のリアルな道のり

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 Data + AI Summitで発表されたセッション「Datab…

Databricks導入初期のコスト管理術:最初の100日で実践すべきベストプラクティス

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 DatabricksはデータとAIのための統合プラットフ…

OptiverはいかにしてDatabricksでリアルタイム取引ダッシュボードの「秒単位」レイテンシを実現したか

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 金融市場の最前線では、1秒、いやミリ秒の遅れが…

DatabricksとDSPyで作る、スケーラブルなAIルーティングエージェントの実践ガイド

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 Data + AI Summitで発表されたセッション「Route…

ヘルスケア大手Intermountain Healthに学ぶ、責任あるLLM運用の実践的アプローチ

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 生成AI、特に大規模言語モデル(LLM)の活用が急…

PDFの山から宝を掘り出す:Databricks Lakeflowが実現するインテリジェントな非構造化データ処理

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 企業のデータ資産の大部分が、実は活用しきれて…

AIはクリティカルインフラをどう変えるか?原子力・電力業界のDX最前線

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 先日開催されたセッション「Modernizing Critica…

Globe TelecomのMLOps刷新:Databricks統合で処理時間28倍・コスト97%削減を実現した全貌

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 フィリピンの大手通信会社Globe Telecomが、乱立…

従来MLと生成AIの分断を乗り越える:RecSys, Topic Modeling and Agents: Bridging the GenAI-Traditional ML Divide

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 生成AI(GenAI)の波が押し寄せ、多くの開発現場…

ストリーミングデータフローにおけるCDF活用術:84.51°「Better Together」アーキテクチャ

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 データストリーミングの世界では、一方的にデー…

Databricks Unity Catalog 最新アップデート解説:ライブデモから紐解く次世代データ&AIガバナンスの全貌

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 Databricksが開催したセッション「What’s New in…

Databricks AI/BIダッシュボードはここまで来た!

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 エンタープライズ規模のレポーティングを実現す…

巨大組織のMLOps変革:PetrobrasがDatabricksで実現した高速化

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 Data + AI Summitで発表されたセッション「Petro…

SAPとDatabricksの連携が拓く未来:データとAIでビジネスはどう変わるのか?

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 先日開催された「Partner Summit Breakout_ SAP …

医療AIの未来を拓く「半合成データ」:プライバシーと実用性を両立するモデル構築術

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 先日開催されたData+AI Summitにて、Fight Healt…

AIガバナンスは「宣言」から「実践」へ:Databricksが提唱する具体的フレームワークDAGFとは

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 AIの導入がビジネスの標準となる中、多くの企業…

Databricks DQXでデータ品質管理をプロアクティブに:リアルタイム検証とデータ検疫の新常識

※本記事は、Data + AI Summit のセッションを現地で視聴したエンジニアが、内容をできる限り客観的に共有することを目的に、生成AIを活用して作成したものです。 ― エーピーコミュニケーションズ Lakehouse部 データパイプラインの信頼性は、データドリブン…

Databricks Vector Search What, Why and How( Databricks Vector Search: 何、なぜ、どのように)

はじめに このセッションでは「意味検索と文脈ウェブ検索の紹介」に焦点を当てました。講演者は、コンピュータサイエンスのバックグラウンドに基づいた包括的な知識を共有しました。 目次 はじめに 目次 意味検索とは何か? 文脈ウェブ検索の重要性 インジェ…

Data Warehousing Performance, Scale and Security with Databricks SQL(Databricks SQLによるデータウェアハウジングの性能、拡張性及びセキュリティ)

はじめに 企業やミッションクリティカルな環境でのデータウェアハウジングは、コストパフォーマンスとセキュリティに特別な注意が必要です。このセッションでは、Databricks SQLがこれらの厳しい要件をどのように満たしているかを詳しく解説しました。 目次 …

How to Train or Fine-Tune a Custom LLM on Your Data with Databricks(データブリックスを利用してカスタム大規模言語モデル(LLM)をトレーニングまたはファインチューニングする方法)

はじめに このセッションでは、データブリックス上でカスタムLLMをトレーニングおよびファインチューニングするプロセスについて紹介いたします。講演者はカスタムLLMがなぜ不可欠なのか、このプロセスにおけるデータブリックスの具体的な役割、およびM-Scie…

データエンジニアリングの核心技術:CDCを利用した効率的なパイプライン設計(with Databricks/ Fivetran)

はじめに エーピーコミュニケーションズGLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではCDC(チェンジデータキャプチャ)について紹介致します。 そして、DatabricksとFivetranのCDC検証を行います。 効率的なパイプライン設計について興味がある方にお…

Fivetranを利用してAWS LambdaからDatabricksにデータを送信しましょう-! (with S3経由)

はじめに エーピーコミュニケーションズGLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではFivetranのAWS Lambdaコネクターを利用して、データをDatabricksに送信する方法を紹介いたします。 今回使ったデータ送信方法は、S3経由方法です。 検証は、以下…

Fivetranを利用して簡単にデータをマスキングしましょう-! (with Databricks)

はじめに エーピーコミュニケーションズGLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではFivetranのHashed機能を利用して、データを簡単にマスキングする方法を紹介いたします。 検証は、Fivetranを通じてDatabricksにアップロードされたデータにある特…

DatabricksとKXをConnectする方法: PyKX with kdb Insights license

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではKXのPyKXを利用し、DatabricksとKXをConnectする方法を紹介いたします。 Databricks上でkdb Insights licenseを使用してKXのプロダクトのkdb+を利用する検証を行います。 kdb+は世界最速の時系…