APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

レイクハウスフェデレーションによるpostgreSQLとの連携

はじめに GLB事業部Lakehouse部の阿部です。 今年のData + AI SUMMITで発表されたLakehouse Federation(レイクハウスフェデレーション)をさわってみました。 https://learn.microsoft.com/ja-jp/azure/databricks/query-federation/postgresql 注意 記事執…

RDSとFivetranをPrivateLink接続し、Databricksにincremental syncする

はじめに GLB事業部Lakehouse部の阿部です。 今回は、FivetranとRDSをAWS PrivateLinkを使って接続し、DestinationのDatabricksワークスペースにincremental sync(差分更新)する方法を解説します。 Fivetranとは、クラウドベースのELT(Extract, Load, Tra…

入門KDB.AI (6) - サンプルコード(Image Search)

はじめに GLB事業部Lakehouse部の阿部です。 本記事では、KDB.AIによる頭部MRI画像との類似画像を検索する方法を紹介します。 KDB.AIは、KX systemsが提供するナレッジベースのベクトルデータベースと検索エンジンです。ベクトルデータベースは膨大な量のテ…

Copilotを活用したDatabricksの開発がはかどりそう。

はじめに 本記事の結論 GitHub Copilotとは VscodeでDatabricksを使うための準備 GitHub Copilotでdatabricksを動かしてみる SQL クエリーを使う準備 SQL クエリーを実行する おわりに はじめに GLB事業部Lakehouse部の阿部です。 コメントからコードをサジ…

How to Build a Metadata Driven Data Pipelines with Delta Live Tables(Delta Live Tablesでメタデータ主導のデータパイプラインを構築する方法)

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加した市村の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、Delta Live Tablesを使用したメタデータ駆動のデータパイプラインの構築方法について…

Databricks SQL Serverless Under the Hood: How We Use ML to Get the Best Price/Performance(Databricks SQLサーバーレスの裏側:最高の価格/パフォーマンスを得るためのML活用法)

はじめに GLB事業部Lakehouse部の阿部です。バーチャルで参加したData + AI SUMMIT2023(DAIS)のセッションの内容をまとめた記事を書きました。 Databricks SQL Serverlessの講演「Databricks SQL Serverless Under the Hood: How We Use ML to Get the Bes…

Experience the New Era of Data & AI: Taking Bold Steps(データAIの新時代を体験する:大胆な一歩を踏み出す)-02

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加した市村の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、エネルギー企業Petronas社がデータAIソリューションを活用してビジネスのパフォーマ…

Experience the New Era of Data & AI: Taking Bold Steps(データAIの新時代を体験する:大胆な一歩を踏み出す)-01

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加した市村の報告をもとに、セッションの内容をまとめた記事を書きました。 こんにちは!今回は、エネルギー企業Betunasが取り組むデータとAIソリューションを活用したビ…

Anomalo | Data Archaeology: How to Quickly Understand an (Unfamiliar) Dataset Using Machine Learning(Anomalo|データ考古学:機械学習を使って(見慣れない)データセットを素早く理解する方法)

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加した永里の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、講演「Anomalo | Data Archaeology: How to Quickly Understand an (Unfamiliar) Dat…

Lakehouses: The Best Start to Your Graph Data and Analytics Journey(レイクハウス:グラフデータとアナリティクスの旅への最良のスタート)

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加している市村の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見てい…

Streaming Schema Drift Discovery and Controlled Mitigation(ストリーミング・スキーマ・ドリフトの発見と制御された緩和)

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加している儀保の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見てい…

Why a Major Japanese Financial Institution Chose Databricks to Accelerate its Data and AI-Driven Journey(日本の大手金融機関がデータとAI主導の旅を加速するためにDatabricksを選んだ理由)

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加している永江の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見てい…

Making Travel More Accessible for Customers Bringing Mobility Devices(モビリティデバイスをお持ちのお客様にも旅をより身近に)

はじめに GLB事業部Lakehouse部の阿部です。現地でのData + AI SUMMIT2023(DAIS)に参加している金丸の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見てい…

Maximizing Value From Your Data with Lakehouse AI(Lakehouse AIでデータから価値を最大化する)

はじめに GLB事業部Lakehouse部の阿部です。 Data + AI SUMMIT2023(DAIS)にバーチャルで参加したセッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見ていただけると幸いです…

Real-Time Streaming Solution for a Call Center Analytics: Business Challenges and Technical Enablement(コールセンター分析のためのリアルタイムストリーミングソリューション: ビジネス課題と技術的イネーブルメント)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している儀保の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見て…

What it Takes to Democratize AI and ML in a Large Company: The Importance of User Enablement and Technical Training(大企業におけるAIとMLの民主化に必要なこと: ユーザーイネーブルメントと技術トレーニングの重要性)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している永里の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見て…

Databricks As Code: How to Effectively Automate a Secure Lakehouse Using Terraform for Resource Provisioning(コードとしてのDatabricks: リソースのプロビジョニングにTerraformを使ってセキュアなレイクハウスを効果的に自動化する方法)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している儀保の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 こちらも見て…

JetBlue’s Real-Time AI & ML Digital Twin Journey Using Databricks(Databricksを活用したJetBlueのリアルタイムAI&MLデジタル・ツイン・ジャーニー)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している金丸の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、JetBlueのリアルタイムAIとMLデジタルツインの取り組みについてお話します。こ…

Build Your Data Lakehouse with a Modern Data Stack on Databricks(Databricksにおけるモダンデータスタックでデータレイクハウスを構築する)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している金丸の報告をもとに、セッションの内容をまとめた記事を書きました。 DAISでのセッションに関する記事は、以下の特設サイトにまとめています。 https://www.a…

How Comcast Effectv Drives Data Observability with Databricks and Monte Carlo-02(Comcast Effectvがデータブリックスとモンテカルロでデータ可観測性を推進する方法-02)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している永江の報告をもとに、セッションの内容をまとめた記事を書きました。 本記事は全2部構成で、今回は第2部をお届けします。 以下、第1部の記事です。 techblog.…

How Comcast Effectv Drives Data Observability with Databricks and Monte Carlo-01(Comcast Effectvがデータブリックスとモンテカルロでデータ可観測性を推進する方法-01)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している永江の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、"How Comcast Effectv Drives Data Observability with Databricks and Monte C…

Using Lakehouse to Fight Cancer: Ontada’s Journey to Establish a RWD Platform on Databricks Lakehouse(がんと闘うためにLakehouseを使う: Databricks LakehouseにRWDプラットフォームを確立するオンタダの旅)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している市村の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、"Using Lakehouse to Fight Cancer: Ontada’s Journey to Establish a RWD Plat…

Building and Managing a Data Platform for a Delta Lake that Exceeds 13 Petabytes and Has Thousands of Users: AT&T's Story(13ペタバイトを超え、数千人のユーザーを持つデルタレイクのデータプラットフォームの構築と管理: AT&Tのストーリー)

はじめに GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している市村の報告をもとに、セッションの内容をまとめた記事を書きました。 今回は、AT&Tが13ペタバイトを超えるデルタレイクのデータプラットフォームを構築・管理…

【2023年の注目キーワードになるか?】LLMOpsとは

はじめに GLB事業部Lakehouse部の阿部です。 Chat GPTが登場して日本国内の企業でもオープンソースのLLMをリリースしたこともあり、LLM(大規模言語モデル)という言葉は聞く機会が増えました。 最近はLLMOpsという言葉もちらほら聞くようになりましたが、ML…

LangChainのmemoryとDeepL APIを利用してチャットbotを改良した

はじめに GLB事業部Lakehouse部の阿部です。 本記事では、Databricksのデモページのdbdemosを参考にしたチャットボットの改良方法について解説します。 改良方法として、LangChainのmemory機能と翻訳アプリケーションを用いて改良しております。 こちらは改…

dbdemosを使ったDollyによるチャットbotの構築〜Prompt Engineering〜

はじめに GLB事業部Lakehouse部の阿部です。 本記事は、前回のdbdemosを使ったDollyによるチャットbot構築の続きです。 techblog.ap-com.co.jp Dollyを動かすことを通じて、プロンプトエンジニアリングやLLM学習の参考になれば幸いです。 本記事は、dmdemos…

dbdemosを使ったDollyによるチャットbotの構築〜データ準備編〜

はじめに GLB事業部Lakehouse部の阿部です。 Databricks Lakehouse Platformが提供するデモであるdbdemosには、デモごとにサンプルのデータセットやコードが用意されており、ワークスペースにノートブックをインポートして使用できます。 www.dbdemos.ai 本…

大規模言語モデル(LLM)Dollyをパラメーター数を変えて動かしてみた

はじめに GLB事業部Lakehouse部の阿部です。 chat-gptの台頭により大規模言語モデル(LLM)についてよく聞くようになりましたが、Databricksは2023年4月12日にOpenなLLMであるDolly 2.0を発表しました。 今後はDatabricks Lakehouse PlatformにDollyが導入さ…

Databricks-06. [Databricks × dbt] モデルに対するテストについて

はじめに GLB事業部Lakehouse部の阿部です。 本記事では、dbt cloudで作成したモデルのテストについて解説します。 前回の記事では、Partner Connectを使用してDatabricks Lakehouse Platformからdbt Cloudに接続し、Databricksにあるデータをdbt cloud上で…

Databricksに出会って3ヶ月で認定試験に合格しました。

はじめに Databricks Certified Data Engineer Associate (Version 3)に合格しました! credentials.databricks.com GLB事業部Lakehouse部の阿部です。 いつもはDatabricks周りの検証について発信しておりますが、今回は上記試験に合格するまでの勉強・姿勢…