APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

Databricks Vector Search What, Why and How( Databricks Vector Search: 何、なぜ、どのように)

はじめに このセッションでは「意味検索と文脈ウェブ検索の紹介」に焦点を当てました。講演者は、コンピュータサイエンスのバックグラウンドに基づいた包括的な知識を共有しました。 目次 はじめに 目次 意味検索とは何か? 文脈ウェブ検索の重要性 インジェ…

Data Warehousing Performance, Scale and Security with Databricks SQL(Databricks SQLによるデータウェアハウジングの性能、拡張性及びセキュリティ)

はじめに 企業やミッションクリティカルな環境でのデータウェアハウジングは、コストパフォーマンスとセキュリティに特別な注意が必要です。このセッションでは、Databricks SQLがこれらの厳しい要件をどのように満たしているかを詳しく解説しました。 目次 …

How to Train or Fine-Tune a Custom LLM on Your Data with Databricks(データブリックスを利用してカスタム大規模言語モデル(LLM)をトレーニングまたはファインチューニングする方法)

はじめに このセッションでは、データブリックス上でカスタムLLMをトレーニングおよびファインチューニングするプロセスについて紹介いたします。講演者はカスタムLLMがなぜ不可欠なのか、このプロセスにおけるデータブリックスの具体的な役割、およびM-Scie…

データエンジニアリングの核心技術:CDCを利用した効率的なパイプライン設計(with Databricks/ Fivetran)

はじめに エーピーコミュニケーションズGLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではCDC(チェンジデータキャプチャ)について紹介致します。 そして、DatabricksとFivetranのCDC検証を行います。 効率的なパイプライン設計について興味がある方にお…

Fivetranを利用してAWS LambdaからDatabricksにデータを送信しましょう-! (with S3経由)

はじめに エーピーコミュニケーションズGLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではFivetranのAWS Lambdaコネクターを利用して、データをDatabricksに送信する方法を紹介いたします。 今回使ったデータ送信方法は、S3経由方法です。 検証は、以下…

Fivetranを利用して簡単にデータをマスキングしましょう-! (with Databricks)

はじめに エーピーコミュニケーションズGLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではFivetranのHashed機能を利用して、データを簡単にマスキングする方法を紹介いたします。 検証は、Fivetranを通じてDatabricksにアップロードされたデータにある特…

DatabricksとKXをConnectする方法: PyKX with kdb Insights license

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 この記事ではKXのPyKXを利用し、DatabricksとKXをConnectする方法を紹介いたします。 Databricks上でkdb Insights licenseを使用してKXのプロダクトのkdb+を利用する検証を行います。 kdb+は世界最速の時系…

入門KDB.AI (5) - サンプルコード(LangChain and RAG)

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 この記事では前回記事でご紹介しましたKDB.AIのサンプルコード実習をご紹介しようと思います。 KDB.AIは世界最速の時系列データベース及び分析エンジンであるkdb+で駆動されるVectorデータベースで、Endpoi…

入門KDB.AI (2) - サンプルコード(Document Search)

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 この記事では前回記事でご紹介しましたKDB.AIのサンプルコード実習をご紹介しようと思います。 KDB.AIは世界最速の時系列データベース及び分析エンジンであるkdb+で駆動されるVectorデータベースで、Endpoi…

入門KDB.AI (1) - 概要編

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 この記事では世界最速の時系列データベース及び分析エンジンであるKDBを保有するグローバル企業KXのKDB.AIを紹介いたします。 順番はKXのプロダクトの概要、KDB.AIの概要、使い方、KDB.AIのサンプルコード…

(dbdemos)Databricks Lakehouseにおける患者の再入院を減らすための医療予測モデルの構築: MLモデル編

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 Databricks Lakehouse Platformが提供するデモであるdbdemosの中で、患者の再入院を減らすための医療予測モデルの構築するデモを紹介したいと思います。 デモ名: Lakehouse for HLS: Patient readmission w…

(dbdemos)Databricks Lakehouseにおける患者の再入院を減らすための医療予測モデルの構築: デモの紹介及びEDA編

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 Databricks Lakehouse Platformが提供するデモであるdbdemosの中で、患者の再入院を減らすための医療予測モデルの構築するデモを紹介したいと思います。 デモ名: Lakehouse for HLS: Patient readmission w…

dbdemosを使ってdbt jobsの調整と実行を調べてみましょう (プロジェクト構成の説明編)

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 Databricks Lakehouse Platformが提供するデモであるdbdemosの中で、dbt jobsの調整と実行をするデモを紹介したいと思います。 www.dbdemos.ai 今回の投稿はdbdemosを初めて使う初心者に参考になるガイドを…

dbdemosを使ってdbt jobsの調整と実行を調べてみましょう (DBT-on-databricks編)

はじめに GLB事業部Lakehouse部の鄭(ジョン)です。 Databricks Lakehouse Platformが提供するデモであるdbdemosの中で、dbt jobsの調整と実行をするデモを紹介したいと思います。 www.dbdemos.ai 今回の投稿はdbdemosを初めて使う初心者に参考になるガイドを…