はじめに
GLB事業部Lakehouse部の阿部です。 現地でのData + AI SUMMIT2023(DAIS)に参加している市村の報告をもとに、セッションの内容をまとめた記事を書きました。
今回は、"Using Lakehouse to Fight Cancer: Ontada’s Journey to Establish a RWD Platform on Databricks Lakehouse"という講演についてお話ししたいと思います。この講演は、MontanaのアーキテクチャのシニアディレクターであるDonghwa Kim氏によって行われました。彼は20年以上のIT経験を持ち、以前はVeterans AffairsとCMSでDataLeakを設計・実装していました。
この講演のテーマは、がん治療における現実世界のデータとエビデンスの重要性についてです。セッションの目的は、Lakehouseアーキテクチャを使用して、現実世界のデータとエビデンスの実装について紹介することです。対象となる視聴者は、医療関係者、データサイエンティスト、技術者などです。
がん治療における現実世界データとエビデンスの重要性
まずはじめに、がん治療における現実世界のデータとエビデンスの重要性について語られました。現実世界のデータとは、臨床試験や研究以外の実際の医療現場で収集されるデータのことで、これをもとにしたエビデンスは、がん治療の効果や安全性を評価する上で非常に重要です。
米国内のがん統計
講演では、米国内のがん統計についても触れられました。以下にその主なポイントをまとめます。
- 米国では毎年約160万人ががんと診断され、60万人以上ががんで亡くなる
- がんは米国で2番目に死亡原因となっており、とくに肺がん、乳がん、前立腺がんが多い
- がんの治療法は多岐にわたり、個々の患者に最適な治療法を選択することが重要
このような状況を踏まえ、現実世界のデータとエビデンスを活用して、がん治療の効果や安全性を評価し、最適な治療法を選択することが求められています。
Lakehouseアーキテクチャを活用した現実世界データの実装
次に、Montanaが実施しているLakehouseアーキテクチャを使用した現実世界のデータとエビデンスの実装について説明されました。Lakehouseアーキテクチャとは、データウェアハウスとデータレイクの機能を組み合わせた新しいデータプラットフォームのことで、Databricks社が提供しています。
OntadaのRWDプラットフォーム
Ontadaは、Databricks Lakehouseを活用して、現実世界データ(RWD)プラットフォームを構築しています。このプラットフォームでは、以下のような機能が提供されています。
- 大量の現実世界データを効率的に収集・管理
- データの品質や整合性を保つためのデータガバナンス機能
- 機械学習や統計解析を活用したエビデンスの生成
- 治療法の効果や安全性を評価するための可視化ツール
これらの機能を活用することで、がん治療における現実世界データとエビデンスの活用が促進され、最適な治療法の選択や新たな治療法の開発に役立てられることが期待されています。
まとめ
がん治療における現実世界のデータとエビデンスの重要性を認識し、Lakehouseアーキテクチャを活用した現実世界データの実装に取り組むことで、より効果的で安全な治療法の選択や開発が可能になることが示されました。今後もこのような取り組みが広がり、がん患者の治療や生活の質の向上につながることが期待されます。
おわりに
現地でのDAISに参加しているメンバーからの報告をもとに、セッションの内容を解説しました。 DAIS期間中では、セッションに関する記事を以下の特設サイトに順次上げていきますので、見ていただけると幸いです。
https://www.ap-com.co.jp/data_ai_summit-2023/
引き続きどうぞよろしくお願いします!