こんにちは、クラウド事業部の山路です。 今回はAWS re:Invent 2023のKeynote (Day3) の様子を共有します。
※追記:録画も公開されたので興味ある方はこちらからどうぞ。
講演開始前
今日はDJがフロアを温めてます。この時に気づいたのですが手話通訳の方も踊ってました!
講演開始
発表者はDr. Swami Sivasubramanian。
最初にムービーが流れましたが、「generative AI」というワードがこれでもかと流れてきました。今年は完全に生成AIに振り切ってます。
人類が生成AIに至るまでの道筋を紹介してるっぽい。
生成AIアプリケーションを造るのに必要なもの
昨日のKeynoteにも出てきた、生成AIの3層構成。
どんなモデルでも、それ一つで全てを解決することはできない。なので適切なモデルを選択する必要がある。
Amazon Bedrockはこれだけのモデルに対応している
ここで新発表、さらにAnthropic Claude 2.1にも対応しました。
さらにMeta Llama 2 70Bにも対応。
ここからはより具体的な話。まずはデータ(ここではテキスト)をベクトルで表し数学的に解釈するVector embedding。
生成モデルをカスタマイズするにはVectorが重要、Vectorありとなしとでは性能が変わってくる。
AWSの提供する生成モデルのAmazon Titanはtext embedding機能も利用できます。
例えばベッドの画像データを与えて、これに合う家具を推薦してもらったり。
一方で複数のモデルを使ったアプリケーションは複雑である。例えばある家具を扱う店が、価格帯などから家具を検索し、画像を表示できるようにするには、家具の持つ「テキスト」データだけでなく「画像」データも必要です。
これを解消するため、Amazon Titan Multimodal embeddingsを発表。
さらにtext関連の新機能の紹介が続きます。
今度は画像生成にも対応。Amazon Titan Image Generatorの発表
Image Generatorには責任あるAIを達成するための仕組みもネイティブに含まれているようです。
イグアナを題材にしたImage Generatorのデモ
Amazon Titanの機能もかなり充実してきました
Amazon Bedrockはすでに10,000社以上で使われてます!
Amazon Bedrockユーザー代表としてIntuitのNhung Hoさんが登場。
戻ってDr. Swami Sivasubramanian。データが差別化につながる。ここは昨日も出てきました。
fine tuning / continuous pre-trainingにより、ユースケースに合わせてモデルをカスタマイズする
Amazon Titanはどちらの機能も利用できます。
他のモデルもfine tuningに対応
BedrockはRAGにも対応しました
Vectorのデータ元は今後拡張予定
AWS Generative AI Innovation Centerの紹介。生成AIを活用したい組織向けのプログラム
カスタムモデル向けのプログラムが発表
Amazon Sagemakerの紹介もしつつ、Foundation modelをトレーニングするのは難しいという課題。
新サービス、Amazon Sagemaker HyperPodの発表
さらにAmazon Sagemaker Innovationsの発表
ここで2人目のゲスト、PerplexityのAravind Srinivasさん。
生成AIはデータ基盤が重要。昨日もあった包括的・統合的・統治的の話。
包括の話。AWSは多様なサービスを提供していますが、Vectorを検索可能にしたい。
新サービス、Vector engine for Opensearch Serverlessの発表
さらにAmazon DocumentDB、Amazon DynamoDB、Amazon MemoryDB for RedisでもVectorサーチが可能に
Vector search とグラフ分析が重要な観点を生みます
Amazon Neptune Analyticsの発表
Vector searchが可能なサービスがこれだけあります
次は統合の話。昨日もあったZero-ETLのお話です
Amazon Opensearch Service zero-ETL integration with Amazon S3の発表
最後は統治の話。DataZoneの紹介なども。
AWS Clean Roomsの話。元データを直接渡さずともパートナーとともにデータ分析を実現可能にするサービスです。
ただし機械学習などを利用して予測可能な観点を生み出すのは難しい。
そこで新サービス、Amazon Clean Rooms MLの発表
三人目のゲスト、Booking.comのRob Francisさんが登場
昨日も出てきたAmazon Q
自然言語をSQLに?
Amazon Q generative SQL in Amazon Redshiftの発表
zero-ETLを勧めてるけど、現実問題どうしても複雑なETLは残ってしまう。ならせめて、カスタムETL jobをシンプルに管理できるようにしよう
Amazon Q data integration in AWS Glueの発表
Amazon Quicksightの話。こちらはAWSのShannon Kaliskyさんから。
これで自分たちのデータをベースにした生成モデルが作れる、となりますが、作成したモデルをどう評価すればよいのでしょうか?
ここでModel evaluation on Amazon Bedrockの発表。モデル評価までBedrockがしてくれます。
最後にPartyRockの紹介などで終了。
さいごに
Day1/2に続き3日目の内容も共有させていただきました。Day2に比べるとさすがに落ち着きがあるといいますか、基本的に前日のKeynoteを補足するような内容となりました。ただそれだけに繰り返し出てきたものはAWSとして強調したいところなのかもしれません。個人的には3層レイヤーの図とかは今後も見ることになるんだろうなあと思っていました。今年は完全に生成AIに振り切っていましたね(初日のサーバーレスとかがかすんでしまう。。。)。
明日以降もAWS re:Invent2023の内容を共有していこうと思います。