はじめに
こんばんは、ACS事業部の永里です。
Microsoftの年次イベント、Microsoft Ignite 2023が始まりましたね。
先週の OpenAI Dev Day に続いて、MS IgniteでもAI領域でホットなアップデートが発表されています。
本記事では特にData+AI系サービスのアップデート情報をピックアップしてお届けします。
Azure OpenAI
16kトークンのGPT-3-Trubo および GPT-4-Turboの導入
概要: GPT Turboは、低価格、構造化されたJSONフォーマット、そして拡張プロンプト長を提供します。これにより、最大300ページのテキストを一つのプロンプトに収めることが可能
提供時期: 11月末にプレビュー開始トークン価格のアップデート
概要: Azure OpenAIサービスは、新しいモデルのトークン価格をOpenAIと同等に設定して提供
提供時期: 今週からプレビューとして開始GPT-4-Turbo with Visionの導入
概要: GPT Turbo with VisionはAzure AI Visionに接続可能になり、ビデオ、画像、テキストをプロンプトとして使用が可能。これにより、ビデオプロンプトが入力として使用され、サマリーが出力されるなど、新たな応用が可能
提供時期: 年末までにプレビュー開始GPT-4のファインチューニング
概要: Azure OpenAIサービスでは、独自のデータを使用してGPT-4のカスタムバージョンを作成可能。これにより、より特化した用途やニーズに合わせたGPT-4の利用が可能
提供時期: プレビュー開始Azure AI Content Safety
概要: 潜在的な暴力、憎悪、性的、自傷的なコンテンツを検出し、言語横断的に安全でないテキストに重大度スコアを割り当てることで、チームがより安全なオンライン環境を構築可能
提供時期: 一般的に利用可能
Azure Machine Learning
Pormpt Flow
概要: 大規模言語モデル(LLM)を利用したアプリケーションの開発ライフサイクルを効率化。CLI、SDK、Visual Studio Code拡張機能を使用して、基盤モデル、ベクターデータベース、プロンプト、Pythonツールにアクセスし、LLMワークフローを設計、構築、評価、デプロイ可能
提供時期: Azure Machine Learningで現在一般に利用可能。※Azure AI Studioではプレビュー中モデルカタログ
概要: Hugging Face、Meta、OpenAIなどのプロバイダーからの基盤モデルを発見、評価、微調整、配備する機能を提供。モデルカタログには、Code Llama、Stable Diffusion、OpenAIのCLIPモデルなどが新たに追加
提供時期: 間もなく一般に利用可能。※Azure AI Studioでプレビュー中Model-as-a-Serviceの推論APIとホストされたファインチューニング
概要: 開発者と機械学習の専門家は、APIエンドポイントを介してMetaのLlama 2、Mistralのプレミアムモデル、G42のJaisなどの基盤モデルをアプリケーションに統合し、GPUインフラストラクチャを管理することなくモデルのファインチューニングが可能
提供時期: 近々プレビュー版がリリース予定OneLake
概要: Azure Machine Learningのデータストアとして提供され、Microsoft FabricとAzure Machine Learning間のシームレスな移行を促進。データエンジニアはFabricで開発した機械学習対応のデータ資産を共有し、機械学習の専門家がAzure Machine Learningのモデルトレーニングに直接利用可能
提供時期: 現在プレビュー提供中
Azure AI Search(旧名 Azure Cognitive Search)
ベクトル検索
概要: 大規模な言語モデル(LLM)を利用して文書やデータをベクトル(長い浮動小数点数)という数値フォーマットに変換し、より高速で効率的な検索を可能にする技術。ベクトル検索インデックスにより、LLMからより良い応答を引き出すことが可能
提供時期: 一般的に利用可能セマンティックランカー(正式名称はセマンティック検索)
概要: Microsoft Bingで採用されている多言語、ディープラーニングモデルに基づき、最も関連性の高い検索結果を優先的に配信する機能
提供時期: 一般的に利用可能Azure AI Studioでの利用可能性
概要: Azure AI Searchは、現在プレビュー中の新しい統合AIプラットフォーム、Azure AI Studioで利用可能。これにより、ジェネレーティブAIシステムの開発ライフサイクルにおける重要な検索・取得シ ステムの統合が強化され、アプリ開発者のワークフローが効率化
提供時期: Azure AI Studioで現在プレビュー中
Azure AI Vision
Liveness機能とVision SDK
概要: Liveness機能は顔認識なりすまし攻撃を防止するために設計されており、ISO 30107-3 PAD Level 2に準拠。Vision SDK for Faceは、開発者がモバイルアプリケーションに顔認識とライブネスを簡単に組み込むことが可能
提供時期: 両機能ともにプレビュー版として提供。画像分析 4.0
概要: このAPIは最先端の画像解析モデルを導入しており、画像キャプション、OCR、オブジェクト検出などが単一の同期APIエンドポイントからアクセス可能です。特に、強化されたOCRモデルは、画像内のタイプされたテキストと手書きテキストの両方の精度が向上
提供時期: 一般に入手可能フローレンス基盤モデル
概要: 何十億ものテキストと画像のペアで訓練されたこのモデルは、Azure AI Visionのコスト効率の良い、生産可能なコンピュータビジョンサービスとして統合。これにより、開発者はさまざまな業界において最先端で市場に対応した、責任あるコンピュータビジョンアプリケーションを作成可能
提供時期: 一般に利用可能
Azure AI Speech
Azure Open AI Studioのチャットプレイグラウンドでの音声入出力 概要: チャットのインタラクション体験を強化する多様なモードの入出力機能
提供時期: 一般的に利用可能TTSアバター
概要: 2Dフォトリアルなアバターを生成するニューラルテキストから音声への変換機能
提供時期: パブリックプレビュー中パーソナルボイス
概要: ユーザー独自のAI音声を作成して使用する機能
提供時期: パブリックプレビュー中OpenAIのWhisperモデルのカスタマイズ
概要: ドメイン固有の語彙と音響条件に合わせてWhisperモデルを微調整する機能。 提供時期: パブリックプレビュー中。バイリンガルモデル
概要: バイリンガル音声認識モデル、特に英語とスペイン語、英語とフランス語の言語ペアに対応
提供時期: 一般的に利用可能組込み音声
概要: クラウド接続が断続的または利用不可能な場合に適用されるオンデバイスの音声からテキスト、テキストから音声への変換機能
提供時期: 一般的に利用可能発音評価の言語サポートと強化
概要: 英語、フランス語、ドイツ語、日本語、韓国語、ポルトガル語、スペイン語、中国語など14以上のロケールをサポートする発音評価機能
Azure AI Studio
統合AIプラットフォーム
概要: Azure の AI サービス群が統合管理されたプラットフォーム。最先端のAIツールと機械学習モデルを使用して、AIソリューションのシームレスな探索、構築、テスト、展開をサポートするワンストップショップを。開発者は、すぐに使えるカスタマイズ可能なツールやモデルを使用して、生成的なAIアプリケーション(copilotを含む)を構築可能
提供時期: プレビュー版がリリース機能と利用可能性
概要: ユーザーは、Microsoft Fabric OneLakeやAzure AI Searchなどのベクトル埋め込み用データソースを選択、フロンティアモデルやオープンソースモデルの包括的なカタログからモデルを選び、プロンプトフローをオーケストレーションし、モデルの応答を評価し、微調整の機会を特定し、継続的なモニタリングと改良を行いながら、概念実証を本番環境にスケールさせることが可能
提供時期: プレビュー版がリリース音声分析のトライアウト
概要: 音声およびビデオ記録を書き起こし、要約や重要な情報を抽出する機能
提供時期:
AIアクセラレータ
NVIDIA H200 GPU
概要: AzureはNVIDIAの最新のGPU AIアクセラレータであるH200を導入し、大きなモデル推論をより高速でサポート
提供時期: 近い将来Azureの機密GPU VMSのプレビュー
概要: この機能により、敏感なデータセット上でAIモデルを安全に実行することが可能になります。リトリーバル拡張生成(RAG)などのタスクに使用可能
提供時期: プレビュー版がリリースAMD MI300X AIアクセラレータの導入
概要: AzureはAMDのフラッグシップであるMI300X AIアクセラレータを導入し、AIに最適化されたVMの選択肢を拡充します。これにより、大規模なモデルをより速く、少ないGPUで提供
提供時期: すでに一部のお客様に対して早期アクセスが提供Azure Maia AIアクセラレータの発表
概要: Maia 100は、LLMトレーニングや推論などのクラウドAIワークロードに特化して設計されており、現代の冷却、電力管理、ハードウェアとソフトウェアのアルゴリズム共設計の組み合わせ
提供時期: 近い将来にフリート全体に展開予定