APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

Chat UI がすべての入口になる? MCP Apps と音声入力で感じた可能性

はじめに

ACS 事業部の井田です。

皆さんは Chat 形式の UI をどう感じていますか? 便利だけれど、毎回テキストを入力するのがちょっと面倒……そう思ったことはないでしょうか。

私は、ChatGPT の登場から AI チャットを日常的に使っていますが、Chat UI の UX は本質的によくない と感じています。チェックボックスやラジオボタンでポチポチ選べる従来のアプリの方が、操作は楽だと思います。 一方、日々業務で利用するサービスは多岐に渡り、サービスごとに異なる UI を覚える認知負荷も無視できません。

そんな中、MCP Apps の登場により、ChatUI へのインタラクティブな UI の統合が可能になりました。最近までは、AI Chat の中でインタラクティブな UI が表示できて何が嬉しいのか分からず、Chat UI を用いない Web アプリの方が使いやすくない?と思っていたのですが、ユーザーのメンタルモデルが「システムは Chat UI で音声入力するもの」に変わる未来が来るかもと考えたのでまとめてみます。

Chat UI の UX は良くない

まず前提として、Chat UI の UX はあまり良くないと感じています。 LLM の出力がテキストで、そこにユーザーフレンドリーな体験を与えるために Chat UI の形式が採用されたと考えているのですが、ユーザー視点では「毎回テキストを入力するのが面倒」という問題があります。

従来のアプリケーションでは、チェックボックス・ラジオボタン・ドロップダウンなど、ユーザーが選択するだけで操作が完了する UI が主流です。ユーザーは選択肢を目で見て選ぶだけでよく、何を入力すべきか考える必要がありません。

理想の UX は「見えない AI」

私が考えていた理想は、ユーザーが AI の存在を意識しないまま、内部的に AI が処理を担っているパターンです。

ユーザー視点では従来通りのボタン操作だけれど、裏側では AI が最適な処理を行っている。この「見えない AI」のアプローチが、UX が高いと考えています。

現実社会での問題 ー 複数サービスの UI と操作を覚える認知負荷

皆さんが所属する企業では、いくつのサービスを業務で利用していますか?

業務では、プロジェクト管理ツール、コミュニケーションツール、ドキュメント管理、CI/CD、監視ツール……それぞれに異なる UI があり、操作方法を覚える必要があります。また、利用するサービスも変更や増加はあれど、大きく減ることはないでしょう。

このサービスごとの UI を覚える認知負荷は、サービスの数が増えるほど大きくなります。新しいメンバーのオンボーディングコストにも直結する問題です。

MCP Apps の登場 — Chat UI の中に Web アプリのような UI を描画する

ここで注目したいのが MCP Apps です。

MCP Apps は、AI との Chat の中に Web アプリのようなリッチな UI コンポーネントを描画できる仕組みです。

引用:公式の動画キャプチャ

参考:MCP Apps公式

これにより、構図が変わります。

  • 従来: サービスごとに異なる UI を覚えて使いこなす必要がある
  • MCP Apps: 統一された Chat UI という体験の中に、サービスごとの UI が描画される

つまり、「Chat UI の UX は高くない」という前提は変わらないものの、多数の異なるサービスの UI を個別に覚えて使えるようにするのと、統一された Chat UI の中にサービスごとの UI が描画されるのとで、どちらが認知負荷が低いか という新しい問いが生まれます。

サービスの数が少なければ、各サービスの UI を覚える方が効率的でしょう。しかし、サービスの数が一定以上になると、統一されたインターフェースの中で操作できる MCP Apps のアプローチの方が認知負荷は低くなる気がします。

音声入力という決め手

そして、音声入力が最終的な1つの決め手になると私は考えています。

Chat UI の最大の弱点は「毎回テキストを入力する煩わしさ」でした。しかし、音声入力があればこの弱点は大幅に軽減されます。

私は、Claude Code や GitHub Copilot Chat を日常的に利用する際に、基本的に音声入力しています。試してみると実感できますが、タイピングよりも圧倒的に楽に多くの情報を渡せます。タイピングでは面倒で省略しがちな背景情報やニュアンスも、音声ならそれほど負担にならずに伝えられます。

統一された Chat UI による体験に加えて、音声入力が当たり前になれば、ユーザーのメンタルモデルが大きく変わる可能性があります。

将来的には、「システムは Chat UI で音声入力するもの」というメンタルモデルが定着するかもしれません。

まとめ

本記事では、Chat UI・MCP Apps・音声入力の関係性について考察しました。

  • Chat UI の UX はあまり良くないが、MCP Apps によってリッチな UI を統合できるようになった
  • サービスの増加に伴う認知負荷の問題に対して、統一された Chat UI は有効なアプローチになり得る
  • 音声入力が Chat UI の弱点(テキスト入力の煩わしさ)を解消する1つの決め手となる
  • 「システムは Chat UI で音声入力するもの」というメンタルモデルの変化が起きる可能性がある

ユーザーはやりたいことを音声で伝え、AIが必要なサイトにアクセスし UI をチャットウィンドウに描画する。音声入力でやりたいことを AI に任せたり、チャットウィンドウに表示された UI に対して自らアクションをするが、実際のサービスごとにアクセスして操作はしない。そんな未来が来るかもしれません。

ACS 事業部のご紹介

私の所属する ACS 事業部では、開発者ポータル Backstage、Azure AI Service などを活用し、Platform Engineering + AI の推進・内製化を支援しています。

www.ap-com.co.jp www.ap-com.co.jp www.ap-com.co.jp

また、GitHub パートナーとしてお客様に GitHub ソリューションの導入支援を行っています。 GitHub Copilot などのトレーニングなども行っておりますので、ご興味を持っていただけましたらぜひお声がけいただけますと幸いです。

一緒に働いていただける仲間も募集中です! ご興味持っていただけましたらぜひお声がけください。

www.ap-com.co.jp www.ap-com.co.jp

本記事の投稿者: 井田一貴