APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

【Zscaler】ネットワークのブラックボックスを解消!Network Intelligenceで「どこが遅いか」を即座に特定する

はじめに

こんにちは、エーピーコミュニケーションズ iTOC事業部 BzD部 0-WANの片桐です。

今回は、エンドツーエンドのネットワーク可視化機能である Network Intelligence にフォーカスしてご紹介します。

ZDXを運用している中で、「通信が遅いという報告を受けたが、原因がユーザーの端末やローカル環境にあるのか、ISPにあるのか、それともインターネットの先の経路にあるのか特定に時間がかかる」と悩んだことはないでしょうか。

Network Intelligenceを活用すると、ユーザーからアプリケーションに至るまでの複雑なネットワーク経路全体を可視化し、どこで、どの程度の深刻さで遅延が発生しているのかを一目で把握できるようになります。

本記事では、Network Intelligenceの基本的な仕組みと主な機能を整理した上で、実際のダッシュボード画面の見方や、重大度の判定基準といった運用上のポイントをご紹介します。

注意事項:本記事は筆者個人の技術的な知見と検証に基づいた内容です。弊社の公式見解や性能保証を示すものではありません。正確な仕様や最新情報については、Zscaler公式ドキュメントをご確認ください。


1. Network Intelligenceの概要

1-1. Network Intelligenceとは

Network Intelligenceは、Zscaler Digital Experienceに統合された機能であり、エンドユーザーのデバイスからラストマイルISP、Zscaler Zero Trust Exchange、そして最終的なアプリケーションに至るまでのエンドツーエンドのマルチパスネットワークの可視性を提供します。

従来のトラブルシューティングでは、問題が発生してからログやパケットを追う「受動的」なアプローチが主流でしたが、Network IntelligenceはAIと機械学習を用いてネットワークのボトルネックを「プロアクティブ」に発見します。

Zscaler Client Connectorの接続先(ZIA Service Edge)を切り替えることで、問題のあるISPを即座にバイパスするアクションに直結させられる点が、Zscalerの巨大なプラットフォームインフラならではの大きな強みとなっています。

1-2. 従来の分析方法との比較

Network Intelligenceの導入前後で、ネットワーク障害時の分析アプローチがどう変わるかを整理します。

比較項目 従来のトラブルシューティング Network Intelligenceによる分析
経路の可視化 Traceroute等 ロードバランシング等を考慮した
「並列するすべての経路」を可視化
異常の判定 経験則や固定のしきい値に基づく
手動確認
過去7日間のベースラインと
リアルタイム比較による自動検知
ユーザー影響 「遅延=問題」として一律に
トラブルシューティング
遅延とZDXスコアを関連付け、
実業務への影響を正確に判断
影響範囲の把握 SNSやニュース、ISPの
障害情報を待つ必要あり
ピアインパクト分析により、
他顧客への影響状況も即座に確認可能

1-3. 前提条件

Network Intelligenceのダッシュボードにアクセスするには、以下の要件を満たす必要があります。

  • ライセンス要件:ご利用のZDXサブスクリプションがNetwork Intelligenceをサポートしていること(ZDX Advanced Plusが必要となります)。
  • 設定要件(重要):対象となるアプリケーションやZIA Service Edgeに対して、Cloud Pathプローブが設定・有効化されていること。本機能はプローブが収集するメトリクスを解析の土台とするため、事前の設定が必須となります。

2. Network Intelligenceを裏で支える仕組み

2-1. Cloud Pathプローブとベースラインの確立

Network Intelligenceの正確な分析は、継続的なデータ収集に支えられています。

ユーザーのデバイスにインストールされたZscaler Client Connectorが、ZDX上で設定された「Cloud Pathプローブ」を実行し、レイテンシやパケットロスなどのメトリクスを収集します。その後、AI/機械学習アルゴリズムを用いて過去7日間の正常なネットワークパフォーマンスのベースラインを確立し、リアルタイムのパフォーマンスと常に比較して異常を検知します。


3. ダッシュボードから読み解くネットワークのインサイト

ここからは、実際のNetwork Intelligenceダッシュボードの調査フローに沿って、主要な機能と画面の見方を確認していきます。

3-1. 異常の全体像を把握する「マップビュー」

ダッシュボードを開くと、過去14日間のネットワークにおけるアノマリー(Anomaly:ベースラインからの逸脱)の推移や、ユーザー数の多い都市、高レイテンシのASNトップ5がサマリーとして表示されます。

また、マップ上に表示されるドットの色(緑、オレンジ、赤)は、該当地域のZDXスコア(Good、Okay、Poor)を表しています。

3-2. 業務影響を判断する「相関チャート」

特定の地域にドリルダウンすると表示されるこのチャートでは、異常を単独で報告するのではなく、メトリクスと「ZDXスコア」を直接関連付けて評価します。これにより、検知されたアノマリーが、実際にユーザーのデジタルエクスペリエンスに悪影響を及ぼしているかどうかを一目で判断できます。

  • 赤色の背景帯:アノマリーが検知されている時間帯を示します。
  • グレーの面グラフ:ZDXスコアが低い(Poor)ユーザーの数を示します。グラフの高さがそのまま影響を受けている人数を表します。

アノマリーが発生している時間帯(赤の背景帯)に、スコアが低いユーザー数(グレーのグラフの高さ)が連動して増加しているかを見ることで、後述する「遅延が本当に業務影響を与えているか」を判断します。

3-3. ボトルネック経路を特定する「Sankey図(ISP/ASNビュー)」

ここではSankey図を用いて、IPアドレスやASNのつながりを視覚化します。以下のビューを切り替えて確認できます。

  • Client to Application(クライアントのISPからアプリまでの全経路)

  • Client to Zero Trust Exchange(クライアントのISPからZscalerのデータセンターまで)

  • Zero Trust Exchange to Application(Zscalerからアプリまで)

  • Client to Application (Direct)(クライアントからアプリへの直接経路)

経路上の線は、後述する重大度の基準に基づいて黄色赤色でハイライトされ、どこで遅延が発生しているかが一目瞭然となります。


4. Network Intelligenceを使ううえでのポイント

実際の運用において、管理者が正しく状況を判断するための重要なポイントを解説します。

4-1. 重大度が「赤(High/Severe)」になる具体的な基準

ダッシュボードのSankey図(ISP/ASNビュー)において、ボトルネックとなっている経路(線)が赤や黄色に色分けされる重大度の基準は、以下のように定義されています。

【重大度「高(赤)」になる条件】 平常時のベースラインが確立されている場合、以下の両方を満たした経路が赤くハイライトされます。

  • P50レイテンシがベースラインの 3倍以上
  • かつ、レイテンシ自体が 50ms以上(最小しきい値)

(※ベースラインがない場合は、単純に50msを超えると赤判定になります)

【重大度「中(黄/オレンジ)」になる条件】

  • P50レイテンシがベースラインの 2倍以上(3倍未満)
  • かつ、レイテンシ自体が 25ms以上

「高(赤)」のアラートは、平常時と比べて明確な遅延が発生している状態を示します。しかし後述の通り、この「ネットワーク上の遅延」が、必ずしも「ユーザーエクスペリエンス」に直結するとは限りません。ここでもやはり、ZDXスコアとセットで評価することが重要になります。

💡補足:P50 / P95 レイテンシ(パーセンタイル)とは?

極端な遅延データ(外れ値)の影響を排除するため、ZDXでは平均値ではなく「パーセンタイル」という統計指標を用います。

  • P50レイテンシ(中央値):全プローブの50%がこの値以下の遅延に収まっていることを示します。
  • P95レイテンシ:全プローブの95%がこの値以下の遅延に収まっており、残り5%はさらに遅延が大きいことを示します。

4-2. 「ピアインパクト分析」でトラブルシューティングに費やす時間を削減

特定のISP経路で異常が見つかった際、詳細画面(ASN Details)に表示されるピアインパクト分析(Peer Impact Analysis)の項目を確認します。

  • 複数顧客(他社)に影響が出ている場合:自社のネットワーク設定ミスではなく、ISP側のインフラ障害や広域なバックボーン障害です。Zscaler Client ConnectorのApp ProfileやPACファイル等の設定を活用し、影響を受けるユーザーの接続先となるデータセンター(ZIA Service Edge)を切り替えることで、障害が発生しているインターネット経路を即座に迂回させます。
  • 自社のみに影響が出ている場合:インターネットの経路自体は健全であり、自社固有の機器、設定、またはローカルネットワークに起因する問題である可能性が高いと判断できます。

4-3. 遅延=業務影響ではない?ZDXスコアとの掛け合わせ

ネットワークの異常(赤色)が検知されたからといって、必ずしもユーザーが困っているとは限りません。

たとえば、ある環境でレイテンシが10msから40msに増加した場合、これはベースライン(10ms)の3倍以上となるため、ネットワーク指標としては「赤色(High)」の異常として検知されます。しかし、40msという遅延自体は、通常であればユーザーに大きな影響を与えないケースが一般的かと思われます。

ZDXスコアは単なる通信遅延ではなく「実際のユーザーのデジタルエクスペリエンス」を評価する指標であるため、このようなケースではスコアは低下せず、「ダッシュボード上でグレーの面グラフ(ZDXスコアが低いユーザーの数)も増加していない」状態になります。

この場合、「ネットワーク上の異常は起きているが、ユーザーには悪影響を与えていない」と判断でき、緊急対応の優先度を下げる判断が可能になります。


5. まとめ

本記事では、ZDX Network Intelligenceの基本的な仕組みと画面の見方、運用ポイントを紹介しました。

改めてポイントをまとめると:

  • Network Intelligenceは、デバイスからアプリまでのマルチパス経路を可視化し、ブラックボックスを解消する機能
  • 機械学習によるベースラインと実データを比較し、異常箇所をSankey図で視覚的に特定できる
  • 重大度「赤」は、ベースラインの3倍以上かつ50ms以上の深刻な遅延を示す
  • ピアインパクト分析により、自社固有の問題か広域障害かを即座に切り分け、必要に応じてZscaler Client Connectorの接続先のデータセンターを切り替えることによって障害経路を迂回できる
  • ZDXスコアと相関させることで、対応すべきインシデントに集中できる

おわりに

ゼロトラスト環境では「社内・社外」という境界が消え、インターネット自体が企業のメインネットワークとなります。しかし、管理外のネットワークであるインターネットが「ブラックボックス」のままでは、障害時の切り分けに時間がかかり、結果としてユーザーの生産性を損なうという大きなリスクを抱えることになります。

Network Intelligenceによってエンドツーエンドの可視化を実現し、データに基づいてプロアクティブにボトルネックを解消していく。この「可視化」と「迅速なアクション」の両立こそが、ゼロトラスト環境を「導入して終わり」にせず、安定したビジネス基盤として運用し続けるための重要な鍵となります。

私たち0-WANは、ゼロトラスト製品を中心とした、マルチベンダーでのご提案で、お客様の経営課題解決を支援しております。

「ゼロトラストってどうやるの?」「製品を導入したけれど使いこなせていない気がする」「障害時の切り分けをもっと迅速化したい」等々、どんな内容でも支援いたします。お気軽にご相談ください。

▶ 問い合わせ先、0-WANについてはこちら