APC 技術ブログ

株式会社エーピーコミュニケーションズの技術ブログです。

株式会社 エーピーコミュニケーションズの技術ブログです。

KubeCon EU 2023 : Kubernetes SIG Scalability

こんばんは、ACS 事業部の埜下です。

KubeCon + CloudNativeCon Europe 2023 の 1 日目、Kubernetes SIG Scalability のセッションについてお伝えします。

Kubernetes SIG Scalability の紹介

導入として、SIG Scalability では何をしているのかについて説明がありました。

  • スケーラビリティの定義と推進
  • パフォーマンス向上
  • システムのパフォーマンスの監視と測定
  • リグレッションからの保護
  • コミュニティの助言と指導

また、SIG Scalability では以下の観点で SLI/SLO を定義しているようです。

  1. API Call Latency
  2. Pod Startup Latency
  3. In-Cluster Network Programming Latency
  4. DNS Programming Latency
  5. In-Cluster Network Latency
  6. DNS Latency

github.com

Scalability Testing Infrastructure

テストフレームワークとして ClusterLoader2 を使用しているそうです。

github.com

ClusterLoader2 は半宣言的にクラスタの望ましい状態を記述します。

また、クラスタをシミュレートするための Kubemark というツールも使用しているそうです。 これにより、テスト用に大規模なクラスタを用意できるとのこと。

github.com

予算を使い果たしそうなのでインフラコストの削減が必要とも仰っていました。

リグレッション

リリースごとに API Server や Kubelet でスケーラビリティのリグレッションが発生していたものの、前回のリリース(v1.27?)はまったく発生しなかったそうです。

色々なコンポーネントでリグレッションが見られるので、スケーラビリティのことを頭の片隅においてほしいとのことです。

スケーラビリティの向上

SIG API-machinery と共同で以下の KEP などに取り組んでいるそうです。

さいごに

SIG Scalability のセッションについてお伝えしました。 どのように Kubernetes のスケーラビリティが維持・改善されているか垣間見ることができました。

本記事の投稿者: 埜下 太一
AKS/ACA をメインにインフラ系のご支援を担当しています。
個人ブログ