弹性伸缩是根据业务需求和策略,经济地自动调整弹性计算资源的管理服务。随着Kubernetes已经成为云原生应用编排、管理的事实标准,越来越多的应用选择向Kubernetes迁移,用户也越来越关心在Kubernetes上应用如何快速扩容面对业务高峰,以及如何在业务低谷时快速缩容节约资源与成本。

弹性伸缩典型的场景包含在线业务弹性、大规模计算训练、深度学习GPU或共享GPU的训练与推理、定时周期性负载变化等。

# 工作负载伸缩(HPA)

根据CPU利用率和(或)内存利用率指定工作负载Pod副本数的伸缩范围。