HPA与VPA自动伸缩实战（应对流量洪峰的弹性方案）

张开发

• 2026/4/19 20:56:08 • 15 分钟阅读

分享文章

HPA 管“多少个 Pod”VPA 管“每个 Pod 要多少资源”二者互补可联合部署核心是先 VPA 做资源校准再 HPA 做副本弹性配合 Cluster Autoscaler 实现从 Pod 到节点的全链路弹性。一、核心对比HPA vs VPA维度HPA水平伸缩VPA垂直伸缩伸缩对象Pod 副本数增减实例单 Pod 的 CPU/内存 Requests/Limits是否重启 Pod否Auto/Recreate 模式会重启Initial/Off 不重启核心指标CPU/内存、QPS、队列长度等自定义指标历史资源使用量推荐合理 Requests适用场景无状态、流量波动大Web/API、秒杀/直播有状态、资源难预估、单体/数据库、降本增效生产定位应对流量洪峰保证可用性资源调优Rightsizing提升集群利用率依赖组件Metrics Server / Prometheus AdapterVPA Controller需单独部署二、HPA 实战水平伸缩应对流量1. 前置依赖部署 Metrics Serverkubectl apply-fhttps://github.com/kubernetes-sigs/metrics-server/releases/latest/download/components.yaml# 验证kubectl get deployment metrics-server-nkube-system2. 完整 HPA 配置autoscaling/v2# hpa-demo.yamlapiVersion:autoscaling/v2kind:HorizontalPodAutoscalermetadata:name:app-hpanamespace:defaultspec:scaleTargetRef:apiVersion:apps/v1kind:Deploymentname:app-demominReplicas:2# 最小副本maxReplicas:10# 最大副本behavior:# 防抖动配置生产必加scaleUp:stabilizationWindowSeconds:60# 稳定窗口60秒policies:-type:Percentvalue:50periodSeconds:60# 60秒内最多扩容50%scaleDown:stabilizationWindowSeconds:300# 缩容稳定窗口5分钟policies:-type:Percentvalue:20periodSeconds:60metrics:-type:Resourceresource:name:cputarget:type:UtilizationaverageUtilization:70# CPU目标利用率70%-type:Resourceresource:name:memorytarget:type:UtilizationaverageUtilization:80# 内存目标利用率80%3. 应用与验证# 应用kubectl apply-fhpa-demo.yaml# 查看状态kubectl get hpa app-hpa# 观察扩容/缩容kubectl get hpa app-hpa-w4. 高级基于自定义指标QPS/队列长度需部署 Prometheus Prometheus Adapter示例metrics:-type:Podspods:metric:name:http_requests_per_second# 自定义QPS指标target:type:AverageValueaverageValue:1000m# 单Pod平均QPS阈值1000三、VPA 实战垂直伸缩资源调优1. 部署 VPA 组件# 国内镜像加速版kubectl apply-fhttps://raw.githubusercontent.com/kubernetes/autoscaler/master/vertical-pod-autoscaler/hack/vpa-up.yaml# 验证kubectl get deployment-nkube-system|grepvpa2. VPA 四种更新模式关键模式行为是否重启 Pod适用场景Auto自动调整 Requests/Limits逐出重建是非核心服务、可容忍短暂中断Recreate同 Auto但强制重建 Pod不使用就地更新是依赖就地更新不生效的场景Initial仅在 Pod 启动时推荐初始资源后续不调整否启动时核心服务、避免重启影响可用性Off仅生成推荐值不修改资源否资源调优观察、不自动干预3. 完整 VPA 配置# vpa-demo.yamlapiVersion:autoscaling.k8s.io/v1kind:VerticalPodAutoscalermetadata:name:app-vpanamespace:defaultspec:targetRef:apiVersion:apps/v1kind:Deploymentname:app-demoupdatePolicy:updateMode:Initial# 生产核心服务建议用InitialresourcePolicy:containerPolicies:-containerName:*minAllowed:cpu:100mmemory:128MimaxAllowed:cpu:4memory:8GicontrolledResources:[cpu,memory]4. 查看推荐值与效果# 查看VPA状态kubectl get vpa app-vpa-oyaml# 查看Pod资源配置是否被更新kubectl get podpod-name-ojsonpath{.spec.containers[0].resources}四、HPA VPA 联合部署1. 联合架构与顺序VPA 先跑 → 校准单 Pod 资源 → HPA 再根据资源/自定义指标扩缩副本⚠️ 冲突规避VPA 用 Initial/Off 模式避免与 HPA 同时修改资源导致抖动。2. 联合配置示例# 1. 先部署VPAInitial模式kubectl apply-f vpa-demo.yaml# 2. 再部署HPAkubectl apply-f hpa-demo.yaml3. 生产联合注意事项核心服务用 VPA Initial 模式仅启动时校准避免重启非核心服务用 VPA Auto 模式自动调优HPA 务必配置 behavior 稳定窗口防止频繁扩缩容配合 Cluster Autoscaler当 Pod 因资源不足无法调度时自动扩容节点五、生产避坑与最佳实践1. HPA 避坑❌ 不要只看 CPU内存密集型服务必须加内存指标❌ 避免阈值过低70%~80% 是合理区间过低导致频繁扩容✅ 必加 behavior 稳定窗口解决“抖动”问题✅ 结合 Cluster Autoscaler解决节点资源不足导致的 Pending2. VPA 避坑❌ 生产不要用 Auto 模式改核心服务避免意外重启❌ 不要限制 minAllowed 过低可能导致 OOM✅ 先观察 1~2 天推荐值再固定资源配置提升稳定性✅ 结合监控跟踪 VPA 推荐值与实际使用的差距3. 全链路弹性组合业务流量 → HPA(扩缩Pod) → VPA(校准单Pod资源) → Cluster Autoscaler(扩容节点)六、常用命令速查# HPAkubectl get hpa-Akubectl delete hpahpa-name# VPAkubectl get vpa-Akubectl describe vpavpa-namekubectl delete vpavpa-name# 观察扩缩容kubectl get deployment-wkubectl get pods-w七、总结HPA解决“流量洪峰”保证服务可用是弹性的“骨架”VPA解决“资源浪费”提升集群利用率是弹性的“血肉”生产组合VPA Initial HPA Cluster Autoscaler兼顾稳定与成本

更多文章

前端开发 2026/4/17 13:49:32

CasRel模型惊艳效果展示：实体对叠（SEO）场景下零漏抽案例

CasRel模型惊艳效果展示：实体对叠（SEO）场景下零漏抽案例 1. 关系抽取的技术突破在信息爆炸的时代，如何从海量文本中准确提取结构化信息成为了关键挑战。传统的关系抽取方法常常在面对复杂文本时表现不佳，特别是在实…

张开发

前端开发 2026/4/17 13:49:31

3步终极指南：永久免费备份微信聊天记录的完整解决方案

3步终极指南：永久免费备份微信聊天记录的完整解决方案【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 你是否担心重要的微信聊天记录会随着手机更换而消失&am…

张开发

前端开发 2026/4/17 13:49:30

如何在Sketchfab上轻松获取3D模型？Firefox用户脚本终极指南

如何在Sketchfab上轻松获取3D模型？Firefox用户脚本终极指南【免费下载链接】sketchfab sketchfab download userscipt for Tampermonkey by firefox only 项目地址: https://gitcode.com/gh_mirrors/sk/sketchfab 对于3D设计师、游戏开发者或数字艺术爱好者…

张开发

前端开发 2026/4/17 11:48:18

三小时从硬件小白到Ryzen调校高手：SMUDebugTool实战指南

三小时从硬件小白到Ryzen调校高手：SMUDebugTool实战指南【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Table. 项目地址: https://…

张开发

前端开发 2026/4/17 13:49:32

牛客网 2026 最新 1100道 Java 面试题来袭，面面俱到，太全了

一转眼金三银四已经过了大半了，不知道你春招上岸了，还是等着秋招呢？大家从 Boss 直聘上或者其他招聘网站上都可以看到 Java 岗位众多，Java 岗位的招聘薪酬天差地别，人才要求也是五花八门。而很多 Java 工程师求职过程…

张开发

前端开发 2026/4/17 13:52:14

如何通过3个步骤让普通耳机实现专业级音质：音频优化工具完全指南

如何通过3个步骤让普通耳机实现专业级音质：音频优化工具完全指南【免费下载链接】equalizerapo Equalizer APO mirror 项目地址: https://gitcode.com/gh_mirrors/eq/equalizerapo 你是否曾经困惑，为什么同样的音乐在不同设备上听起来天差地别&a…

张开发

前端开发 2026/4/17 14:08:58

IndexTTS-2-LLM部署指南：Web界面+API接口，快速集成到你的项目

IndexTTS-2-LLM部署指南：Web界面API接口，快速集成到你的项目 1. 项目概述与核心价值 IndexTTS-2-LLM是一款基于大语言模型的智能语音合成系统，它将先进的文本转语音技术与易用的工程实现完美结合。相比传统TTS方案，这个镜像提供…

张开发

前端开发 2026/4/17 12:56:10

大麦网自动抢票脚本：Python技术实现毫秒级购票体验

大麦网自动抢票脚本：Python技术实现毫秒级购票体验【免费下载链接】Automatic_ticket_purchase 大麦网抢票脚本项目地址: https://gitcode.com/GitHub_Trending/au/Automatic_ticket_purchase 还在为抢不到心仪演唱会门票而烦恼吗？每次热门演出…

张开发

前端开发 2026/4/17 14:10:04

反向传播与梯度下降

张开发

前端开发 2026/4/17 13:49:35

直流可调高压电源模块12v24v转1800v1900v2000v2100v 纹波0.01% 输出精度0.01%

IBFKJ-H 系列隔离型高压电源模块是一款较大功率的模块化高压电源，基于航天军品级设计，采用先进的高压微型化处理工艺和高效率大功率高压电源解决方案，实现了在小体积下输出功率达到 30W、最高输出电压达到 /-2000V、最大输出电流达到 300mA、…

张开发

前端开发 2026/4/19 0:25:18

从零开始：3步掌握N_m3u8DL-CLI-SimpleG视频下载工具

从零开始：3步掌握N_m3u8DL-CLI-SimpleG视频下载工具【免费下载链接】N_m3u8DL-CLI-SimpleG N_m3u8DL-CLIs simple GUI 项目地址: https://gitcode.com/gh_mirrors/nm3/N_m3u8DL-CLI-SimpleG 还在为在线视频无法下载而烦恼吗？今天我要为你介绍一个…

张开发

前端开发 2026/4/18 2:06:18

实时图表编辑技术深度解析：Mermaid Live Editor架构揭秘与性能优化

实时图表编辑技术深度解析：Mermaid Live Editor架构揭秘与性能优化【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid…

张开发

HPA与VPA自动伸缩实战（应对流量洪峰的弹性方案）

最新文章

别再凭感觉了！信号走线多长才需要加端接电阻？一个公式帮你快速判断

NumPy广播机制深度解析：从ValueError: operands could not be broadcast together with shapes 到实战避坑指南

书匠策AI：学术江湖的“论文秘籍”，期刊写作新利器！

灵活的使用ap_ctlr_none实现功能(三)

DolphinDB 实战：构建批流一体的 Alpha 因子计算平台

py-webrtcvad深度解析：构建高精度Python语音活动检测系统

推荐文章

终极Python m3u8下载器：如何快速解密并批量下载加密视频的完整指南

5分钟搞定抖音素材批量下载：douyin-downloader让你的创作效率翻倍

Python高级应用系列（八）：并发编程——Threading、Multiprocessing与并发模式

CSS如何使用-is伪类缩减重复选择器_通过分组选择器提升代码维护效率

Vue.js监听器watch中deep深度监听与immediate立即执行配置

Redis怎样清理旧的快照文件_配合Shell脚本实现RDB历史备份轮转

相关文章

钢坯火焰清理机设计【开题报告+任务书+毕业论文+CAD图纸+翻译】

15 | Claude Code Hooks 事件驱动自动化：防微杜渐的安全防线

Linux党福利：Debian12下用VSCode+SDCC玩转51单片机（含WSL配置指南）

从微调到精控：可变电阻在音频电路中的深度应用解析

Mahony、互补滤波与卡尔曼：给嵌入式新手的六轴姿态融合算法选型指南

保姆级教程：在WSL2的Ubuntu 22.04上，用CUDA 12.9编译运行llama.cpp（含模型下载避坑指南）

分享文章

更多文章

CasRel模型惊艳效果展示：实体对叠（SEO）场景下零漏抽案例

3步终极指南：永久免费备份微信聊天记录的完整解决方案

如何在Sketchfab上轻松获取3D模型？Firefox用户脚本终极指南

三小时从硬件小白到Ryzen调校高手：SMUDebugTool实战指南

牛客网 2026 最新 1100道 Java 面试题来袭，面面俱到，太全了

如何通过3个步骤让普通耳机实现专业级音质：音频优化工具完全指南

IndexTTS-2-LLM部署指南：Web界面+API接口，快速集成到你的项目

大麦网自动抢票脚本：Python技术实现毫秒级购票体验

反向传播与梯度下降

直流可调高压电源模块12v24v转1800v1900v2000v2100v 纹波0.01% 输出精度0.01%

从零开始：3步掌握N_m3u8DL-CLI-SimpleG视频下载工具

实时图表编辑技术深度解析：Mermaid Live Editor架构揭秘与性能优化