深度学习正则化 —— 控制容量的实战武器库（十七）

张开发

• 2026/6/8 19:04:53 • 15 分钟阅读

最新文章

推荐文章

相关文章

分享文章

深度学习正则化 —— 控制容量的实战武器库（十七）

1. 定位导航上一篇说明了过拟合的危害——模型记住训练集噪声而无法泛化。本篇是实战武器库：每一种正则化技术的数学原理 + 数值推演 + 何时使用。正则化的统一定义（Goodfellow）：正则化 = 修改学习算法，使其降低泛化误差（而非训练误差）的任何手段。2. 正则化的统一框架绝大多数正则化手段都可以写成在目标函数中添加惩罚项：J~(θ;X,y)=J(θ;X,y)+α⋅Ω(θ)\tilde{J}(\boldsymbol{\theta}; \mathbf{X}, \mathbf{y}) = J(\boldsymbol{\theta}; \mathbf{X}, \mathbf{y}) + \alpha \cdot \Omega(\boldsymbol{\theta})

更多文章

你的网站被“下毒”了？XSS和CSRF：前端安全的两大“毒瘤”

前端开发 2026/6/8 18:59:40

你的网站被“下毒”了？XSS和CSRF：前端安全的两大“毒瘤”

你有没有听说过：点了个链接，微博自动转发了奇怪的内容；登录了银行网站，钱莫名其妙被转走。今天我们就来揪出前端安全领域的两个“惯犯”——XSS（跨站脚本攻击）和CSRF（跨站请求伪造）。…

作者头像

张开发

RN中如何处理推送通知（本地推送、远程推送），点击推送跳转指定页面？

前端开发 2026/6/8 18:58:48

RN中如何处理推送通知（本地推送、远程推送），点击推送跳转指定页面？

在 React Native（RN）中处理推送通知，一般分为三块：1️⃣ 本地推送（Local Notification） 2️⃣ 远程推送（Push Notification / FCM / APNs） 3️⃣ 点击通知跳转页面（Deep …

作者头像

张开发

CEEMDAN信号分解与多熵联合分析：从峭度到多尺度排列熵的故障诊断实战

前端开发 2026/6/8 19:01:45

CEEMDAN信号分解与多熵联合分析：从峭度到多尺度排列熵的故障诊断实战

1. 为什么需要CEEMDAN信号分解与多熵联合分析旋转机械故障诊断一直是工业领域的难点问题。想象一下，一台大型风力发电机的齿轮箱突然出现故障，维修人员赶到现场时往往面临两个困境：要么故障已经非常严重导致停机，要么根本无法判断…

作者头像

张开发

CLI - AI Agent 的「万能遥控器」，彻底搞懂 CLI、MCP 与 Skill 的关系

前端开发 2026/5/24 8:24:54

CLI - AI Agent 的「万能遥控器」，彻底搞懂 CLI、MCP 与 Skill 的关系

飞书 CLI：AI Agent 的「万能遥控器」，彻底搞懂 CLI、MCP 与 Skill 的关系📌 导读：2026年3月28日，飞书正式开源了飞书 CLI（larksuite/cli）。一个看似「古老」的命令行工具，为什么能让…

作者头像

张开发

红外弱小目标检测：评价指标的MATLAB实现与优化

前端开发 2026/5/24 8:25:21

红外弱小目标检测：评价指标的MATLAB实现与优化

1. 红外弱小目标检测评价指标概述在红外图像分析领域，弱小目标检测一直是技术难点。这类目标通常只占几个像素，信噪比低，传统检测方法容易漏检或误判。要评估算法性能，就需要建立科学的评价体系。我结合多年实战经验，…

作者头像

张开发

Windows 部署 Seata 1.6.1 高可用服务与自动化运维实践

前端开发 2026/5/30 4:02:37

Windows 部署 Seata 1.6.1 高可用服务与自动化运维实践

1. 为什么选择Seata 1.6.1高可用部署在分布式系统中，事务管理一直是个让人头疼的问题。我经历过太多因为事务不一致导致的数据错乱，特别是电商场景下的订单支付和库存扣减。Seata作为阿里开源的分布式事务解决方案，用起来确实能省不少心。最…

作者头像

张开发

避坑指南：为什么你下载的GitHub项目zip包总是缺少子模块？（以CoolProp为例）

前端开发 2026/5/24 8:25:59

避坑指南：为什么你下载的GitHub项目zip包总是缺少子模块？（以CoolProp为例）

为什么GitHub项目zip包会丢失子模块？从CoolProp案例看正确下载方式当你从GitHub下载一个开源项目的zip压缩包时，是否遇到过编译失败的情况？控制台报错提示缺少某些依赖文件，但明明已经下载了整个项目。这个问题困扰过无数开发者&…

作者头像

张开发

【稀缺首发】多模态低资源训练黄金三角框架：动态模态掩码（DMM）+ 分层参数冻结（HPF）+ 跨样本对比蒸馏（CSCD）

前端开发 2026/5/27 13:08:56

【稀缺首发】多模态低资源训练黄金三角框架：动态模态掩码（DMM）+ 分层参数冻结（HPF）+ 跨样本对比蒸馏（CSCD）

第一章：多模态大模型低资源训练方法 2026奇点智能技术大会(https://ml-summit.org) 在算力与标注数据受限的现实场景中，高效训练多模态大模型（如图文对齐、音视频联合建模）亟需轻量化策略。核心挑战在于平衡模态表征一致性、参数…

作者头像

张开发

Monash College因规划分析方面的卓越成就荣获认可

前端开发 2026/5/24 8:26:28

Monash College因规划分析方面的卓越成就荣获认可

Monash College 在TM1（IBM Planning Analytics的一部分）的应用之旅中取得了应得的认可。凭借由财务部门主导的规划分析模型，他们现在每周能运行60种情景模拟，并将月度结账时间缩短了一半。我们很荣幸能与Michael Williamson及整个…

作者头像

张开发

用OCaml重写经典算法：从斐波那契数列看函数式编程的思维转换

前端开发 2026/5/24 8:24:15

用OCaml重写经典算法：从斐波那契数列看函数式编程的思维转换

用OCaml重写经典算法：从斐波那契数列看函数式编程的思维转换函数式编程正逐渐从学术象牙塔走向工业实践，而OCaml作为一门兼具实用性与表达力的函数式语言，为我们提供了绝佳的思维训练场。本文将以斐波那契数列为切入点，带您体验从…

作者头像

张开发

Pixel Aurora Engine 网络编程基础：构建分布式图像生成集群

前端开发 2026/5/24 8:24:30

Pixel Aurora Engine 网络编程基础：构建分布式图像生成集群

Pixel Aurora Engine 网络编程基础：构建分布式图像生成集群 1. 为什么需要分布式图像生成想象一下，你正在运营一个电商平台，每天需要生成上万张商品展示图。单台服务器的GPU算力有限，生成速度跟不上需求，排队等待的…

作者头像

张开发

MasterPDF多功能PDF编辑软件：解决PDF编辑与水印添加等常见问题

前端开发 2026/5/24 8:27:08

MasterPDF多功能PDF编辑软件：解决PDF编辑与水印添加等常见问题

在日常办公中，你是否遇到过这样的困扰：收到一份PDF合同，发现有个错别字却无法修改；需要给多页PDF文档添加“机密”水印，却只能一页页截图粘贴；或者想合并多个PDF文件，却找不到一个简单免费的工具…

作者头像

张开发