2025 年 10 月 20 日,一个开启工作周的周一,平静地开始了。但这份平静很快被恐慌取代:一个软件缺陷引发了 AWS 大规模服务中断,全球多家大型企业及其众多高频使用的应用与服务均受到影响。该问题的根源是两个程序同时尝试写入同一条 DNS 记录。这条 DNS 记录最终为空,AWS 的多项其他服务也由此开始接连失控。这次中断导致使用 AWS 技术栈的客户不知所措,工程师们则紧急排查以寻找原因。
这一情况表明,当您过度依赖第三方依赖项时可能会发生的问题。虽然将它们从技术堆栈中完全移除可能行不通,但大多数组织都拥有大量此类应用和平台。工具、服务、运行环境及复杂度的无序扩张—— 即技术蔓延(tech sprawl)—— 已成为切实存在的运营风险与安全挑战。
为了应对不断增加的技术栈复杂性以及企业对财务稳定性和不确定因素的担忧,安全和 IT 领导者正在将平台整合作为战略优先事项。然而,技术栈整合往往比看起来更复杂。多数企业对自身进展迟缓、成效不彰的现状感到不满。团队希望能够快速关停服务,但替换服务往往需要时间。切换成本高昂、兼容性难题、厂商虚假承诺,以及内部团队的产品专业能力与使用偏好等问题,都会让平台整合过程变得更为复杂。
尽管存在这些障碍,技术蔓延也必须解决,而非忽视。技术栈碎片化,直接阻碍 IT 管理者提升效率、增强敏捷性并保障安全运营。此外,企业实际运行的 SaaS 应用数量,往往远超自身认知。
技术栈整合已成为整体现代化建设的核心环节,在企业为 AI 驱动的未来布局之际尤为重要。AI 的兴起使数据质量成为当今企业面临的最紧迫挑战之一。将许多不同的应用整合到更少、更强大的平台以运行关键业务流程,是提高数据质量同时为 AI 集成腾出空间的关键第一步。
为 AI 腾出空间不仅重要,而且不可或缺。这项技术发展速度极快,甚至呈现出自我颠覆的态势,每一次技术革新都以前所未有的速度让过往方案变得过时。深陷技术蔓延困境的企业将发现自己无法利用 AI 的变革性潜力。
2025 年 10 月,Gartner 预测 2026 年全球 IT 支出将超过 6 万亿美元。总体而言,企业正在增加对软件的投资,而集成生成式 AI的软件,更是推动相关支出进一步增长。
这是一条充满挑战的道路:在经济环境不确定、愈发需要证明 SaaS 应用价值的背景下,企业希望进行成本优化。同时,企业的 AI 计划是最大的成本驱动因素。《2026 年 Cloudflare 应用创新报告》发现,72% 的领先组织将预期的预算变化归因于 AI 采用。
臃肿繁杂的技术栈,导致 IT 部门陷入停滞、难以突破。技术堆栈碎片化给 IT 团队和安全团队带来了隐性成本,包括:
安全风险:需要管理的第三方平台越多,安全风险就越高。若员工在多个账号中重复使用密码,凭据泄露风险变得更高。此外,多家供应商有权访问企业的数据。某个供应商员工的失误可能会波及整个合作伙伴生态系统。在这种情况下,您往往只能依赖第三方来 解决问题。
浪费金钱和时间:根据 Forrester 的数据,近四分之三的 IT 决策者表示他们的公司已经超出了其本财年的云预算。各类低效问题不断累积,包括重复许可、闲置账号、被遗忘的过往项目环境,以及架构不合理的工作负载等。
生产力下降:开发人员努力实现冲刺目标和生产周期,安全团队全力保障企业及客户安全。碎片化的技术栈会拖慢两者的速度。他们因上下文切换和浏览复杂的系统而消耗时间和精力,陷入维护任务困境,并可能依赖导致技术债务的编码捷径。
技术蔓延并非一夜之间就出现的,而是经年累月最终形成的。相应的解决方案同样具有长期性与持续性。企业可以通过统一平台整合供应商和工具,从而降低网络安全复杂性、总拥有成本,并减少对员工效率的拖累。
软件整合会带来诸多好处 —— 根据 BCG 的研究,这也正是几乎所有 IT 产品 类别中,绝大多数采购方均已制定整合计划的原因。尽管追求速度,但技术堆栈整合需要时间和深思熟虑的规划。当企业内部使用数百甚至数千个 SaaS 应用时,一次性解决所有问题并不现实。以渐进式的小步骤推进技术栈整合,是更为务实且稳妥的策略。
以有条不紊、妥善规划方式推进的企业通常会取得更大的成功。采取以下行动可以帮助企业合理优化 IT 和网络安全技术栈:
审计您当前的技术栈,以识别冗余和低效问题,并定义整合应实现的明确目标。杂乱无序的技术栈会带来极高的复杂度,导致企业无法充分发挥任何一款工具的效能。与各部门沟通,了解其正在使用的应用及使用方式。对成本、合同期限、用户数量与类型、集成能力等项目进行分类梳理。
我会希望查看应用的 Customer Success 团队如何与我互动。如果他们了解我如何使用他们的产品,就可以提出如何充分利用其产品的建议。理想情况下,您将继与那些将您视为真正伙伴的公司继续合作,并与仅将您视为买家的公司终止合作。
主要优势:识别无关或冗余的工具,企业可以节省成本,将其用于其他优先事项。
实施 边缘模型,例如 安全服务边缘 (SSE) 和 安全访问服务边缘 (SASE) 模型。合适的 SSE 将在一个平台上提供安全 Web 网关、数据丢失防护和 Zero Trust 网络访问等能力。SASE 解决方案将 SSE 的安全功能与网络服务结合起来,形成一个综合性的单栈云平台,同时解决连接性和安全性挑战。
主要优势:通过统一的技术堆栈,IT 团队可以更轻松地监控应用和实施安全标准,提供用户、应用、互联网服务提供商、团队和云实例之间的直接“任意对任意”连接。
利用可扩展、按需计算服务的全球云基础设施,实现更简单的协作和更快的部署。使用云应用平台能有帮助,例如实施 API 优先 的共享服务方法,以提高容错性并提供更多灵活性。当所有人员都使用同一工具时,就充分发挥其协作能力。
主要优势:加快创新速度与产品上市周期,帮助更轻松地按期交付,并为用户提供优质体验。
整合是一项团队工作。您希望其他部门看到他们拥有的每一个 SaaS 应用,从而明确责任,决定哪些应用需要保留,哪些应当移除。从审计与删除、取消订阅,到部署工具与权限分配,明确归属责任可帮助您的团队始终有序推进各项工作。
主要优势:统一技术栈可形成唯一的数据采集与管理可信数据源,同时为合规审计提供有力支持。
简单不等于容易。若您需要渡河,容易的做法是用石块填满河道,然后徒步通过。简单的策略就是建造一座持久、坚固的桥梁。绝大部分技术蔓延问题的产生,是因为企业采用的应用只是容易的问题解决方案,而非简单的方案。
整合需要战略规划。这不是一项可以迅速着手并立即见效的工作。有条不紊的筹备与常态化运营,相比一次性大规模投入,压力更小,成功概率更高。
主要优势:简化运营并优化工作流程(例如减少流程中的工具数量,实现任务自动化或精简冗余任务),可有效降低协作阻力,提升成功率。
这些步骤可以帮助减少技术栈整合的挑战。为了进一步简化过程并避免常见错误,请采取以下行动:
尽管尝试各类工具是有 益的,但您很容易被一时的流行风潮所吸引,耗费大量资源却无法获得实际价值。结合企业自身的具体挑战,思考真正能够助力团队提升的方案。与团队成员沟通,了解当前有效的工作方式与现存问题,您甚至可以亲临工位,观察他们的实际工作。
在过往的工作中,我见过不少员工使用跨多系统的工作流程,需要频繁切换操作、效率低下,这类流程本身就存在先天的低效问题。当您将这类情况纳入整合工作范畴时,自然会剔除这些极不合理的场景。
技术栈整合是一项持续推进的过程。实施它需要一致的跟踪、数据管理和反馈。定期与组织内其他管理者沟通,可获得全新的见解。我建议基础设施、安全与研发团队的负责人定期交流工作要点与关键进展。
消除技术蔓延,首先要明确您当前的基础设施现状,以及在统一网络架构下实现合规基础设施所需达成的目标。随着 AI 技术的不断发展,依托整合式战略,转型过程将变得更为轻松。
Cloudflare 的 全球连通云能够助力 IT 团队更高效地推进平台整合工作。这是一个统一、智能的平台,具备单一网络、单一控制平面与统一管理界面。这些强大能力可提升组织的敏捷性与安全性,同时优化技术栈效率。
完成技术栈整合是通往长期 成功的必经之路。与其被动应对,不如从一开始就掌握控制权。您需要亲身参与,以确定价值所在以及如何最好地释放这些价值。
Cloudflare 就影响当今技术决策者的最新趋势和主题发布了系列文章,本文为其一。
在《企业 AI 安全与扩展指南》电子书中,详细了解 AI 实施的挑战、解决这些挑战的实用策略,以及全球连通云如何提供帮助。
Mike Hamilton — @mikehamilton
首席信息官,Cloudflare
阅读本文后,您将能够了解:
平台整合如何夯实数据质量基础以支持 AI 创新
减少技术蔓延并为 AI 转型提供资金的五个步骤
扩展 AI 与新基础设施时规避常见误区
开始使用
解决方案
支持
合规性
公共利益
公司