作为唯一一家为所有地点的数据提供 AI 的企业,Cloudera 株式会社(所在地:东京都中央区,社长运行役员 山贺裕二)在日本企业迎接新年度,IT 策略和业务连续性计划正在重新审视之际,发表了关于确保在发生故障时也能维持业务连续性的「数据韧性设计」重要性的建议。 许多日本企业以 4 月开始的会计年度为起点,制定和更新中期经营计划和投资方针,近年来随着 IT 投资的扩大,已进入质疑其「品质」的阶段。不仅仅是数字化和云端迁移,企业对基于业务中断风险的 IT 基础设施重新设计,以及跨多个环境灵活运用数据的兴趣日益浓厚,IT 的定位已从成本转变为经营基础。在这种情况下,企业不仅仅依赖于「不让系统停止」,更需要一种在发生故障时也能持续经营的设计理念。 Cloudera 解决方案工程经理吉田荣信表示:「云端服务和内核系统的故障已不再是例外事件。事实上,近几年来,大规模云端基础设施停机和 SaaS 故障已影响了许多企业活动。这些故障再次揭示了 IT 应用的一个现实:无论系统设计多么精巧,都无法完全避免停机和服务中断。」 「包括硬件故障、软件缺陷、人为错误、自然灾害,甚至地缘政治风险在内,围绕 IT 系统的不确定性逐年增加。事实上,根据微软的《Microsoft Digital Defense Report 2025》,日本在网络威胁暴露程度方面位居全球第 7 位,在亚太地区则处于最高水准。此外,根据 PwC Japan 的《2025 年网络智商调查》,40% 的高端主管认为来自俄罗斯、中国、北韩等国的网络攻击和网络恐怖主义是最重要的风险,这已是连续第三年。」 在这种情况下,企业不仅被要求「预防故障」,更要以「假设故障会发生,如何不中断业务」的视角来思考。其关键在于以数据韧性为前提的架构设计。 **什么是数据韧性** 数据韧性是指组织在发生与数据相关的故障或问题时,能够将其影响降至最低、迅速恢复并持续营运的能力。这不仅仅意味着备份或灾难恢复机制。 具体而言,以下三个观点至关重要: * **可用性(Availability):** 确保用户和应用程序在需要时能够访问数据。关键在于如何缩短恢复时间目标(RTO)。 * **完整性・准确性(Integrity):** 维持数据未受损坏或篡改的状态。需要设计以最小化恢复点目标(RPO)。 * **安全性(Security):** 这是为了保护数据免受未经授权的访问、遗失或盗窃而实施的控制和治理。 为了持续满足这些要求,数据基础设施本身必须以「永不停止」为前提进行设计。 **设计的内核是「不产生单点故障」** 有些企业系统采用了依赖特定云端、特定区域或单一数据中心的配置。在这种配置下,如果发生影响基础设施本身的故障,切换的选择将受到限制,这将成为单点故障,最终可能影响业务连续性。故障可能由硬件故障、软件缺陷、人为错误、自然灾害、网络攻击等多种因素引起,其发生地点和原因无法完全预测。 韧性设计的目的是,即使其中一个环境无法使用,也能在另一个环境中继续业务。考虑到跨云端区域、跨云端供应商,甚至切换到本地环境,以「随时随地可切换」为前提进行设计至关重要。 故障的发生地点和原因无法完全预测。正因为如此,不依赖特定地点或基础设施的数据和系统持有方式,将极大地影响业务连续性。 **仅靠技术是不够的,关键在于「流程」** 在谈论韧性时,另一个常被忽视的重点是流程的重要性。无论导入多么先进的技术,如果灾难恢复或故障转移计划形同虚设,就毫无意义。 灾难恢复计划一旦制定,却未随组织体制或系统配置的变化而更新的情况屡见不鲜。真正有效的计划不仅要文档化,还需要定期验证,并通过训练和演习来确认其可行性。 在实务上,以下观点至关重要: * **工作负载的优先级排序** 明确定义不允许业务中断的系统,例如交易处理和医疗数据监控,并定义 RTO 和 RPO。 * **确保冗余和高可用性** 创建可在不同环境之间切换的配置,以确保在发生故障时业务能够持续。 * **备份和治理** 不仅是数据,还包括元数据、访问控制和策略,都必须纳入保护范围。 **日本独特的环境要求「全方位」的准备** 在日本考虑韧性时,无法回避的是日益严峻的自然灾害风险。在预测首都直下型地震和南海海沟巨大地震等大规模灾害的情况下,仅在单一区域内进行冗余是不够的,利用东西区域以及结合云端和本地环境的真正地理分散是不可或缺的。 此外,许多日本企业面临的「旧有系统的维护和营运」也成为韧性中隐藏的脆弱性。在旧的架构中,在保持数据完整性的同时进行快速切换往往很困难,这成为业务连续性的瓶颈。再者,尽管「经济安全保障推进法」的制度整备已告一段落,但它仍然是企业经营的重要前提条件,确保数据所在地和供应链的透明度,也是现代日本企业所需数据韧性的重要面向。 **地缘政治风险揭示的现实: