摘要:数据备份技术有着丰富的内涵,IT人员把数据备份仅仅用作数据灾难的恢复,这是一个长久以来的错误认知。做数据备份本身没有错,认为备份数据只用来恢复就大错特错了。
当我们谈到数字化转型的时候,备份恢复显然不能走进数字化时代。拷贝数据管理CDM 作为一种数字化技术,第一步是要终结备份恢复,之后开启在数字化时代的进化历程。
今天,i黑马&数字观察独家获悉,近日, 云信达科技宣布完成亿元B轮融资,本次融资由SIG海纳亚洲领投,南京高新创投、中南投资跟投,在持股东联想创投继续跟投。
云信达科技CEO张兵表示, 本轮融资将大多数都用在CDM研发技术,立足于信息产业创新生态,打造世界级水准的CDM产品。
同时,将重点聚焦于金融、运营商、高端制造、能源、政府五大行业的大规模的公司,加快扩展高端企业市场,以数据驱动推动行业数字化转型。
云信达是i黑马&数字观察独家挖掘并且持续追踪的一家云数据管理企业。云信达成立于2015年,创始小组成员均来自全球领先的数据管理企业。
创始人张兵毕业于南京大学物理系,曾在赛门铁克软件公司任职上海分公司总经理,他在数据管理领域对产品技术架构、市场营销和团队管理有深刻理解。
“面向数字化转型的信息技术应用创新,绝不是导致消费降级的替代,传统数据备份的规划和建设模式不应再持续,CDM实现数据资产全生命周期管理,以拷贝作为数据的共性连接企业稳、敏双态IT各能力域,提升企业数据连接应用的体验,加速企业数字化转型。”张兵告诉i黑马&数字观察。
我们知道,随着计算机技术,传感器技术和网络技术的发展,人类的数据总量已达到了前所未有的规模。数据充斥着每个人的日常生活,企业每天都面临着管理数据及使用数据的挑战。
尤其是,在数字化转型的今天, 企业希望借助大数据、云计算、人工智能等技术减轻企业IT 工作量并提高业务敏捷性,降低经常性成本。
企业希望充分的利用云优势,从企业丰富的数据中获取商业洞察,提升公司在行业中的竞争力。其次,希望能够通过提高数据驱动力,推进企业变革,实现现代智能化对企业提出了更高要求。
目前,存储数据的载体、数据的处理技术和数据的使用的方式方法都在不断的演进,企业用户对数据价值的预期也不断增加。
这时候,企业用户期望通过数据快速带来商业经济价值,他们盼望能够准确洞察自身所拥有的数据,预测需求,减少成本并降低风险。同时对数据的安全,数据隐私与合规等要求越来越高。
在张兵看来, 当企业的数据成为核心生产要素之后,这一些数据就会在企业的业务平台内部实现一个闭环,这时候就需要有一个数据系统来管理这一些数据,把这一些数据进行保护、收集、存储、定位。
但根据2018年,IDC发布的调研多个方面数据显示,超过70%的企业CIO 对现有备份系统不满,Gartner也有报告数据显示,50%的企业计划在2020年前后升级或更换备份系统。
i黑马&数字观察了解到,传统观念来看,很多企业认为数据保护主要就是备份。其实,备份在企业数据管理战略当中很重要,备份是核心基础。
例如,金融行业对数据备份有着严格的规定与监管,金融系统的原生数据,包括数据发生逻辑变化的时间变量,全都被忠实地记录在数据备份系统。
在许多企业管理的人看来, 备份是一种纯粹的资源消耗,很多企业选择备份系统,通常是为了应对行业监督管理需求。
换言之,假如没有监管合规要求,很多企业可能就不会有那么强的动力构建备份系统了,因为投资备份系统并不能带来直接的业务价值。
在这种情况下,企业的备份系统大多都像是一个摆设,因为企业是需要出示数据备份和恢复的有效性证明。但实际上,很多时候企业并没有条件做有效性验证。一种原因是因为传统备份技术的数据恢复难度大,操作麻烦,备份窗口长,费时费力。
另一方面还要大量投入购置新的存储设备做验证,新购置的存储设备日常都处于闲置状态,这种浪费在企业看来是不可接受的,真实的情况是:备份验证系统很可能会被业务系统征用。
坦白说,除了备份之外,企业还需要仔细考虑其他问题,例如,创建面向未来的复制数据管理战略、云战略和区别化。
第一,在传统的数据管理模式中,企业的数据都是烟囱式的存放在企业的业务系统里,没有很好的方法直接管理这一些数据。而且,外围的管理系统可能不适合非间接接触生产系统的数据,会影响一级主存储的管理。
第二,公司制作系统产生的数据,出于动态的交易逻辑中,数据会一直变化。在这样情况下,我们只可以掌握数据的当前状况,无法分析它的既有状况。历史数据拿不到,而生产系统又是烟囱式的,这样很难进行相对有效的数据管理。
以前,很多用户可能从没有留意过数据副本,数据产生后“随手”做一个副本,这似乎是司空见惯的事,没有人会问为什么。
但是,当数据副本“泛滥”,让存储空间捉襟见肘,让数据管理变得异常麻烦,而且为企业增加了成本负担,企业对于数据副本的管理就再也不能睁一只眼闭一只眼了。”
张兵告诉i黑马&数字观察, 数据管理在管理和技术部分都遇到很多难题和弊端,势必会给企业后续数据业务开始带来一系列的负面反应。
例如,数据备份恢复验证困难,数据副本的使用和流转受限,数据副本“泛滥”浪费存储空间,导致花了高代价的备份系统在平时难以显现其价值。同时,海量的备份数据平时不用、沉默在那占用存储空间,成为“暗数据”。
当前,企业用于承载关键业务的存储即主存储,只是冰山一角,承载企业碎片数据、低效数据,暗数据的第二存储占有企业存储使用量的80%以上,大多数都用在备份、归档、分析、开发/测试、文档共享、上云等场景。
这里提的主存储是,企业维持基本生产运行所需要的核心生产系统,或是说在线交易系统,如ERP、电子商务系统或者其他营业产生的交易性、生产性的数据。
主存储对性能和业务连续性的要求在企业所有IT 场景中是最高的,对成本也是最不敏感的。可是企业真正的主存储占比很低(不到20%),在稳定压倒一切的追求之下,与新兴技术几乎绝缘。
值得一提的,在生产系统产生一级数据时候,伴随还会产生二级数据,就是在2019年,Gartner正式定义第二存储,也就是我们所说的云数据管理CDM。
i黑马&数字观察了解到,2016年Gartner发布的《创新洞察力:CDM技术加速双态IT》报告,其中明确了CDM的定义和使用场景,CDM被认为是一项具有长久生命力的技术。
Gartner给出的CDM定义是:它从生产环境通过快照技术获取有应用一致性保证的数据,在非生产存储上生成“黄金副本”,这个“黄金副本”数据格式是原始的磁盘格式,可再虚拟化成多个副本直接挂载给服务器,分别用于备份恢复、容灾或开发测试等场景。
张兵指出,根据Gartner的定义,CDM具备三个基本特征: 一、原格式拷贝;二、黄金副本;三、虚拟副本服务。
首先,原格式拷贝迭代了传统备份技术用到的备份集方式,通过原格式拷贝能够获得数据的“黄金副本”,黄金副本可见可用,而备份集却只可以通过费时费力费钱的再存储过程(restore)才能打开。
原格式和黄金副本颠覆了传统备份的“备份集”,盘活“暗数据”,是即将开启的备份技术革命。从备份的角度来看,CDM是一种备份新技术,是对传统备份的技术革命。
其次,CDM管理着生产数据的新鲜副本的总集,并且是“原生的”,具备天然的资产属性。在多个国家,备份数据的这个属性被用来作为客观证据。这使得CDM成为一个从业务系统中抽离的数据资产集散地,一个副本数据资源中心,自然而然成为企业理想的副本数据管理平台。
第三,虚拟副本服务是造就CDM新高度和未来走向的关键特征。如果说“原格式”和“黄金副本”的出现是备份革命,那还只是停留在数据保护基础设施的范畴。
数据的可见可用是通过虚拟化的方式(Virtual Copy)呈现,拷贝(副本)可以被无限虚拟,生成N个副本挂载(live mount)给不同的应用场景。云计算环境可以对虚拟副本进行自动化的管理和编排,以服务的形式连接并赋能应用。
对IT元素进行虚拟化处理变成一种服务是云计算的基本特征,于是,CDM从数据保护基础设施演变为云数据基础设施,从单纯的运维工具演变为业务平台,从信息化基础设施演变为数字化基础设施。
CDM集上述三个特征于一体,拉通数据保护、数据管理和数据服务,既有数据保护的稳重,又有数据服务的敏捷,是稳态IT和敏态IT的交集和纽带(Gartner:CDM加速双态IT)。CDM的另一个新名字——云数据管理(Cloud Data Management)就是对CDM成为未来云数据基础设施的预言。
总的来说,CDM是企业副本存储管理平台,是企业数据管理的核心枢纽平台。CDM管理着企业第二存储从数据获取、存放、服务的全生命周期流程。而如何通过CDM获取数据、存放数据、提供数据服务,也是这样的领域的很重要的门槛。
首先,CDM需要帮企业把一级生产系统数据拿下来,用更高级备份方式,拿到原格式的数据,知道数据从哪里来的、什么版本、放在哪里。
其次,以工业互联网为例,当企业大量非结构化的数据进到数据管理平台后,如果传统的备份一体机不具备可扩展的存储能力话,平台是没办法存放和管理海量的第二存储数据。
也就是说CDM第二个门槛是,它的新型数据管理架构具有无限扩展的分布式云存储扩展能力,可以承载企业的海量数据,并且有效进行管理。
第三,CDM可以像开水龙头或者开电闸门一样,帮助客户快速提取数据,收回数据,还可以记录数据使用全过程等服务。”
“CDM之所以引起Gartner的重视,是因为它给出了数量庞大的复制数据的妥善处理方法,从提升数据安全性、简化管理、减少相关成本的方面出发,企业要一个更高效、更安全的数据管理工具,它就是CDM。
CDM 是随企业数据资产这一IT发展大趋势而衍生的企业数据管理新形态,不能对应于传统的“存储”或“备份”的概念。
CDM 数据管理平台是企业数据管理的新形式,其用途仍然在演变,预期会产生新的突破,对企业数据管理提供全新的思维。”
针对上述思考,云信达要做的事情是,专注于数据管理底层技术的研发,利用CDM技术帮企业客户实现数据现代化管理,构建面向未来的数据基础设施,在数字化转型过程中拥有竞争优势。
通过CDM盘活企业暗数据,端到端实现了数据保护、数据管理、数据服务的流动数据引擎技术,实现数据资产全生命周期周期管理,进而帮企业挖掘数据的线
张兵告诉i黑马&数字观察, 随着CDM技术进入中国,并且与中国的具体国情结合,越来越呈现其本土化的落地的特征。
随着企业数据中心从IOE向x86转型、开源社区蒸蒸日上,存储技术和壁垒迅速拉低。从软件开源化到技术扁平化,再到产业碎片化,科技转型正是以这样的发展的新趋势拉开帷幕。软件定义存储商机无限,初创公司能够有所作为且正当其时。
2016年Gartner首次定义CDM,作为一项新技术从备份软件领域进行独立研究,在对CDM新技术的内核做了深入研究和沟通之后,张兵坚定了以创新技术做一家数据管理领导者为目标进行创业的决心。
云信达是国内早期以CDM为核心技术进行创业的公司,目前也是国内CDM赛道上研发实力、产品成熟度、客户认可度最为突出的一家勇于探索商业模式的公司。张兵介绍到:“我们对标的是两家美国独角兽企业(Rubrik和Cohesity),从传统备份到云数据管理,我们是自我革命,也是要实现行业革命。”
张兵解释道,我们积累很多数据保护、数据存储行业经验,我们把这些经验用在了数据管理产品身上,同时加上团队数十年的数据管理经验,力图拉通高端IT领域和新兴DT领域,成为企业数据管理的核心枢纽,解决企业“云化”转型的痛点。
这样能够在一定程度上帮助企业客户轻松建立更加“弹性、敏捷、可靠”的云数据管理架构,为云时代的企业数据管理提供有力的支撑和坚实的保障。
为此,云信达推出了eCloud Data Master云数据管理平台产品,将现代化备份、高性能存储、云数据管理技术融为一炉,同时采用自主创新的复制数据虚拟化技术,协助企业构建二级存储数据服务平台,促进企业数据管理现代化。
云信达eCloud Data Master云数据管理平台横跨数据中心与多云平台,是兼容多种云环境的数据管理基础设施,适用于研发测试、合规审计、查询检索、归档容灾多个场景,助力企业上云。
张兵介绍,eCloud Data Master是为企业用户提供高效数据管理平台产品。首先,平台CDM技术针对存储空间进行指针式快照,产生一份“黄金副本”,通过副本虚拟化技术,同时生成多个虚拟副本数据。
其次,平台利用增量备份技术,每次只备份变化的数据块;采用虚拟合成技术生成逻辑副本。逻辑副本不占用存储空间,可见可用,大大的降低了企业的运营成本。
同时,平台通过CDM以原有格式抓取数据,可实现备份数据的即刻拉起,极大降低恢复时间,保障分钟级RTO,保障了数据的高可靠、高可用。
“CDM云数据管理平台就是基于复制数据管理的一套新型架构,企业可基于此架构建立一个全新的数据管理平台,统一管理数据中心和云端、结构化和非结构化的数据。企业利用CDM平台,可以统一管理企业各类应用的数据使用和流转,协同数据中心、私有云与公有云之间的数据流通,快速高效构建应用环境并使用数据。”
随着2020年,由于疫情的爆发,促使全球的经济进入各种不确定性,同时,随着中国新基建、信创等趋势下,加速了中国的政企进行数字化转型,同时这些企业也开始尝试国产化的软件产品,推动企业开始更换传统的IT基础架构,与其相关的底层备份产品也会要开始替换,给CDM技术的发展与落地带来很多新的机会,这是从被动因素来看推动产业的发展。
从主动因素来看,越来越多的传统企业面对数字化转型的压力,他们开始有意识进行数字化转型,也开始清楚企业的数据资产对其的重要性。
例如银行、运营商领域,自身技术能力强,需求旺盛,意识也强,就会主动根据自身的需求,去替换备份系统产品,进而带动CDM的发展。
再从另一个因素来看,i黑马&数字观察了解到,随着互联网等新技术的应用,技术创新带来了企业业务形态的变化,企业信息化建设迫切需要合理的IT整体规划。
在此情况下,企业开始尝试双态IT架构,确保企业IT部门实现稳、敏“双态”业务的IT 精确匹配,提升企业IT贡献率,降低企业运营风险,最终使企业数字化转型的顺利实现。
简单来说,双态IT架构主要聚焦于企业业务的稳、敏分立,帮企业IT 部门采用传统的集中式和新兴的互联网分布式等信息技术架构,构建一套稳态、敏态和谐共存的新型IT 架构。
而在这种IT架构的趋势下, 企业的副本管理需求发生了新的变化,也带动了中国的CDM副本管理技术的发展,与之相关的需求逐步显现出来。
在双态IT架构的驱动下,企业的IT部门演变成两个职能部门,一个稳态IT部门,主要负责企业的生存的基本业务部门,帮助通过IT能力,让公司的基础业务正常运转。
另一个部门是敏态IT部门,这部分是主要帮企业通过数字化的能力,去尝试创新业务,助力企业数字化转型的部分。
以金融行业为例,金融IT是典型的双态IT架构(稳态和敏态),显然,如果将决定生死存续成熟稳定的核心业务平台拆掉,单靠装入灵活的中台是与银行初衷与风控原则相悖的。
中台是典型的敏态架构,是金融企业的业务平台之一。对一个敏捷业务平台赋予数据资产管理职能显然是“小马拉大车”,目前的数字技术已提供了既坚守银行风险管理底线又同时支持灵活创新的两全可能。
既然数字化转型是需要把数据管理职能从业务单元中抽离出来,那么数据的管理范畴也需要从业务范畴中抽离出来。数据中台和大数据都不是数据资产平台,属于典型的业务范畴,但是很容易成为认知误区,而这样的误区往往会直接导致数据治理走上弯路。
现实中被误导的例子时有发生。比如,自从阿里提出数据中台的概念,一些企业跟风向往。如果说,数据中台更偏重流程型业务,大数据更偏重分析型业务,那么,它们整合数据的业务目的显然大于资产管理目的。
大数据平台和数据仓库都是以决策支持为目的建造的,通过应用数学模型和算法,揭示数据在更大时空、更多维度、更广泛主题所呈现的规律,用于辅助决策;基于算力和方法,高速处理海量数据,直接驱动流程和业务。
总之,大数据是面向复杂决策支持的数据业务平台,为了适应业务模型和运算的方便,数据可能会变形或转换,从而失去了原生性,导致数据的资产属性丧失。
而中台是典型的敏态架构,是金融企业的业务平台之一。对一个敏捷业务平台赋予数据资产管理职能显然是“小马拉大车”,目前的数字技术已提供了既坚守银行风险管理底线又同时支持灵活创新的两全可能。
这时候就需要把双态IT的稳态和敏态进行打通,而不是割裂开来,各自为政,就需把企业的副本数据复制下来,然后迁移到第二存储里,再通过敏态的架构,方便企业更灵活的获取、迁移、管理副本数据,进而可以推动业务的创新,这时候CDM技术就发挥了及其重要的作用。”
值得一提的是,Gartner的报告中也提到了,CDM技术是打通双态IT的端到端技术,CDM加速双态IT。同时,Gartner也曾在报告中指出CDM是给DevOps赋能的。
其实,可以这样理解,CDM作为新兴力量在国内崛起,一是国内用户对国产备份技术的需求增高,但本质上还是新技术带来的解决问题的能力及未来创造可持续价值的能力。
作为一项新的数据备份技术,CDM突破了传统的数据备份范畴,通过DevOps赋能激活行业里存量的数据资产,创造可持续的新价值。这正是创新的意义所在。
同时,张兵告诉i黑马&数字观察,在信息化时代,企业从单个信息系统的建立,到逐步形成庞大的互联网数据中心,信息系统帮企业完成了信息化转型,实现了人通过信息系统的协作。因此,信息化时代的特点是:应用连接人。
进入数字化时代,各种类型的企业应用(Apps)如雨后春笋般生长出来,充斥着每个人的终端屏幕。而应用是围绕着数据展开的,正如Gartner在描述最新的数据技术趋势时采用的下面的一张图:从采集数据到连接应用,企业已经进入数据连接应用的时代。
数据成为企业最核心的生产要素(而非应用),怎样解决企业数据连接应用的问题将成为企业数字化转型的核心问题。
数据的形态结构千变万化,没有常形,描述数据且与形态结构无关的手段是拷贝(Copy动词),拷贝(Copy名词)是各种异构数据的共性。
数据产生和变化的源头是生产交易系统,计算机处理数据的交易逻辑(随机增、删、改、查)和管理逻辑(批量统计、检索、格式化、标签化)差异巨大,必须分开,记录数据产生和变化的拷贝数据(副本)成为处理数据管理逻辑的理想目标。
经过“清洗数据”形成的分析型数据管理平台(数据仓库、大数据或数据中台)不符合法律上的“可解释性原则”,失去了合规属性。从合规的角度,“拷贝”优于“清洗”。
“我们知道,拷贝数据泛滥已经成为不争的事实,Gartner推出 “第二存储(Secondary Storage)” 新概念正是把“企业使用二级数据和应用像使用智能手机一样简化”作为美好愿景。
我认为第二存储的概念太硬,拷贝操作系统COS(Copy Operating System)是构筑副本数据管理(Copy Data Management)的软件平台。CDM(包含第二存储和拷贝操作系统)将为企业实现数据连接应用、加速数字化转型提供数据管理底座。”张兵解释道。
简单来说,云信达定义的COS能这样理解,以副本数据为连接标准,帮企业客户建立一个协作平台,打通组织内部的数据资产管理和敏捷数据服务。在稳态系统通过数据保护得到全生命周期的原始数据资产,呈现给数据管理部门方便进行可视化管控,业务开发部门可以从平台上合规地、敏捷地取得数据,使用数据。
在谈到云信达构筑COS副本数据管理的软件平台的难点和挑战时候,张兵坦言的告诉i黑马&数字观察,在整个IT基础架构里最难的是底层的相关设备,基础设施,例如网络、存储、以及基础的IT技术语言等。不仅在中国,这部分在全球都是TOB企业要面临的挑战。
“以基础的IT技术语言,这部分在全球都是断档,所以各大TOB企业在相关招聘上面临很大的挑战,云信达在这方面也遇到很多困难,所以,经过探索发现,我们该通过校园招聘的形式,提前培养和储备这类人才。
因为,云信达做的是面向未来技术,面向未来的产品,所以要围绕客户的业务逻辑,客户的真实需求,抽出我们底层技术逻辑,底层的产品能力,以及服务客户评判标准,要按照这种思维去培养和储备技术人才。所以,云信达一方面从大厂挖掘优秀的技术人才,一方面通过校招的方式,培养相关的人才。”
基于上述逻辑,云信达打造一个eCloud Data Master云数据管理平台产品,将现代化备份、高性能存储、云数据管理技术融为一炉,同时采用自主创新的复制数据虚拟化技术,协助企业构建副本据服务管理平台,实现数据资产全生命周期管理,提升企业数据连接应用的体验,加速企业数字化转型。
云信达围绕“数据保护、数据管理、数据服务”三位一体的数据管理理念,以副本数据作为连接标准,建立一个协作平台,打通组织内部的数据资产管理和敏捷数据服务。目前,云信达已成功覆盖政府、运营商、银行、证券、电力、航空等多个行业,获得良好的实践效果。交通银行总行数据中心、广东农信、北京银行、中国联通、中国移动等都是云信达服务的客户。
以北京银行为例,北京银行的传统备份方式数据验证工作量大、过程复杂、资源消耗大而造成的备份验证、演练环节薄弱。
随着整个IT建设的步伐加速,金融科技赋能要求升级,对数据应用服务的效率要求更高,传统备份方式已不足以满足需求。
北京银行通过云信达CDM构建端到端数据管理系统,替代传统的Commvault备份体系。
云信达的CDM通过永久增量备份功能,第一天全备份,以后每天做永久增量合成备份,大幅度缩短备份周期,减少网络数据的传输,同时异地数据中心通过CDM快速挂载,实现恢复演练的常态化。
同时,北京银行通过云信达CDM原格式副本数据,无需恢复可直接挂载拉起,RTO由原来的天级缩短至分钟级,实现备份验证、恢复演练常态化。
此外,通过虚拟副本服务,将副本数据快速分发,用于开发、测试、审计、查询等业务,系统使用,即提高数据副本使用效率,又降低客户二级存储投入成本。
i黑马&数字观察了解到,CDM最早的落地场景在金融行业,云信达也是从金融行业起家,然后拓展到能源、运营商等领域。那么,CDM最适合的落地行业是哪些呢?云信达的行业布局是怎样?
张兵指出,各行各业都需要数字化的转型升级,但云信达也要根据产业底层逻辑、客户的业务情况、以及云信达本身的基因等角度,来分析我们的客户定位打法。如果初期判断不了,就以企业客户单笔数据价值最大的逻辑,对数据价值依赖强的行业来评判,作为客户的定位标准。
也就是说, 对数据价值依赖高的行业,对CDM这种新兴技术的需求就强烈,更容易有适配的场景,推动CDM的落地。
为此,云信达的客户定位聚焦金融、高端制造、运营商、能源为代表的泛制造业等行业,这一些行业的共同特征是企业的共同数据量大、数据价值高、对数字化依赖程度大。
业内有一句话说道,一项有生命的技术,一项能够落地的技术,一端链接产业的过去,另一端链接产业的未来。
对于CDM两端链接什么,张兵解释道,Gartner认为from collect to connect数据技术是行业未来的趋势。大体的意思是,在信息化时代是应用联结人,人通过应用(ERP、OA)协作。
而在数字化时代是数据联结应用(app),公司数众多的app通过数据协作,数据以copy的形式在求稳、求敏和组织协调的能力域之间可信地、敏捷地流转,加速数字化转型。
简单来说,CDM就是链接企业的二级数据和应用,让企业使用数据和管理数据像智能手机一样简化。