记者 | 陆柯言
11月19日,在华为2019全球数据基础设施论坛上,华为宣布面向鲲鹏计算产业全面启动数据基础设施战略,并开源数据虚拟化引擎HetuEngine(河图引擎)。
两个月前,华为公布了其在智能计算业务上的产业布局——一云两翼双引擎+开放生态。其中“一云”指华为云,两翼指智能计算、智能数据与存储两大业务,双引擎则是鲲鹏和昇腾两个系列的处理器。华为在当时表示,目标是“为世界提供最强算力”,此次战略发布可视为对前次战略的进一步阐述。
算力被视为智能时代的新生产力,而产生算力的基础生产资料则是数据。技术的革新带来自动驾驶、4K/8K视频、AR/VR、物联网等应用的兴起,同时也为企业带来大量的数据增长和分析处理需求,但需求与数据资源供给之间仍然存在着巨大落差。
比如,未来每辆自动驾驶汽车每天就会产生高达64 TB数据;在智慧安防领域,深圳一个城市有超过200万摄像头,每天将产生80 PB数据,平均可保存30天,但从城市治理角度来说,保存时间显然是越长越好。根据IDC预测,全球数据量将从2018年的33 ZB快速增长到2025年的175 ZB。但是,产生的数据中仅有不到2%被保存,而被保存的数据中仅有不到10%被应用。
华为Cloud & AI产品与服务总裁侯金龙表示,这些海量数据的增长背后需要海量存储和计算的资源,虽然数据增长是无限的,而存储资源却是有限的。华为宣布此项战略的目的是,想要通过数据基础设施,来对数据的采、存、算、管、用实施端到端的整合和优化,让数据的每比特发挥价值最大、成本最优。
侯金龙介绍道,华为数据基础设施包括数据存储、数据处理、数据管理系统、数据虚拟化引擎等方面。它具有融合、智能、和开放三大特征。他表示,华为数据基础设施能够打破存储内部系统墙,同时依托曻腾处理器的AI能力和鲲鹏处理器的多核算力,能够帮助客户实现TCO(总拥有成本)降低30%以上、访问和处理性能提升2倍、分析效率提升100%。
针对企业“找数难、取数难、用数难”的问题,华为同步推出了数据虚拟化引擎HetuEngine。据华为官方介绍,该引擎能够屏蔽数据类型差异、地域差异、语法差异,降低数据治理和使用的困难。侯金龙称,通过屏蔽数据基础设施的复杂度,希望让合作伙伴伙伴像使用“数据库”一样使用“大数据”,提升开发效率2到10倍。
HetuEngine引擎也在今日正式宣布开源,开源的版本openHetu将在2020年6月上线。华为将开源内核,开发者可以基于开源代码进行定制,包括数据源扩展、SQL执行策略等,实现应用快速对接,提升开发效率。
华为轮值董事长徐直军曾表示,华为计划在未来五年内投资30亿元人民币来发展鲲鹏产业生态。这其中包括对板卡、服务器、OS、数据库、数据基础设施等关键技术和产品的投资。随着细分战略逐一揭开面纱,可以想见的是,在智能计算产业,华为的脚步将变得越来越快。
评论