像使用“数据库”一样使用“大数据” 华为启动数据基础设施战略

随着5G、AI和云的普及，数据量正以惊人的速度增长，全球数据量将从2018年的33 ZB快速增长到2025年的180 ZB。但是，产生的数据中仅有不到2%被保存，而被保存的数据中仅有不到10%被应用。

如果能像使用“数据库”一样使用“大数据”，那么，数据治理和使用将更简单。11月19日，在2019全球数据基础设施论坛上，华为面向鲲鹏计算产业，宣布全面启动数据基础设施战略，并开源数据虚拟化引擎HetuEngine(河图引擎)。据悉，这是继华为在9月宣布“鲲鹏+昇腾”双引擎的计算战略后，从数据角度对计算战略的再度阐述。据天极网了解，华为数据基础设施战略围绕数据“采-存-算-管-用”的全生命周期，诠释了华为通过提供融合、智能、开放的数据基础设施，使能各行各业客户释放数据价值。

华为Cloud & AI产品与服务总裁侯金龙在大会上发表主题演讲

华为Cloud & AI产品与服务总裁侯金龙在《打造“融合、智能、开放”数据基础设施，携手迈入智能时代》的主题演讲中表示：“人类正迈入万物互联的智能时代，而数据将成为智能世界的关键生产资料。剧增的数据正在改变我们的生产和生活，但也带来找数难、取数难、用数难等挑战。华为面向鲲鹏计算产业，全面启动数据基础设施战略，提供融合、智能、开放的数据基础设施，对数据的采、存、算、管、用实施端到端的整合和优化，致力于让数据在全生命周期内好用，数据的每比特价值最大，每比特成本最优，让合作伙伴像使用’数据库’一样使用‘大数据’。”

数据基础设施三大特征

为实现对数据的采、存、算、管、用实施端到端的整合和优化，让数据在全生命周期内更好用，数据的每比特发挥价值最大，数据的每比特成本最优。华为打造了融合、智能、开放的数据基础设施，华为数据基础设施包括数据存储、数据处理、数据管理系统、数据虚拟化引擎等，它包含以下三大特征：

● 融合：基于在存储、数据库、大数据等技术领域的突破，打破“存储内部系统墙”、“数据库与存储链路墙”、“大数据与存储配置墙”、“数据库与大数据协同墙”四堵墙。这四堵墙的打破，让数据融合更彻底，帮助客户实现TCO降低30%以上、据访问和处理性能提升2倍、分析效率提升100%。

● 智能：基于AI芯片、存储和华为云的三层架构，通过云上云下结合，云上训练和云下推理，让系统越用越快、越用越省。其中，依托昇腾处理器的AI能力，自动学习和识别IO流，提升Cache预取命中率，系统整体性能提升20%;依托鲲鹏处理器的多核算力，根据不同的数据类型，实时优化数据缩减算法，TCO降低25%;结合华为云自身运大规模维运营经验，当前可以实现提前14天预测硬盘故障，提前60天预测性能瓶颈，提前365天预测容量不足，其中30%的故障可以自我修复。

● 开放：针对找数难、取数难、用数难的问题，推出数据虚拟化引擎HetuEngine，屏蔽数据类型差异、地域差异、语法差异，让数据治理、使用简单。HetuEngine拥有“一个入口、一个目录、一份数据、统一安全”四大核心能力，通过屏蔽数据基础设施的复杂度，让伙伴像使用“数据库”一样使用“大数据”，复用现有的生态、工具和技能，提升开发效率2到10倍。

开源数据虚拟化引擎HetuEngine：从“大数据”走向“大数据库”

像使用“数据库”一样使用“大数据” 华为启动数据基础设施战略