“数据科学中最重要的部分是数据整合。因为重要数据资产通常包括客户、项目、供应商和零件,而它们通常在数据孤岛中保存在公司内部的多个地方。”近日,2022中国国际大数据产业博览会(简称“数博会”)以线上方式举办,2014年图灵奖得主迈克尔·斯通布雷克在报告中如是说。
2022年的数博会以“数据创造价值、创新驱动未来”为主题,众多与会专家围绕“抢数字新机 享数字价值”等话题展开交流探讨。
从数据资产中获取价值
迈克尔·斯通布雷克表示,数据整合工作任重道远,要派出类拔萃的人来做。“每个公用数据存储库又被叫做‘数据湖’,如果数据不整合,‘数据湖’就会沦为一个数据泥沼。必须要让精英们集中处理数据整合的问题。”
“建议大部分乃至全部数据都需要迁移上云。”迈克尔·斯通布雷克表示,在迁移上云的过程中,应该清理和整合数据,另外也要重构应用程序,云计算服务将达到最高效率,从而实现“无服务器环境”。
而要实现数据的价值,腾讯公司副总裁、腾讯云总裁邱跃鹏认为需要从海量算力、实时分析、极致传输三方面来实现。
“未来,云服务一定是无处不在、触手可及的。这对算力提出了更高要求,软件与硬件一体成为趋势。” 邱跃鹏表示,腾讯自研的星星海服务器实现整机性能的提升,可靠性翻倍。
此外,海量的非结构化数据,需要实时、智能的分析能力。邱跃鹏表示,通过存储、数据库、大数据技术的融合发展,腾讯云的每日实时计算次数做到了业界前列。“当然,保障海量分析中每一方的数据安全是前提。”
“对传输全链路进行极致优化,才能满足全真互联世界对连接的高要求。” 邱跃鹏认为,这些技术革新,为全真互联奠定了坚实的技术基础。腾讯将持续打磨更高效、易用的数字化工具。
打造坚实数字基盘
“随着5G等新一代信息技术加速普及,新一轮数据浪潮已经到来。”中国移动董事长杨杰在报告中表示,在超大规模数据浪潮的推动下,经济社会数字化转型正在积累从量变到质变的势能。
杨杰表示,数据已经成为驱动经济增长的新要素,一个地区在数据流通和价值转化中所处的位置和发挥的作用,将成为决定其发展潜力的关键因素。同时,大到星球、小到细胞的“数字孪生”正在快速生成,为资源全局优化、趋势精准洞察提供了全新的手段,极大提升了全社会创新的效率和效能。
“海量数据和人工智能、脑机接口等技术的深度结合,将助力人类突破体能、智力极限,推动文明发展迈向更高的水平。”杨杰表示,在这一进程中,孕育了广阔的数字蓝海机遇。
中国联通董事长刘烈宏看来,构建数网云边协同、绿色集约智能的一体化算网基础设施,对数据产业发展至关重要。
“我们为数字政府建设打造坚实数字基盘。” 刘烈宏介绍,中国联通正在打造“时延毫秒级、开通分钟级、自主化管理、服务更安全”的高品质专线,布局承接“东数西算”工程、包括“西算”枢纽节点贵安在内的“5+4+31+X”新型数据中心体系,升级基于4亿用户超大规模云原生实践的联通云,助力数字政府基础设施集约化和互联互通水平不断提升。
为助力构建全国一体化政务大数据体系,中国联通还依托一点集中的大数据平台、技术领先的AI中台、能力统一的“联通链”平台。“旨在推动政府数据‘看得见、管得住、用得好’。” 刘烈宏表示。
而在高速泛在、天地一体方面,中国电信则建成了全球最大的5G SA共建共享网络、最大的千兆光纤网络,是国内唯一的卫星移动通信运营商。
“我们将持续完善陆海空天全域的立体化、广覆盖、高性能网络布局。”中国电信董事长柯瑞文表示,中国电信正在加大科技创新力度,加快推进以云网融合为核心特征的数字信息基础设施建设与升级。
“在云网融合、智能敏捷方面,我们在全球率先推动了云、网、IT的统一运营,实现网络资源按云所需、网络调度随云而动、云网一体化部署。” 柯瑞文介绍,中国电信加强云基础软硬件、云技术底座、云创新服务等关键核心技术攻关,推进天翼云升级到4.0全新阶段,具备分布式、自主可控、安全可信的重要特征,为数字经济发展构筑云网融合的全新数字底座。
加快与AI融合发展
“AI的发展日新月异,数据价值的挖掘还有待与AI融合,例如与机器学习融合。” 迈克尔·斯通布雷克表示。
“机器学习,无论你在研究被称为深度学习的神经网络,还是传统的机器学习,它们都在大幅进步。” 迈克尔·斯通布雷克说,机器学习会对低难度工种造成颠覆性冲击,而其在数据分析、数据整合等方面也非常具有优势。
这一观点也得到了华为高级副总裁、华为云公司总裁张平安的认同。
“数据作为生产要素和重要资产已成为共识,但目前数据治理效率低下,数据的价值并未充分挖掘。”张平安表示,数据是AI发展的基础,但在AI分析过程中,如何随时随地获取最新数据,也是AI开发过程中面临的挑战。
以汽车电池生产工艺优化为例子,这一工艺的优化涉及1000多个制程,开发一个AI模型需要把电池生产线的运行数据、企业经营的业务数据、以及消费者的使用数据等,搬运到一起,需要几周的时间进行数据处理,然后再进行训练,导致AI模型无法快速地验证、快速地迭代。
“如果数据与人工智能融合,AI就可以随时、按需获取全局数据,生成最优模型。”张平安指出,数字和智慧、智能一定要融合,就是数智融合,即数据和人工智能的融合,是数据价值重塑的引擎。
“让AI驱动数据治理,数据自主有序地流向可以产生最大价值的地方;同时,让数据在AI开发过程中无缝流转,AI开发更高效。”张平安建议。
据介绍,目前华为已开发了数智融合云平台,通过打通数据治理和AI开发两条生产线,构建统一的开发环境、统一的元数据管理、统一的存储,让数据开发效率由“周” 级提升到“小时” 级,减少了冗余的存储,减少了无效的数据搬运,那数据存储的成本也降低了50%,让数据和AI开发进入现代化的生产阶段。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。