由北京市通州区人民政府指导,《财经》杂志、财经网、《财经智库》主办的“《财经》年会2025:预测与战略暨2024全球财富管理论坛”12月13日至15日在北京举行。
当前世界经济格局正在经历剧变,其中一个非常重要的变化,就是新一轮科技革命和产业变革蓬勃发展。此次《财经》年会上,“人工智能”就成为高频词之一。
中国工程院院士、中国工程院原副院长邬贺铨在以“构建可信数据空间 赋能经济发展引擎”为主题的主旨演讲中,围绕数据要素在推动高质量发展中的关键作用,深入探讨了人工智能、数据基础设施、数据资源管理与应用等多个话题。
年内开发出智能体是一大重要进展
邬贺铨介绍,现在人工智能很热,基础大模型经过一两年的发展已向场景大模型和行业大模型转变,而且是从单媒体到多媒体,从训练到推理。大模型本身具有大脑的思维,但它还不能分解任务。
邬贺铨认为,从今年开始,一个重要的进展是智能体的开发。
邬贺铨表示,智能体是一种可以接受自然语言命令,可以跟环境互动并且具有初步思维链的软件,可以将大模型的知识转化成感悟。通常智能体是跟场景一一对应的,如果大模型相当于智能手机的操作系统,那么智能体就相当于手机里头的APP Store,我们的手机仅有操作系统并不显示出它的功能,需要装载一个一个APP才能使它应用。
邬贺铨强调,把智能体的软件装入物理实体上,加上感知功能成为具身智能。人形机器人就是一种具身智能,去年一年人形机器人的关键成本下降了40%,所以马斯克预言未来1万美元就可以,并且他认为只要价格下来成本下来,未来人形机器人的数量要超过全球的人口数。
引入可信数据空间 解决数据不足困境
邬贺铨介绍,人工智能的发展对于大数据算力算法提出要求,其中数据是个关键。作为全球工业门类齐全、拥有最大工业数据的国家,中国理论上拥有很多工业数据,但实际上可利用的工业数据很少。这背后是许多大企业拥有数据,自己不会开发,但担心数据泄露又不愿意分享,小企业更是本身没有充足数据等现实矛盾。
针对如何解决上述困境,邬贺铨建议引入可信数据空间。可信数据空间是解决数据融合和数据安全问题的有效方法,支持跨境数据管理,提供数据源的认证、接入者身份认证、数据目录检索、敏感数据过滤、格式转换等功能。
邬贺铨介绍,数据提供方将数据接入可信数据空间后,可对数据进行加密,使用方使用密钥对数据进行解密计算,计算后的结果将反馈给数据提供方。在可信数据空间里,数据不出域且数据可用不可见。
“同时,在可信数据空间内,有大量可以共享的基础零部件数据,相当于工业淘宝平台,提供方可以将自身标准零部件送上来,需求方可以进行选取,并进行优化设计,能够大大降低了设计成本,提升效率。”邬贺铨表示。
邬贺铨表示,在数据出境过程中,境外的数据使用方需要遵守数据不得挪用等规则。构建可信数据空间可对境外数据使用方出现挪用数据等违规的行为时进行快速处理。原因在于可信数据空间具有加密特性,合作方遵守规则的时候可以使用密钥解密。一旦合作方违反规则,境内的数据提供方可以远距离遥控改变密钥,实现数据的长臂管辖,保证数据出境合规性。
此外,邬贺铨还提到,一般的语言数据图象数据标注相对简单,但工业的数据跟工业的流程、工业的知识是相关的,需要工业的专家,这样成本又太高了,所以现在要研究怎么利用人工智能的方法来标注数据。
邬贺铨建议,在数据标注方面,应探索运用人工智能技术辅助数据标注,提高标注效率和准确性。同时,对人工智能生成的数据进行水印标记,以提升数据来源的可追溯性和可信度。其次,在公共数据开放与隐私保护方面,政府掌握大量数据资源但开放共享时需要进行去标识化处理,以保障个人隐私。对于跨境数据流动,则需实现匿名化以防止用户敏感信息泄露。此外,还应限制对数据的非法访问,通过IPv6等技术手段实现路径溯源和数据流动的可控。
数据基础设施的建设与升级
数据基础设施是数字基础设施的重要组成部分,对于推动数据要素的高质量发展具有关键作用。邬贺铨指出,随着数据的爆发式增长,传统的网络设施已难以满足数据流通和利用的需求。因此,必须加快数据基础设施的建设和升级,包括算力设施、数据流通利用设施等。
在算力设施方面,邬贺铨强调,随着云边端协同和异构算力的发展,算力、存力、运力和网络资源的可调度性成为关键。同时,元数据的统一注册和寻址标准也对数据的访问和管理至关重要。在数据流通利用设施方面,则需要加强算力调度、算力检测、数据融合和安全等方面的功能实体建设,以支持数据的高效流通和利用。
网络安全是数据要素高质量发展的重要保障。当前许多企业在数据应用过程中面临较大的网络安全压力,必须高度重视防范数据被劫持的风险。邬贺铨建议,应从多个方面采取管控措施,包括限制数据访问的时间、次数和访问点等。同时,还应加强对外部攻击的防范,形成社会化网络安全体系以应对日益严峻的网络安全威胁。