• 首页
  • 时政
  • 财经
  • 社会
  • 股票
  • 信用
  • 视频
  • 图片
  • 品牌
  • 发改动态
  • 中宏研究
  • 营商环境
  • 新质生产力
logo 财经
  • 中宏网首页 >
  • 财经 >
  • 正文

读懂国家数据局新政:补齐数据短板 激活人工智能产业

2026-06-22 09:47:58 中宏网
分享到:
用微信扫描二维码

        中宏网北京6月22日电(沈怡然)近日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》(以下简称《方案》),《方案》衔接多项国家级政策,创新提出“数据飞轮”“词元”等产业前沿概念,并以六大专项行动方案破解人工智能产业高质量数据供给不足的发展痛点。

  本网就《方案》专访了中国社会科学院中国国际经济交流中心博士后于小丽,深度解析新政带来的深远影响。

  政策体系一脉相承对准产业卡点堵点

  “十五五”规划纲要提到,完善数据标准体系和质量管理体系,加快建设人工智能语料库,面向能源、交通、制造、教育、健康、金融等领域建设高质量数据集,建立人工智能训练数据合理使用制度。“人工智能产业发展离不开数据支撑,如今不少人工智能模型厂商都遭遇发展瓶颈,核心问题在于高质量数据供给不足。部分大模型出现数据幻觉、内容失真、虚假表述等问题,根源就在于缺少优质数据集,这也是行业亟待破解的突出堵点。”于小丽强调。

  《全国数据资源调查报告(2025年)》显示,我国数据生产总量占全球约27.44%。2025年,全国年度数据生产总量达52.26泽字节(ZB),同比增长27.28%,增速较上年提升2.28个百分点。

  《方案》正是立足这一行业背景出台的。在此之前,国内数据领域相关政策多以搭建通用性数据规则、完善数据流通体系为主。2022年12月,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,正式搭建起全国数据领域顶层制度框架。2023年12月,国家数据局会同中央网信办等多个部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,明确以激活数据要素潜能、释放数据资源价值、做强做优数字经济为核心目标。

  于小丽认为,《方案》与上述政策一脉相承、层层递进,并在此基础上进一步聚焦人工智能领域、聚焦行业数据集建设,提出了数据要素赋能人工智能、赋能全行业发展的具体落地举措。

  与此同时,国务院于2025年8月印发《关于深入实施“人工智能+”行动的意见》,于小丽表示,《方案》与该政策深度衔接,整套政策体系逻辑连贯、方向统一,既是落实智能经济发展战略的配套举措,也是数据要素市场化改革向人工智能等垂直细分领域延伸的重要一步。

  多项产业前沿概念落地

  《方案》提到,打造“数据飞轮”应用闭环。以模型应用牵引数据供给、以数据赋能模型迭代,推动形成“场景—数据—模型”协同发展的良性循环。对此,于小丽表示,以往数据生产、模型研发、场景应用彼此分隔,“数据飞轮”的核心逻辑是坚持应用导向,以终端应用反向倒逼上游数据供给,构建起全新运转链条。“数据飞轮”机制正加速形成,以高质量行业数据集为起点,驱动“场景—数据—模型”闭环迭代:应用场景越丰富,模型迭代越精准,数据反馈越丰富,场景应用越深化,形成螺旋上升的正向循环。

  这种情况下,数据不再是单一的静态原料,而是可以反复使用、持续增值的核心资产。在于小丽看来,这是由大模型、行业应用端提出明确的数据需求,反向传导至上游行业,指导行业开展高质量数据采集、标注、治理;经过优化的数据集,再支撑AI模型迭代升级;升级后的模型落地各行各业,催生全新应用场景,同时又产生新的数据需求。这种循环往复的运转模式,重塑了产业价值形态。

  《方案》还提出“词元”概念,鼓励探索词元交易等新型交易。国家数据局局长刘烈宏曾在中国发展高层论坛年会上表示,Token“词元”不仅是智能时代的价值锚点,更是连接技术供给与商业需求的“结算单位”,为商业模式的落地提供了可量化的可能。刘烈宏还曾在国新办举行的新闻发布会上表示,到2026年3月,我国日均词元(Token)调用量已超过140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。

  于小丽解释,词元是人工智能大模型处理信息的最小语义单元,将词元作为定价依据,是数据要素市场化的重要突破。行业一直存在数据资产定价难的问题,各部门、各行业形成大量数据孤岛,格式与标准互不统一,不仅阻碍数据流通,也是目前数据交易市场场内冷、场外热的原因之一。

  “未来,不管是哪类行业数据、何种应用场景,都可以基于词元完成计量、定价、交易,有望打破数据缺乏统一估值、定价标准从而导致市场无法良性运转的局面。”于小丽认为,以词元为单位,可以实现数据价值的精细化计量与动态化定价,打破传统按数据量或文件大小定价的粗放模式,这也可以理解为一种完善数据分配制度的方式。

  人工智能及数据要素行业将迎来三个变革

  《方案》以鼓励、引导为导向,完善数据基础制度,激活海量数据资源价值。于小丽表示,聚焦产业源头短板发力,夯实数据集这一产业底层基础,将对我国人工智能及数据要素行业带来三个深刻性改变。

  第一,重塑人工智能技术发展路线。以往行业普遍盲目追求超大参数规模的通用大模型,随着高质量行业数据集逐步完善,发展方向将发生转变:行业垂直大模型将成为主流,通用大模型逐步转型为通用能力底座。模型迭代模式也从单一的算法优化,升级为“数据迭代+模型微调”并行,依托“数据飞轮”实现模型持续进化、越用越好。同时,人工智能的发展重心将会转向服务于制造业数字化转型、各行业数字化升级,成为实体经济数字化转型的核心驱动力。

  第二,重塑行业竞争格局,推动人工智能应用生态形成。《方案》的出台将加快补齐我国在高质量数据集、算力建设等方面核心短板,逐步缩小我国与国际先进水平的差距,提升人工智能产业的国际核心竞争力。同时将助力培育出一批深耕行业大模型、行业数据集的龙头企业与独角兽企业。“数据飞轮”将显著提升行业模型训练效率和模型推理准确率,降低数据标注成本,推动人工智能赋能千行百业应用落地,显著增强我国人工智能产业的自主可控能力与生态主导权。

  第三,全面升级数据要素市场生态,加速数据资产化落地。随着高质量数据集普及、词元定价等新模式落地,数据将从无形的资源,转变为可计量、可交易、可分润的核心资产。有望破解数据“不愿共享、不敢共享、不会共享”的困局,推动数据加快从静态原料向持续增值资产转变,加速数据资产化进程,助力场外交易逐步转向交易所场内公开、合规、标准化交易,数据流通秩序持续规范,推动形成权属清晰、定价合理、交易活跃、治理规范的数据要素市场新生态。


编辑:沈怡然
审核:蔡旭东

中宏网版权申明:凡注有“中宏网”或电头为“中宏网”的稿件,均为中宏网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为“中宏网”,并保留“中宏网”的电头。

    为您推荐

  • 微信
  • 微博
  • 手机中宏网

相关推荐

互联网新闻信息服务许可证 10120230012 信息网络传播视听节目许可证 0121673

增值电信业务经营许可证 京B2-20260497 广播电视节目制作经营许可证 (京)字第10250号 网络文化经营许可证 京网文〔2024〕3391-167号

关于我们 中宏网动态 广告服务 中宏网版权所有 京ICP备2023030128号-1 举报电话:010-63359623

Copyright © 2016-2026 by www.zhonghongwang.com. all rights reserved 运营管理:国家发展和改革委员会宏观经济杂志社