蚌埠新闻网>> 社会

王立非:语言数据产业是推动数字经济发展的重要力量

-

2025-05-12 14:55     来源: 中国网
        

在数字经济蓬勃发展的浪潮中,语言数据产业成为推动经济高质量发展的重要力量。国家出台《促进和规范数据跨境流动规定》《关于加强数字中文建设,推进语言文字信息化发展的意见》《信息技术产品国家通用语言文字使用管理规定》等政策,凸显语言数据作为数据要素的核心地位。该产业涵盖语言资源的采集、标注、加工及应用服务,伴随人工智能对训练语料的需求激增,逐步从技术领域独立为新兴战略产业,经济价值与战略意义显著。

一、我国语言数据产业发展规模与特点

从产业发展阶段看,20世纪80年代,我国首批语言数据企业诞生,但规模有限;90年代改革开放深化推动市场快速成长,企业数量年均增超40%。21世纪后,大数据与互联网普及使语言数据价值凸显,语音识别等技术推动标注需求增长。2014年数字经济战略实施后,产业进入成熟整合期,形成头部企业与中小企业并存的格局。从产业规模看,截至2024年底,市场规模突破249.1亿元,企业达1.6739万家,其中,1.6222万家含语言数据服务的企业贡献了95.43%产值,体现“嵌入式服务”与“垂直专业化”并存的产业特征。从产业分布看,语言数据产业地域分布呈现东部沿海集聚态势,东部占比73.5%企业和85.23%产值,中西部及东北基础薄弱。东部优势源于数字产业基础、人才及与人工智能产业的协同效应。近年来,“东数西算”工程推动算力西迁,成渝等西部枢纽带动区域企业增长,产业扩散呈现“沿海-内陆”层级扩散与邻接扩散并存趋势。

二、我国语言数据产业自主知识体系创新

首先,我国的语言数据产业技术创新不断增长。2012-2020年专利授权量年均增21%,语音处理与多模态数据处理为核心方向,技术融合催生跨领域专利。产学研协同创新显著,腾讯、阿里、清华等企业与高校发挥关键作用,但创新资源仍集中北京、广东等发达地区。其次,语言数据产业协同力度不断加大。语言数据产业与数字经济及下游智能语言服务产业联动紧密。研究表明,语言数据产业的产值每增1亿元,数字经济指数提升0.0485.下游智能服务产值增0.55亿元。生成式AI的爆发进一步带动需求,因此,需要加强产业协同与场景对接。此外,语言数据相关制度保障不断完善。《数据安全法》和《全面加强新时代语言文字工作意见》等政策构建合规框架;教育部和国家语委等部门大力推动语言数据资源库建设;语言数据标准化体系逐步完善,如《双语平行语料加工服务基本要求》等国家标准规范行业发展。

三、建议

针对语言数据产业快速发展面临的挑战和机遇,我建议,一是将语言数据纳入语言战略规划和数字经济规划,将语言数据纳入AI、文化数字化等顶层设计,协同算力工程,强化语料资源与人才培养链条。二是激活数据要素价值,建立确权登记制度,完善数据资产交易与定价机制,提升交易透明度与收益分配公平性。三是打造区域示范高地,依托北京中关村、成渝双城等区域建设国家级示范区,推动全链条落地,纳入数字经济考核体系。四是创新驱动数据供给,攻关多模态标注、隐私计算等技术,对接国际标准,健全知识产权保护与众包激励机制。五是扩大国际影响力,输出“一带一路”数据发展的中国方案,扩大数据标准制定与规则话语权。

数字经济时代,语言数据产业已成为新质生产力的“新引擎”。通过战略统筹、制度创新、区域协同与技术突破,我国将巩固全球数字经济竞争中的优势地位,为高质量发展提供坚实基座。(王立非)





【广告】免责声明:本内容为广告,相关素材由广告主提供,广告主对本广告内容的真实性负责。蚌埠新闻网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资、消费建议。据此操作,风险自担!!!




深度阅读

习语|“中国扩大高水平开放的决心不会变
[详细]
铁肩担道义,历史鉴未来——习近平主席对俄罗斯进行国事访问并出席纪念苏联伟大卫国战争胜利80周年庆典取得圆满成功
[详细]