首页  »  新闻频道  »  国内新闻

国内多数模型训练使用中文数据占比超60%

2025-08-19 08:42:00

来源:人民网-人民日报

  本报北京8月18日电  (记者王云杉)记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。

  在人工智能时代,Token(通常所说的词元)是处理文本的最小数据单元。国家数据局局长刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。

  《 人民日报 》( 2025年08月19日 06 版)

  • 相关阅读
  • 习语|“把伟大抗战精神一代代传下去”

    “伟大抗战精神,是中国人民弥足珍贵的精神财富”。...

    时间:08-19
  • 9月起江苏省免收高速救援拖车吊车费

      本报南京8月18日电 (记者白光迪)近日,江苏省发展和改革委员会、江苏省交通运输厅联合发布《关于车辆救援服务收费有关事项的通知》,明确自2025年9月起,江苏免收高速公路车辆救援服务拖车、吊车...

    时间:08-19
  • 帮助新就业群体提升技能(稳就业在行动)

      “高脚杯非常容易碎,得先用气泡膜裹起来,再用气柱塞满包裹两侧……”晚上7点,江西赣州瑞金市新就业群体职业能力提升平台,快递打包技巧课程准时开讲,授课老师邓冰发给新入学的快递员演示完高脚杯...

    时间:08-19
  • 职工干事创业更有精气神

      “中国共产党第一个公开领导工人运动的机构是什么?”  看着手机上弹出的题目,黑龙江省设计集团职工薛琳经过短暂思索,选出了答案——“中国劳动组合书记部”。薛琳经常和同事们打开“黑龙江...

    时间:08-19
  • “东极渔民的壮举将被永远铭记和传颂”(伟大胜利·历史贡献)

      “我父亲总是说,渔民们是英雄。他说,如果没有中国渔民,他就活不下来,也就不会有我了。全世界都应该知道,这些渔民是伟大的英雄。”“里斯本丸”号船幸存者家属丹尼斯·维尼近日在接...

    时间:08-19
  • 跨越一甲子 逐梦向未来

      今年是西藏自治区成立60周年。60载栉风沐雨,60载万象更新。  60年来,在中国共产党领导下,西藏各族人民以主人翁姿态积极参与管理国家和地方事务,充分行使宪法和法律赋予的自治权利,实现了西藏...

    时间:08-19
  • 持之以恒“做对的事”(和音)

      坚持“做对的事”,中国将继续以开放包容的胸怀,扬起合作共赢的风帆,向世界展现可信、可爱、可敬的大国形象,与各国共享发展机遇,共创美好未来      近期,多家国际民调机构调查显示,全球公众对...

    时间:08-19
  • 以法治畅通信用修复之门(人民时评)

      以发展的眼光看待企业,用法治的智慧破解难题,才能收获惩戒失信、激励守信、保护创新、促进发展的多赢    信用是市场经济的基础。对企业而言,良好的信用是一张重要名片。  近年来,我国社...

    时间:08-19
  • “共享中国高质量、可持续发展的红利”(见证·中国机遇)

      为巴斯夫湛江一体化基地供应可再生能源电力的国家电投广东海上风电场。">   为巴斯夫湛江一体化基地供应可再生能源电力的国家电投广东海上风电场。   巴斯夫研发人员进行...

    时间:08-19
  • 向诗意要效益(纵横)

      傍晚时分,海口湾畔,云洞图书馆的弧形轮廓与漫天红霞相映成趣,市民游客举起手机,定格动人一刻。前不久,海南海口发布晚霞预报产品,让“追晚霞”可预测、可规划。  晚霞是自然的馈赠,也是可挖掘的...

    时间:08-19
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。