首页  »  财经  »  经济观察

如何让AI“识破”AI?这项研究给出答案

2025-08-25 09:25:00

来源:科技日报

随着大模型逐渐变成学习、工作中不可或缺的生产力工具,其伴生的问题也日益凸显。AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息;一些人利用AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;AI生成内容的流畅性和逻辑性越来越强,人类识别困难,但论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的问题。

南开大学计算机学院媒体计算实验室近日取得的一项研究成果,或为解决这些难题提供可行方案。该成果创新性地提出直接差异学习(DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被ACM MM 2025(第33届ACM国际多媒体会议)接收。

目前AI生成内容检测主要有两种路线。一种是基于训练的检测方法,使用特定数据训练一个专用的分类模型;另一种是零样本检测方法,直接使用一个预训练的语言模型并设计某种分类标准进行分类。多项研究表明,现有检测方法在应对复杂的现实场景时面临困境。

为何现有的AI检测工具会“误判”?“如果把AI文本检测看作一场考试,那么现有检测方法就好比机械刷题、死记硬背答案的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道,“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但这在大模型迭代飞速的今天几乎不可能。”

让检测器学会“举一反三”,提升其泛化性能,是增强AI文本检测能力的关键。为此,研究团队另辟蹊径,提出DDL方法,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识。这种方法可精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,该数据集使用13种主流的商用大模型以及4种先进的开源大模型,生成了接近10万条“人类—AI”文本对。

“MIRAGE是目前唯一聚焦商用大语言模型检测的基准数据集。如果说之前的基准数据集是由少且能力简单的大模型命题出卷,那么MIRAGE则是由17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的AI生成文本检测工具DetectGPT相比,使用DDL方法训练的检测器性能提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的AI生成文本检测方法Binoculars相比,性能提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测。”研究团队负责人、南开大学计算机学院教授李重仪说。

  • 相关阅读
  • 服务“银发一族” 养老金融绘就“老有颐养”新画卷

    家住北京市朝阳区的王女士,最近在银行工作人员指导下,开通了个人养老金账户。“个人养老金账户能享受税收优惠,这一点很吸引我。”她说,自己打算再买一些养老金融产品,让养老“钱包”越来越“鼓”。 金融监管总局此前发布...

    时间:08-25
  • 科技赋能长江上游生态保护

    原标题:科技赋能长江上游生态保护用嘉陵江水制冷需要几步?重庆的答案是三步:第一步用水泵把江水抽取到楼宇下层的能源站,第二步通过热泵技术利用夏季江水与空气的温差为楼宇空间降温,第三步将江水排回大江。这就是重庆市江...

    时间:08-25
  • 文旅市场热闹非凡 暑期消费乘“热”而上

    避暑纳凉、夜间游览、火热赛事、绝美演艺……今年夏天,各地加大文旅消费供给,不断创新消费场景,推动文旅消费持续增长。 “当前,不同群体的消费需求不同,催生出差异化、多样性的旅游方式,文旅市场呈现出‘百花齐放’的状态...

    时间:08-25
免责声明:本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。 本网站转载图片、文字之类版权申明,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。