用AI打败AI,毕业论文AI检测靠谱吗?

用AI打败AI,毕业论文AI检测靠谱吗?

hyde012 2025-05-23 装修装饰 2 次浏览 0个评论

临近毕业,为了论文达到AI率标准,有一批大学生不得不狠狠修改论文。

对于一些高校的应届毕业生而言,除了传统的查重、盲审、答辩,毕业路上又多了一道关卡——AIGC检测。

收到学校对毕业论文进行AIGC检测的通知,大四学生一帆对“用AI查AI”的方式感到不放心。而检测结果让他惊讶:“虽然我自己写的几个段落被误判为99%AI,但没想到我用AI润色的部分也被查出来了”。

利用系统改写后,他产生了好奇:“降AI也是AI写的,为什么就查不出来?”查看修改内容后,他发现“系统降AI方法就是删掉逻辑词、把很多话的表述变成口水话”。

对于AI率降低后的论文,他认为“论文质量反而下降了,但为了合格,只能这样改。”

AI 检测再“升级”,不仅判 AI 率还能判论文质量?

论文“AI味”渐浓,是全球高校共同面对的新难题。

第三方机构麦可思在2024年对3000多名中国高校师生进行的问卷调查显示,近三成大学生将AI用于论文或作业写作。

2025年Open AI发布的报告显示,“美国三分之一以上的大学生使用ChatGPT,他们发送的约四分之一的消息与学习和学校作业相关”,内容涵盖构思论文框架、寻找主题和拓展观点等。

2024年初,福州大学、中国传媒大学等高校陆续发布了毕业论文(设计)AIGC 检测的通知。相比2024年,今年有更多高校将AIGC检测列入了毕业论文评价体系。西南大学、浙江科技大学、西南交通大学纷纷颁布关于2025届本科毕业论文(设计)AIGC检测的通知。

部分去年已采纳AIGC检测的高校则在今年提出了更细致的规定。以福州大学为例,去年的要求是“AIGC检测结果将作为学生毕业设计(论文)成绩评定和校级优秀本科生毕业设计(论文)评选参考依据”。到今年,校方指导文件明确指出“AIGC全文检测值应≤20%”,并规定终稿环节“查重检测或AIGC检测第二次才通过的论文最终总评成绩只能记作及格”。

在检测AI率的基础上,一些高校进一步采用了AI智评系统,用以评判论文质量。有别于拿AI率作为优秀论文参考依据,广东海洋大学、上海海事大学、温州理工学院等高校采用AI智评系统对本科毕业论文进行评级,结果包含四个等级:A(良好论文)、B(合格论文)、C(建议修改)、D(高危论文)。

这些评级意味着什么?不同的高校有着不同的标准,构成了难度不一的毕业门槛。网友@可回收分享自己查重定稿后,论文却被智评系统评为C级,她的学校要求论文达到B级才能答辩。网友@一往无前和网友@lady luck则表示自己的学校要求C级即可达标。

根据校方指导文件,一些高校要求学生依据AI评估的结果对论文进一步修改。比如,广东海洋大学要求盲审前,“AI智评结果为C或D以及检测智能生成内容比例超过40%的论文,应予以修改完善”。江苏大学则将AI 论文质量评估系统给出的数值列入了检测标准,要求评估数值“原则上预估合格概率要高于 75%;低于 75%的,需做进一步优化和修改”。

又贵又不稳定,大学生被AIGC检测困扰

“查了两次AI率,花了140块,太贵了。”考虑到一旦利用学校免费的查询次数,论文会被计入系统成为定稿,应届生立君将论文在其他平台进行了检测,确保AI率稳定,“一般大家都会提前自费查好,我们不敢把学校的检测次数当作试错”。

区别于论文查重精确到重合的语句标识,AIGC检测以片段为单位,这意味着修改范围扩大和不确定性增加。而面对被系统识别为“疑似AI生成”的专业术语和著作原文,不少大学生感到困惑。

网友@小狐狸在人间种花分享了自己的毕业论文检测记录,在正文一字未改、仅添加了参考文献表和封面的情况下,间隔两小时后的AI特征值从27.2%骤降为0.5%。对于花了两百块钱得到的这一波动检测结果,她感到无奈:“现在花钱查的结果也不敢相信了,好怕学校查重不过”。

评论区里,大学生们倾诉着类似的苦恼,获得高赞的网友@来一口猫钧嘛评论称“很多自己写的都会被判定AI,我的摘要写不好,最后是老师给我写的,也被判为中度AI了”;网友@圆镜表示“我连引用的北大核心参考文献都被说是AI”。

“AI率降低后,我的论文却变味了”

目前高校采用的主流检测系统在2024到2025年间先后更新。维普于2025年2月26日完成AIGC检测更新,表示其“增强了对最新AI模型的检测效果”;知网个人查重服务系统于2025年2月13日进行了AIGC检测服务升级;格子达在2025年3月6日发布了AIGC检测3.0版本。

为了探究系统升级是否有效,澎湃新闻记者将去年《换个平台就相差 32%,AI 论文检测成玄学》用于AIGC检测的同一篇“完全由AI生成”的论文投入相同的高校常用检测系统进行了检测。从结果来看,部分网站识别“完全由AI生成文本”的能力有所上升,但不同网站的差异仍然明显。

“我用AI帮我翻译的英文摘要都被识别出来了”。因此,电子科学与技术专业的晨夕认为,检测系统对于AI生成内容的判断还是准确的。但对于AI检测带来论文逻辑性减弱的后果,他感到无奈。为让AI率更低,他不得不在论文中的许多实验步骤前都加上了“我们”,原本清晰的实验说明,变成了“我们通过……,并且我们通过……,从而我们就能得到”的赘余版本。

AI检测器的误判概率大吗?一篇2024年教育技术领域的Q1级顶刊论文在检测了七款国外主流AI检测器后发现,这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%,对于人类写作的对照样本识别准确率为67%。这意味着人类有33%的概率被误判为AI,而AI却有高于60%的概率可以蒙混过关。

在新版本发布的公告中,格子达将其中一条区分人与AI创作的标准描述为:人类写作存在合理的不确定性,AI生成的文本过于“流畅”。这也导致了大学生们的无奈:为了降低AI率,不得不把论文改“笨”。

网友@江枫渔火对愁眠 分享了为AI率折腰的经历,她抱着把论文修改到最好的心态,却不得不弱化逻辑性,改书面语为口语,“虽然AI率达标了,终于定稿了,但是我对自己的论文不满意了,自己把自己的论文改烂真的很难受”。

网络上也有不少经验帖分享用AI打败AI的方法,但更改后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示,AI改写的语句“不像人写的”。删减逻辑词、增加口水话后,论文与严谨、专业的大众印象渐行渐远。

采纳AI检测器,国外高校态度审慎

除了类似“AI 检测率”这样的硬指标划定,国内一些高校也在探索其他规范使用 AI 的方式,比如中国传媒大学继续教育学部设计了《本科毕业论文(设计)生成式人工智能使用情况说明表》,由学生自主披露论文中的 AI 使用情况。

而使用了AI智评系统的广东海洋大学也在指导文件里公布了允许使用AI工具的范围,如“可用于文献检索、关键词推荐和文献管理,但需确保引用文献的真实性与可靠性。可用于推荐统计图表类型和辅助制图,但不得用于生成或修改原始研究数据及关键研究图表”。

关于AI检测器,美国前20所顶尖高校普遍持“不建议使用”态度,考虑的主要因素为现有检测技术不成熟、系统无法提供证据、误判和漏判现象频出。

Open AI公司在官网“教育者常见问题解答”中称:“我们对检测器的研究表明它们并不可靠,因为教育工作者可能会对学生作出判断,并造成长期影响”。在训练过程中,其研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类撰写的内容标记为 AI 生成。

国内主流AIGC检测平台目前并未披露具体的训练集;对于相关的大模型原理,公开表述也比较模糊。以维普为例,其在官网对于判断标准的描述是“AIGC检测是运用AI大模型,预先对各大AIGC模型生成的海量文本数据进行特征反向演算,掌握AIGC模型文本生成的规律”。

根据同方知网数字出版技术股份有限公司2025年1月24日公布的专利《AI生成学术文本的判断方法、装置及相关产品》,其检测系统判定原理如下:首先“利用大模型对‘待判断’学术文本进行改写 ”,再通过对比改写前后的文本,判断该学术文本是否由AI生成。

AI检测技术落后于AI生成技术的现状,导致规避检测变得相对容易。上文提及的检测了七款国外主流AI检测器的2024年顶刊论文还提到,即便是相对简单的内容操控(例如添加拼写错误、增加文本波动性)也能非常有效地规避检测;“具备技术敏感度、资源且有意愿的个体”则能更轻易将AI生成内容伪装成人类所写。这就意味着,滥用AI技术的学生并不担忧检测器的考验,而手写论文的学生却可能因误判而受煎熬。

2024年12月,发表在中文核心期刊上的一篇论文《大语言模型技术背景下重塑研究生论文评价与指导》指出,高校采用“AIGC值”标准要求学生,可能容易导致师生之间陷入“猫捉老鼠”困境——“检测软件不断更新换代,抄袭者随之不断寻求新的规避办法”。“学生将精力投入无意义的表达变换的文字游戏中”,或许才是AIGC检测最大的隐患。

文中一帆、立君、晨夕均为化名

转载请注明来自夏犹清建筑装饰工程有限公司,本文标题:《用AI打败AI,毕业论文AI检测靠谱吗?》

每一天,每一秒,你所做的决定都会改变你的人生!

发表评论

快捷回复:

评论列表 (暂无评论,2人围观)参与讨论

还没有评论,来说两句吧...