用AI打败AI，毕业论文AI检测靠谱吗？

hyde012 2025-05-23 装修装饰 18 次浏览 0个评论

临近毕业，为了论文达到AI率标准，有一批大学生不得不狠狠修改论文。

对于一些高校的应届毕业生而言，除了传统的查重、盲审、答辩，毕业路上又多了一道关卡——AIGC检测。

收到学校对毕业论文进行AIGC检测的通知，大四学生一帆对“用AI查AI”的方式感到不放心。而检测结果让他惊讶：“虽然我自己写的几个段落被误判为99%AI，但没想到我用AI润色的部分也被查出来了”。

利用系统改写后，他产生了好奇：“降AI也是AI写的，为什么就查不出来？”查看修改内容后，他发现“系统降AI方法就是删掉逻辑词、把很多话的表述变成口水话”。

对于AI率降低后的论文，他认为“论文质量反而下降了，但为了合格，只能这样改。”

AI 检测再“升级”，不仅判 AI 率还能判论文质量？

论文“AI味”渐浓，是全球高校共同面对的新难题。

第三方机构麦可思在2024年对3000多名中国高校师生进行的问卷调查显示，近三成大学生将AI用于论文或作业写作。

2025年Open AI发布的报告显示，“美国三分之一以上的大学生使用ChatGPT，他们发送的约四分之一的消息与学习和学校作业相关”，内容涵盖构思论文框架、寻找主题和拓展观点等。

2024年初，福州大学、中国传媒大学等高校陆续发布了毕业论文（设计）AIGC 检测的通知。相比2024年，今年有更多高校将AIGC检测列入了毕业论文评价体系。西南大学、浙江科技大学、西南交通大学纷纷颁布关于2025届本科毕业论文（设计）AIGC检测的通知。

部分去年已采纳AIGC检测的高校则在今年提出了更细致的规定。以福州大学为例，去年的要求是“AIGC检测结果将作为学生毕业设计（论文）成绩评定和校级优秀本科生毕业设计（论文）评选参考依据”。到今年，校方指导文件明确指出“AIGC全文检测值应≤20%”，并规定终稿环节“查重检测或AIGC检测第二次才通过的论文最终总评成绩只能记作及格”。

在检测AI率的基础上，一些高校进一步采用了AI智评系统，用以评判论文质量。有别于拿AI率作为优秀论文参考依据，广东海洋大学、上海海事大学、温州理工学院等高校采用AI智评系统对本科毕业论文进行评级，结果包含四个等级：A（良好论文）、B（合格论文）、C（建议修改）、D（高危论文）。

这些评级意味着什么？不同的高校有着不同的标准，构成了难度不一的毕业门槛。网友@可回收分享自己查重定稿后，论文却被智评系统评为C级，她的学校要求论文达到B级才能答辩。网友@一往无前和网友@lady luck则表示自己的学校要求C级即可达标。

根据校方指导文件，一些高校要求学生依据AI评估的结果对论文进一步修改。比如，广东海洋大学要求盲审前，“AI智评结果为C或D以及检测智能生成内容比例超过40%的论文，应予以修改完善”。江苏大学则将AI 论文质量评估系统给出的数值列入了检测标准，要求评估数值“原则上预估合格概率要高于 75%；低于 75%的，需做进一步优化和修改”。

又贵又不稳定，大学生被AIGC检测困扰

“查了两次AI率，花了140块，太贵了。”考虑到一旦利用学校免费的查询次数，论文会被计入系统成为定稿，应届生立君将论文在其他平台进行了检测，确保AI率稳定，“一般大家都会提前自费查好，我们不敢把学校的检测次数当作试错”。

区别于论文查重精确到重合的语句标识，AIGC检测以片段为单位，这意味着修改范围扩大和不确定性增加。而面对被系统识别为“疑似AI生成”的专业术语和著作原文，不少大学生感到困惑。

网友@小狐狸在人间种花分享了自己的毕业论文检测记录，在正文一字未改、仅添加了参考文献表和封面的情况下，间隔两小时后的AI特征值从27.2%骤降为0.5%。对于花了两百块钱得到的这一波动检测结果，她感到无奈：“现在花钱查的结果也不敢相信了，好怕学校查重不过”。

评论区里，大学生们倾诉着类似的苦恼，获得高赞的网友@来一口猫钧嘛评论称“很多自己写的都会被判定AI，我的摘要写不好，最后是老师给我写的，也被判为中度AI了”；网友@圆镜表示“我连引用的北大核心参考文献都被说是AI”。

“AI率降低后，我的论文却变味了”

目前高校采用的主流检测系统在2024到2025年间先后更新。维普于2025年2月26日完成AIGC检测更新，表示其“增强了对最新AI模型的检测效果”；知网个人查重服务系统于2025年2月13日进行了AIGC检测服务升级；格子达在2025年3月6日发布了AIGC检测3.0版本。

为了探究系统升级是否有效，澎湃新闻记者将去年《换个平台就相差 32%，AI 论文检测成玄学》用于AIGC检测的同一篇“完全由AI生成”的论文投入相同的高校常用检测系统进行了检测。从结果来看，部分网站识别“完全由AI生成文本”的能力有所上升，但不同网站的差异仍然明显。

“我用AI帮我翻译的英文摘要都被识别出来了”。因此，电子科学与技术专业的晨夕认为，检测系统对于AI生成内容的判断还是准确的。但对于AI检测带来论文逻辑性减弱的后果，他感到无奈。为让AI率更低，他不得不在论文中的许多实验步骤前都加上了“我们”，原本清晰的实验说明，变成了“我们通过……，并且我们通过……，从而我们就能得到”的赘余版本。

AI检测器的误判概率大吗？一篇2024年教育技术领域的Q1级顶刊论文在检测了七款国外主流AI检测器后发现，这些检测器对未经过改写的AI生成内容的平均识别准确率为39.5%，对于人类写作的对照样本识别准确率为67%。这意味着人类有33%的概率被误判为AI，而AI却有高于60%的概率可以蒙混过关。

在新版本发布的公告中，格子达将其中一条区分人与AI创作的标准描述为：人类写作存在合理的不确定性，AI生成的文本过于“流畅”。这也导致了大学生们的无奈：为了降低AI率，不得不把论文改“笨”。

网友@江枫渔火对愁眠分享了为AI率折腰的经历，她抱着把论文修改到最好的心态，却不得不弱化逻辑性，改书面语为口语，“虽然AI率达标了，终于定稿了，但是我对自己的论文不满意了，自己把自己的论文改烂真的很难受”。

网络上也有不少经验帖分享用AI打败AI的方法，但更改后的论文质量大打折扣。尝试过用系统降低AI率的一帆表示，AI改写的语句“不像人写的”。删减逻辑词、增加口水话后，论文与严谨、专业的大众印象渐行渐远。

采纳AI检测器，国外高校态度审慎

除了类似“AI 检测率”这样的硬指标划定，国内一些高校也在探索其他规范使用 AI 的方式，比如中国传媒大学继续教育学部设计了《本科毕业论文（设计）生成式人工智能使用情况说明表》，由学生自主披露论文中的 AI 使用情况。

而使用了AI智评系统的广东海洋大学也在指导文件里公布了允许使用AI工具的范围，如“可用于文献检索、关键词推荐和文献管理，但需确保引用文献的真实性与可靠性。可用于推荐统计图表类型和辅助制图，但不得用于生成或修改原始研究数据及关键研究图表”。

关于AI检测器，美国前20所顶尖高校普遍持“不建议使用”态度，考虑的主要因素为现有检测技术不成熟、系统无法提供证据、误判和漏判现象频出。

Open AI公司在官网“教育者常见问题解答”中称：“我们对检测器的研究表明它们并不可靠，因为教育工作者可能会对学生作出判断，并造成长期影响”。在训练过程中，其研发的AI生成内容检测器将莎士比亚的作品和《独立宣言》等人类撰写的内容标记为 AI 生成。

国内主流AIGC检测平台目前并未披露具体的训练集；对于相关的大模型原理，公开表述也比较模糊。以维普为例，其在官网对于判断标准的描述是“AIGC检测是运用AI大模型，预先对各大AIGC模型生成的海量文本数据进行特征反向演算，掌握AIGC模型文本生成的规律”。

根据同方知网数字出版技术股份有限公司2025年1月24日公布的专利《AI生成学术文本的判断方法、装置及相关产品》，其检测系统判定原理如下：首先“利用大模型对‘待判断’学术文本进行改写 ”，再通过对比改写前后的文本，判断该学术文本是否由AI生成。

AI检测技术落后于AI生成技术的现状，导致规避检测变得相对容易。上文提及的检测了七款国外主流AI检测器的2024年顶刊论文还提到，即便是相对简单的内容操控（例如添加拼写错误、增加文本波动性）也能非常有效地规避检测；“具备技术敏感度、资源且有意愿的个体”则能更轻易将AI生成内容伪装成人类所写。这就意味着，滥用AI技术的学生并不担忧检测器的考验，而手写论文的学生却可能因误判而受煎熬。

2024年12月，发表在中文核心期刊上的一篇论文《大语言模型技术背景下重塑研究生论文评价与指导》指出，高校采用“AIGC值”标准要求学生，可能容易导致师生之间陷入“猫捉老鼠”困境——“检测软件不断更新换代，抄袭者随之不断寻求新的规避办法”。“学生将精力投入无意义的表达变换的文字游戏中”，或许才是AIGC检测最大的隐患。

文中一帆、立君、晨夕均为化名

转载请注明来自夏犹清建筑装饰工程有限公司，本文标题：《用AI打败AI，毕业论文AI检测靠谱吗？》

hyde012 20166篇文章站点微博

每一天，每一秒，你所做的决定都会改变你的人生！