离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

神明 • 2023年12月24日上午6:04 • 科技资讯 • 阅读 141

新智元报道

编辑：拉燕

【新智元导读】非母语者写的文章=AI生成？气抖冷。

ChatGPT火了以后，用法是真多。

有人拿来寻求人生建议，有人干脆当搜索引擎用，还有人拿来写论文。

论文…可不兴写啊。

美国部分大学已经明令禁止学生使用ChatGPT写作业，还开发了一堆软件来鉴别，判断学生上交的论文是不是GPT生成的。

这里就出了个问题。

有人论文本来就写的烂，判断文本的AI以为是同行写的。

更搞的是，中国人写的英文论文被AI判断为AI生成的概率高达61%。

这….这这什么意思？气抖冷！

非母语者不配？

目前，生成式语言模型发展迅速，确实给数字通信带来了巨大进步。

但滥用真的不少。

虽说研究人员已经提出了不少检测方法来区分AI和人类生成的内容，但这些检测方法的公平性和稳定性仍然亟待提高。

为此，研究人员使用母语为英语和母语不为英语的作者写的东西评估了几个广泛使用的GPT检测器的性能。

此外，研究人员还证明了，用一些简单的策略就可以减轻这种偏见，还能有效地绕过GPT检测器。

这说明什么？这说明GPT检测器就看不上语言表达水平不咋地的作者，多叫人生气。

不禁联想到那款判断AI还是的游戏，如果对面是但你猜是AI，系统就会说，「对方可能会觉得你冒犯了。」

不够复杂=AI生成？

研究人员从一个中国的教育论坛上获取了91篇托福作文，又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文，用来检测7个被大量使用的GPT检测器。

图表中的百分比表示「误判」的比例。即，是由人写的，但检测软件认为是AI生成的。

可以看到数据非常悬殊。

七个检测器中，美国八年级学生写的作文被误判的概率最高才12%，还有两个零误判的GPT。

中国论坛上的托福作文被误判的概率基本全部过半，最高误判概率可达76%。

91篇托福作文中的18篇被所有7个GPT检测器一致认为是AI生成的，而91篇中有89篇，都至少被一个GPT检测器误判。

从上图中我们可以看出，被所有7个GPT误判的托福作文在复杂度（Complexity）上明显低于其它论文。

这就印证了开头的那个结论——GPT检测器会对那些语言表达能力有限的作者有一定偏见。

因此，研究人员认为，GPT检测器应该多看点儿非母语者写的文章，样本多了，才能消除偏见。

接下来，研究人员把非母语者写的托福作文扔到了ChatGPT里，丰富一下语言，模仿母语者的用词习惯。

同时作为对照组，把美国八年级小孩儿写的作文也扔到了ChatGPT里，把语言简化了一下，模仿非母语者的写作特点。下图就是修正后的新判定结果。

我们可以发现，情况来了个大掉个儿，丰富了语言的托福作文错判率直线下降，低至3%，最高也不过19%。不像之前基本全部过半的错判率。

与之相反，八年级小孩儿写的作文的错判率直线上升，甚至还有一个GPT检测器的错判率高达99%，基本全错。

因为，文章复杂度这个变量出现了变化。

这里研究人员就得出了一个结论，非母语者写的东西不地道，复杂度低，容易被错判。

这也就导向了一个技术问题，同时也是一个价值问题。以复杂度来判定AI还是人类是作者，是否合理、全面、严谨。

结果显然不是。

以复杂度为判断标准的情况下，非母语者吃了大亏，因为，他们是非母语者（废话）。

AI润色=人类写的？？

研究者认为，加强语言多样性不仅可以减轻对非母语者的偏见，还能让GPT生成的内容绕过GPT检测器。

为了证明这个观点，研究人员选取了2024-2023年间美国大学申请的入学论文题目，输入到ChatGPT-3.5里，一共生成了31篇假论文。

GPT检测器一开始还挺有效，但是第二轮就不行了。这是因为，在第二轮中，研究人员把这些论文又扔到ChatGPT里润色了一下，用一些文学性的语言提升了文本质量。

这样一来，GPT检测器的准确度就从100%直降到了0%。如下图：

经过润色的文章复杂度相应也上升了。

与此同时，研究人员又用了斯坦福大学145个期末项目报告的题目，让ChatGPT生成摘要。

摘要经过润色以后，检测器判断的准确性继续下降。

研究者再次得出结论，润色过的文章很容易被误判，都是AI生成的，两轮就是比一轮强。

GPT检测器？还是欠练

言而总之，总而言之，各种GPT检测器好像还是没能抓住AI生成和人类写作之间最本质的区别。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。商机网仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 tenspace2022@163.com 举报，一经查实，本站将立刻删除。本文链接：https://www.315965.com/n/60812.html 聚才发母婴好物

、

神明

0 0

大模型慢半拍，字节甘做“嫁衣”？

上一篇 2023年12月24日上午6:00

大规模裁员是“最后手段”，库克重申苹果暂无相关计划

下一篇 2023年12月24日上午6:10

科技资讯

比特币采矿作业的能源（在）效率源代码

根据加密货币指南 HowtoToken，作为一名矿工，你最终可能每月至少在标准设备、外围设备和能源上花费 1,080 美元。这不包括维护成本。对于批评者来说，比特币对环境造成的代价更大。它不仅消耗我们有限的能源，而且还通过破坏我们生态系统的二氧化碳 (Co2) 腐蚀我们的环境。比特币的碳足迹比特币矿工使用了世界能源供应的 21%。荷兰普华永道 (P…

神明
2024年1月16日
131
科技资讯

客户数据导入的四大挑战及其解决方法源代码

根据 Flatfile 最近进行的一项数据入职调查，23% 的软件公司表示导入客户数据可能需要数周或数月的时间，96% 的公司表示他们在导入过程中遇到了问题。对于准备导入 CSV 文件的客户、构建导入功能的开发人员或处理不断出现的数据导入问题的客户服务和成功团队来说，导入 CSV 文件并不愉快。 CRM、ERP、产品生命周期管理软件和库存管理软件只是众多需…

神明
2024年1月15日
125
科技资讯

手机充电宝鼓包了还能用吗手机充电宝能带上飞机吗(附2024年排行榜前十名单)

飞机上不能带充电宝吗关于飞机上是否能带充电宝的问题 1、民航规定，携带的充电宝可以超过100WH，但不能高于160WH的锂电池电子设备登机。按照一般充电宝的最经常的输出电压5V计算，那么久是携带的充电宝不能超过20000毫安。所以在携带充电宝的时候，一定不要携带高于20000毫安的充电宝，不然只有被没收的命运。2、其实飞机上携带不合规定的充电宝会很危险，一些…

老A
2024年2月5日
193
科技资讯

2024年6月安兔兔Android跑分性能排行榜(附2024最新排名前十名单)

手📱机处理器排行榜2024最新 1、骁龙8gen1 E5材质120W快充，安兔兔跑分107万，骁龙8gen1，性能强悍。拍照方面也是能打。12pro在屏幕，绝和裂快充，拍照等方面更强。并闭 2、A15芯片苹果手📱机在手📱机行业一直在前列，A15芯片非常强悍，加上系统。体验非常不错。拍照游戏体验都是非常不错的。根据预算，价格越高的越好，轻薄手感好。 3、骁龙…

1374
2024年2月2日
269
科技资讯

人工智能正在经历“iPhone时刻”？

参考消息网4月23日报道（文/张百慧王栋栋孙青昊）当美国开放人工智能研究中心（OpenAI）发布其人工智能（AI）机器人ChatGPT之后，这家人工智能公司的主要投资方之一——微软公司的市值飙升了1150亿美元，涨幅约6.5%。法国《世界报》网站近日以《“AI正在经历其‘iPhone时刻’并将像2007年的苹果公司那样颠覆社会”》为题发表文章说，华尔…

神明
2023年12月22日
137
科技资讯

高压瓷片电容器正确放电操作高压瓷片电容器好坏判别(附2024年排行榜前十名单)

高压陶瓷电容如何测量好坏？高压瓷片电容及一般电容器检测的方法1.固定电容器的检测:A检测10pF以下的小电容因10pF以下的固定电容器容量太小，用万用表进行测量，只能定性的检查其是否有漏电，内部短路或击穿现象测量时，可选用万用表R×10k挡，用两表笔分别任意接电容的两个引脚，阻值应为无穷大橡闭若测出阻值(指针向右摆动)为零，则说明电容漏电损坏或内部击穿B检…

老A
2024年2月3日
284
科技资讯

超30个国产大模型混战：华为百度阿里腾讯，谁能成为“中国的OpenAI”？

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦在高调呼吁暂停开发高级别人工智能后，近日，马斯克被爆出斥资数千万美元买上万张GPU训练算力，并成立对标OpenAI的X.AI公司以开发大模型。 ChatGPT引爆的AI大模型，正在成为全球科技巨头竞相追逐的新战场。国外有微软、谷歌、亚马逊，国内更是遍地开花。“大模型发布月”名不虚传，刚刚过去的一周基本以…

神明
2023年12月18日
137
科技资讯

常见搜索引擎提交入口,新网站收录提交入口(附2024最新排名前十名单)

在搜索引擎入口提交网站能加快网站收较高的文章质量，良好的网站体验，都会增加你网站收录的机会和数量。我在另一篇文章里写到“最查新搜索引擎网站提交入口汇总”，希望对你有帮助查看原帖>> 2024年收录排名最好的网站谷歌。在2024年全国收录访问量信搏排名中谷歌位于榜单第一，是最好的网站。谷歌激纤公司成立于1998年9月4日，由拉里佩奇和谢尔盖布…

老A
2024年2月2日
129
科技资讯

是时候刷新您的办公技术了吗？源代码

您的办公设备让您头疼。您想更换它，但您不确定。现在是时候吗？值得这个价吗？你能用你所拥有的度过难关吗？你应该买新的还是二手的？您需要评估当前设备的状态，并考虑它如何影响您的整体业务计划。如果您的关键设备已过时或无法正常工作，那么是时候进行更改了。但是你如何决定呢？更换问题低于 100 美元的商业采购可能无关紧要。这完全取决于您的现金流。 …

神明
2024年1月14日
128
科技资讯

改变是艰难的：与 Turbonomic 执行主席 Bill Veghte 谈论颠覆性技术源代码

改变人们生活和工作的方式需要什么？在科技界，我们倾向于假设我们知道答案：技术。新技术的进步改变了我们的世界以及我们在其中生活、工作和互动的方式。这个童话往往是这样的：首先，一项新技术被开发出来。还早呢; 新发明的能力有限，实施起来也很粗糙，但潜力是存在的。而且，只要有人看到了这种潜力，技术就会不断改进。人们会消除它的缺陷并改进它的功能。其他支持…

神明
2024年1月15日
122

离谱！最新研究：61%中国人写的英语论文，会被ChatGPT检测器判为AI生成的

相关推荐