检查内容是否用了ChatGPT,准确率高达99.9%!
OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。其能够精准识别出论文或研究报告是否由ChatGPT撰写,甚至能追溯其使用的具体时间点。它能专门用来检测是否用ChatGPT水了论文/作业。
早在2022年11月(ChatGPT发布同月)就已经提出想法了。
但是!
这么好用的东西,却被内部雪藏了2年,现在都还没对外公开。OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)和首席技术官米拉·穆拉蒂(Mira Murati)也参与了有关反作弊工具的讨论。一些知情人士表示,阿尔特曼对该项目表示肯定,但并未实际推动其发布。
为啥?
OpenAI对忠实用户做了调查,结果发现近三分之一的人都表示如果用了反作弊工具,他们就弃了ChatGPT。而且还可能对非英语母语的用户影响更大。
但公司内部也有人提出,使用反作弊方法对OpenAI生态有好处。双方一直争执不下,该水印检测工具因此未发布。而除了OpenAI,如谷歌、苹果也都准备了类似工具,有一些已开始内测,但都未正式上线。
ChatGPT没发布前已开始讨论
ChatGPT大火后,不少高中生大学生都拿它来写作业,所以如何甄别AI生成内容也成为了圈内的热议话题。从最新曝光的信息来看,OpenAI早在ChatGPT发布前就考虑到了这一问题。当时开发这项技术的人是Scott Aaronson,他在OpenAI从事安全方面的工作,也是德克萨斯大学计算机科学教授。
2023年初,OpenAI公司联合创始人之一约翰·舒尔曼(John Schulman)在一份共享Google文档中概述了该工具的优势和缺点。
OpenAI高管则决定在采取进一步行动之前,先征求更多人的意见。在接下来的一年半时间里,OpenAI的管理层反复讨论这项技术,并希望通过数据分析来决定到底要不要对外发布。一份内部文件显示,OpenAI于2023年4月委托开展的一项调查指出,有四分之一的用户支持AI检测工具的推出。同月,OpenAI针对ChatGPT用户开展了一项调查,结果显示,高达69%的受访者担忧由于作弊检测技术的误判,使用AI的人可能会无端遭受“滥用AI”的指责。
此外,近30%的受访者强烈表示,如果ChatGPT决定实施水印机制,他们将选择转向那些不采用水印机制的竞争对手平台,或者至少会减少对ChatGPT的使用频率。OpenAI公司内部还一直存在担忧,即反作弊工具可能会损害ChatGPT的写作质量。但知情人士表示,OpenAI今年早些时候进行了一项测试,发现水印并不会影响ChatGPT的性能。根据内部文件,参与测试的员工总结道:“既然我们确认了水印不会降低输出质量,恐怕就很难继续反对文本水印机制的落地了。”
今年6月初,OpenAI的高层团队与研究人员再次开会,就该项目进行了深入讨论。小组内部达成了共识,认为水印技术确实展现出了良好的效果,但同时,去年ChatGPT用户调查的结果依然具有重要的参考价值。据知情人士透露,有观点提出,公司应该探索那些尚未得到验证、但有望在用户群体中引发较少争议的新方法。
6月会议纪要的核心指出:“若未能及时行动,我们的声誉将会受损,公众可能会因此质疑OpenAI的责任感。”
为啥不公开?
总结OpenAI迟迟不公开这项技术的原因,主要有两方面:一是技术,二是用户偏好。
先说技术,早在2023年1月,OpenAI就开发了一种甄别多个AI模型(包括ChatGPT)文本的技术。
这项技术利用了一种类似“水印”的方法,把看不见的标记嵌入文本中。这样,当有人用检测工具分析文本时,检测器可以提供一个分数,表示文本由ChatGPT生成的可能性有多大。
不过当时成功率只有26%,仅过了7个月,OpenAI就撤回了。后来OpenAI逐渐将技术的成功率提到了99.9%,从技术上讲,该项目大约一年前就已经可以发布。然而,围绕技术的另一个争议是,内部员工认为该技术可能会损害ChatGPT写作质量。
同时,员工们还提出了一些关于“人们可能规避水印”的潜在风险。比如大学生都会的“翻译术”,将文本翻译成另一种语言,然后通过类似谷歌翻译的方式再次翻译回来,从而有可能被擦除。再比如有人搞个“上有政策下有对策”,一旦公开使用水印工具的人多了,网友们指定分分钟搞出破解版。
除了技术,另一大阻碍因素就是用户了,OpenAI的多项调查显示,用户们似乎并不看好这项技术。这也不得不提到用户们到底拿ChatGPT在干啥?这个问题可以参考《华盛顿邮报》的一项调研,他们从数据集WildChat中查看了近200,000个英语聊天记录,这些对话由人类与两个基于ChatGPT构建的机器人生成。可以看出,人们主要用ChatGPT来写作(21%)以及帮助完成家庭作业(18%)。
这样看来,人们反对这项检测技术好像也不难理解。
另外,OpenAI内部还有一种反对的声音是反作弊工具可能会损害ChatGPT的写作质量。知情人士称,OpenAI今年早些时候进行了一项测试,发现文本水印不会降低输出质量。
6月初,OpenAI高级员工和研究人员再次聚会讨论该项目。该组织一致认为水印技术效果良好,但去年的ChatGPT 用户调查结果仍然是一个头疼的问题。内部文件显示,OpenAI需要在今年秋天之前制定一项计划,围绕AI透明度以及相关潜在新法律来左右公众舆论——「如果做不到这一点,我们就有可能失去负责任企业的信誉。」
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址://www.bonjen.com/yun/131149.html
在最近的大模型战争中,OpenAI似乎很难维持霸主地位。虽然没有具体的数据统计,但Claude3.5出现后,只是看网友们的反响,就能感觉到OpenAI订阅用户的流失:既然Claude3.5比GPT-4o好用,为什么我们不去订阅Claude呢?而这长达数月的批评声中,OpenAI似乎尽显颓势,除了GPT-4o mini这个小模型以外,似乎再也没有什么创新点。甚至就在前几日,GPT-4o还被开源的大模...
一、ChatGPT介绍ChatGPT是一款由OpenAI开发的大型语言模型,它使用了深度学习技术和海量数据集进行训练,使其可以实现多种自然语言处理任务。ChatGPT可以根据用户的输入生成自然流畅的回答,并可用于各种聊天机器人、智能客服或者在线问答系统中。ChatGPT使用了Transformer模型框架,在训练时使用了大量开源数据集如Wikipedia、Common Crawl等等,以及其他非结...
本文梳理了OpenAI团队最新的GPT-4.o(o代表omni 全方位)模型发布内容,以OpenAI团队发布会口吻整理。我们很高兴地宣布,推出了全新的旗舰模型 GPT-4o,能够在音频、视觉和文本之间实时进行推理。GPT-4o(o代表omni 全方位)能够实时处理音频、视觉和文本信息,使人机交互更加自然流畅。这款模型支持多种输入(文本、音频、图像)和输出(文本、音频、图像)模式,其响应音频的速度极...
一直在生成式AI战争中默默无闻的苹果终于憋不住了!北京时间6月11日凌晨1点,2024苹果WWDC全球开发者大会在苹果总部 Apple Park开幕。Day 1的发布会在介绍完各个操作系统的更新后,一半的时间都留给了本次WWDC的重头戏——苹果AI(Apple Intelligence)。Apple Intelligence概述苹果将其AI技术命名为Apple Intelligence。还记得五年...
摘要:在全面兼容Apache Kafka生态的基础上,消息队列Kafka彻底解决ApacheKafka稳定性不足的长期痛点,并且支持消息无缝迁移到云上。 近日,阿里云宣布正式推出消息队列Kafka,全面融合开源生态。在全面兼容Apache Kafka生态的基础上,消息队列Kafka还具备了超易用,超高可用可靠性,扩缩容不操心,全方位安全诊断,数据安全有保障的特点。可用行达99.9%,数据可靠行99...
阅读 42·2024-09-14 16:58
阅读 35·2024-09-14 16:58
阅读 142·2024-08-29 18:47
阅读 330·2024-08-16 14:40
阅读 118·2024-08-14 17:54
阅读 125·2024-08-13 16:33
阅读 213·2024-08-08 16:39
阅读 357·2024-08-07 15:04