人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的

2023-07-17 12:30    来源:浅语科技

近日有网友发现,如果将美国最重要的法律文件美国宪法输入一些专门用来检测人工智能写作的工具中,会得到一个令人惊讶的结果:美国宪法几乎肯定是由人工智能写的。除非詹姆斯・麦迪逊(美国第四任总统,“美国宪法之父”)是个穿越者,否则这显然是不可能的。那么为什么这些AI检测工具会出现这样的错误呢?外媒Arstechnica采访了几位专家,以及AI检测工具GPTZero的开发者,来揭开其中的原因。

在教育领域,人工智能写作引发了不少争议。长期以来,教师们依赖于传统的教学方法,将论文作为衡量学生对某一主题掌握程度的工具。很多老师试图依靠AI工具来检测AI生成的写作,但迄今为止的证据表明,它们并不可靠。由于存在误报的情况,AI检测工具如GPTZero、ZeroGPT和OpenAI的文本分类器都不靠谱,不能用来判断文章是否是由大型语言模型(LLM)生成的。

当将美国宪法的一部分输入GPTZero时,GPTZero会称这段文字“很可能完全由AI写成”。在过去的六个月里,其他AI检测工具显示出类似结果的截图多次在社交媒体上疯传。实际上,如果输入《圣经》中的一些内容,也会出现同样的情况。要解释为什么这些工具会犯这样明显的错误,我们首先需要了解它们是如何工作的。

据了解,不同的人工智能写作检测器使用略有不同的检测方法,但基本原理相似:通过一个人工智能模型,在大量文本(包括数百万个写作示例)和一套假定的规则(用来确定写作是更可能由人类还是人工智能生成)上进行了训练。

例如,GPTZero的核心是一个神经网络,它在“一个大型、多样化的语料库上进行了训练,该语料库包括人类写作和人工智能生成的文本,重点是英语散文”。接下来,该系统使用“困惑度”和“突发性”等属性来评估文本并进行分类。

在机器学习中,困惑度是衡量一段文本与一个人工智能模型在训练过程中所学习内容之间偏离程度的指标。测量困惑度的思路是,当人工智能模型写作时,它们会自然地选择它们最熟悉的内容,这些内容来自于它们的训练数据。输出越接近训练数据,困惑度就越低。人类则是更混乱的写作者,人类也可以用低困惑度来写作,尤其是当模仿法律或某些类型的学术写作中使用的正式风格时。而且,我们使用的很多短语都出奇地常见。

比如说,我们要猜测这个短语中的下一个词:“我想要一杯_____。”大多数人会用“水”、“咖啡”或“茶”来填空。一个在大量英语文本上进行训练的语言模型也会这样做,因为这些短语在英语写作中经常出现,这些结果中的任何一个都会有很低的困惑度。

GPTZero测量的文本的另一个属性是“突发性”,它是指某些单词或短语快速连续出现或在文本中“突发”的现象。本质上,突发性评估整个文本中句子长度和结构的可变性。人类作家经常表现出动态的写作风格,导致文本具有可变的句子长度和结构,而人工智能生成的文本往往更加一致和统一。然而,突发性也不是检测人工智能生成内容的万无一失的指标。与“困惑度”一样,也有例外。人类作家可能会以高度结构化、一致的风格写作,从而导致突发性得分较低。相反,人工智能模型可以经过训练,在句子长度和结构上模拟更接近人类的可变性,从而提高其突发性得分。事实上,随着人工智能语言模型的改进,研究表明它们的写作看起来越来越像人类的写作。



刑事诉讼中的数字化革新
科技

刑事诉讼中的数字化革新

本文转自:法治日报□ 王税 在数字化时代,刑事诉讼正经历一场深刻的数字化革新。这场变革不仅是技术设备的更新换代,更是法律体系与科技深度融合的体现。笔者认为,案件管理系统的优化、数字证据的广泛应用、在线法庭与远程听证的实践以及人工智能和预测性分析的引入,构成了这场革新的核心内容。随着技术的持续发展,需 [详情]

“祥龙贺岁”主题巴士 亮相滨州街头
科技

“祥龙贺岁”主题巴士 亮相滨州街头

本文转自:鲁中晨报“祥龙贺岁”主题巴士 亮相滨州街头 滨州1月22日讯继推出婚庆主题巴士之后,滨州公用事业集团权属公交公司在新春来临之际,又推出“祥龙贺岁”主题巴士,提升城市春节氛围。  [详情]

辣椒市场 交易火爆
科技

辣椒市场 交易火爆

本文转自:商丘日报 1月22日,柘城辣椒大市场内客商云集,交易火爆,满载辣椒的车辆进进出出,呈现出一派繁忙景象。据悉,该县有20万人聚集在辣椒产业链上,辣椒种植面积常年稳定在40万亩,年产干椒12万吨,每年有70万吨辣椒在此集散销售,交易额超百亿元,形成“全国辣椒进柘城、 [详情]

我国科学家成功实现无串扰的量子网络节点
科技

我国科学家成功实现无串扰的量子网络节点

本文转自:黄石日报 新华社北京1月23日电 量子网络是基于量子力学规律对量子信息进行存储、处理和传输的物理装置,是实现量子通讯和大规模量子计算的基础。清华大学研究团队利用同种离子的双类型量子比特编码,在国际上首次实现无串扰的量子网络节点,对未来实现量子通讯和大规模量子计算具有重要意义。该研究成果近日 [详情]

飞腾腾珑E2000助力天津地铁AFC系统投用
科技

飞腾腾珑E2000助力天津地铁AFC系统投用

本文转自:科技日报 科技日报天津1月23日电 (记者陈曦)记者23日获悉,随着天津地铁11号线一期东段开通运营,全线基于飞腾腾珑E2000 CPU的AFC自动售检票系统也投入使用。该线路也是国内首条全线路AFC系统采用飞腾腾珑E2000 CPU的轨道交通项目。 据介绍,本次开通的天津地铁11号线,是 [详情]

我科研团队研发出新型绿色速溶融雪剂
科技

我科研团队研发出新型绿色速溶融雪剂

本文转自:科技日报 ◎本报记者 俞慧友 1月23日,长沙理工大学教授贾传坤团队透露,团队近期研发出了一款可快速融雪且无污染的新型融雪剂,有望进一步加速“破冰”,降低冰雪气候下的交通风险。  [详情]