人工智能写作检测工具不靠谱,美国宪法竟被认为是机器人写的

2023-07-17 12:30    来源:浅语科技

近日有网友发现,如果将美国最重要的法律文件美国宪法输入一些专门用来检测人工智能写作的工具中,会得到一个令人惊讶的结果:美国宪法几乎肯定是由人工智能写的。除非詹姆斯・麦迪逊(美国第四任总统,“美国宪法之父”)是个穿越者,否则这显然是不可能的。那么为什么这些AI检测工具会出现这样的错误呢?外媒Arstechnica采访了几位专家,以及AI检测工具GPTZero的开发者,来揭开其中的原因。

在教育领域,人工智能写作引发了不少争议。长期以来,教师们依赖于传统的教学方法,将论文作为衡量学生对某一主题掌握程度的工具。很多老师试图依靠AI工具来检测AI生成的写作,但迄今为止的证据表明,它们并不可靠。由于存在误报的情况,AI检测工具如GPTZero、ZeroGPT和OpenAI的文本分类器都不靠谱,不能用来判断文章是否是由大型语言模型(LLM)生成的。

当将美国宪法的一部分输入GPTZero时,GPTZero会称这段文字“很可能完全由AI写成”。在过去的六个月里,其他AI检测工具显示出类似结果的截图多次在社交媒体上疯传。实际上,如果输入《圣经》中的一些内容,也会出现同样的情况。要解释为什么这些工具会犯这样明显的错误,我们首先需要了解它们是如何工作的。

据了解,不同的人工智能写作检测器使用略有不同的检测方法,但基本原理相似:通过一个人工智能模型,在大量文本(包括数百万个写作示例)和一套假定的规则(用来确定写作是更可能由人类还是人工智能生成)上进行了训练。

例如,GPTZero的核心是一个神经网络,它在“一个大型、多样化的语料库上进行了训练,该语料库包括人类写作和人工智能生成的文本,重点是英语散文”。接下来,该系统使用“困惑度”和“突发性”等属性来评估文本并进行分类。

在机器学习中,困惑度是衡量一段文本与一个人工智能模型在训练过程中所学习内容之间偏离程度的指标。测量困惑度的思路是,当人工智能模型写作时,它们会自然地选择它们最熟悉的内容,这些内容来自于它们的训练数据。输出越接近训练数据,困惑度就越低。人类则是更混乱的写作者,人类也可以用低困惑度来写作,尤其是当模仿法律或某些类型的学术写作中使用的正式风格时。而且,我们使用的很多短语都出奇地常见。

比如说,我们要猜测这个短语中的下一个词:“我想要一杯_____。”大多数人会用“水”、“咖啡”或“茶”来填空。一个在大量英语文本上进行训练的语言模型也会这样做,因为这些短语在英语写作中经常出现,这些结果中的任何一个都会有很低的困惑度。

GPTZero测量的文本的另一个属性是“突发性”,它是指某些单词或短语快速连续出现或在文本中“突发”的现象。本质上,突发性评估整个文本中句子长度和结构的可变性。人类作家经常表现出动态的写作风格,导致文本具有可变的句子长度和结构,而人工智能生成的文本往往更加一致和统一。然而,突发性也不是检测人工智能生成内容的万无一失的指标。与“困惑度”一样,也有例外。人类作家可能会以高度结构化、一致的风格写作,从而导致突发性得分较低。相反,人工智能模型可以经过训练,在句子长度和结构上模拟更接近人类的可变性,从而提高其突发性得分。事实上,随着人工智能语言模型的改进,研究表明它们的写作看起来越来越像人类的写作。



孵化AI创新思维 首届人工智能应用大会在京举办
科技

孵化AI创新思维 首届人工智能应用大会在京举办

本文转自:人民网 人民网北京1月22日电 (焦磊)随着技术不断取得突破,人工智能的应用和发展备受业界关注。日前,首届人工智能应用大会暨中国技术经济学会人工智能应用专业委员会揭牌典礼在北京举行。多位相关领域的专家、学者、企业家以及技术开发者围绕AI技术的未来发展及深度应用进行分享和讨论。 会上,参会者 [详情]

蚂蚁集团发布2023年消保年报:普惠金融教育行动已覆盖1亿人次
科技

蚂蚁集团发布2023年消保年报:普惠金融教育行动已覆盖1亿人次

1月22日,蚂蚁集团官网发布了《2023年消费者权益保护年报》(下简称“年报”)。《年报》显示,2023年蚂蚁集团继续通过“蚂蚁315”消费者权益保护专项行动,持续优化、升级相关产品和服务体验。 2023年,蚂蚁集团通过恶意营销专项治理行动优化消费环境,保护5300万用户免受恶意营销行为干扰。同时, [详情]

大族半导体第1000台LED芯片分选机正式交付
科技

大族半导体第1000台LED芯片分选机正式交付

2024年1月16日,大族激光旗下全资子公司大族半导体在南沙平谦国际工业园举行了第1000台分选机的“千台交付仪式”。作为MiniLED分选机项目历史上的重要里程碑,项目团队成员共同见证了这意义深远的重要时刻。 大族半导体分选机自2022年5月交付第一台量产机到2024年1月实现了产销“千台”的突破 [详情]

车旺科技全链路数字化增值服务 获评中物联货运物流行业创新实践优秀案例
科技

车旺科技全链路数字化增值服务 获评中物联货运物流行业创新实践优秀案例

为寻找优秀企业、推广先进做法、塑造创新品牌、引领行业发展方向,中物联公路货运分会面向行业进行了“2023年度公路货运行业创新实践案例”评选。车旺科技凭借为公路货运行业提供全链路数字化增值服务的科技创新能力,获评创新实践优秀案例。 这一荣誉不仅肯定了车旺科技在提高物流企业运营效率和降低成本方面的努力, [详情]