日本打造自己的“ChatGPT”

2023-09-15 06:54    来源:每日看点快看

本文转自:中国科学报

日本超级计算机Fugaku已经开始消化日语文本,以开发日本版的ChatGPT。图片来源:Kyodo News via Getty

本报讯 日本正在打造自己的聊天机器人ChatGPT。据《自然》消息,日本政府联合NEC、富士通、软银等大型科技公司投入数亿美元,开发日语的大型语言模型(LLM)。

专门研究自然语言处理的日本东北大学研究员Keisuke Sakaguchi认为,目前的大型语言模型智能系统在英语方面表现出色,但在日语方面往往表现不佳。

ChatGPT之前的模型GPT-3训练的绝大多数文本都是英语。由于日语的句子结构与英语完全不同,因此,ChatGPT必须将日语翻译成英语才能找到答案,然后再将答案译回日语。

书面日语由两组48个基本字符和2136个常用汉字组成。由于日语的复杂性,ChatGPT有时会生成大多数人从未见过的极其罕见的字符,以及奇怪的未知单词。

一个有用的LLM需要准确反映日本文化习俗。为了衡量LLM对日本文化的熟悉程度,研究人员推出了Rakuda—— 一个衡量LLM回答有关日本主题的开放式问题能力的排名。结果发现,日本最好的LLM在Rakuda上排名第四,GPT-4排名第一。

研究日语模型的东京大学物理学家Passaglia表示,LLM远远落后于GPT-4,但将来未必不能达到或超过GPT-4的水平。“这不是技术上无法克服的问题,只是资源问题。”

创建LLM需要使用日本超级计算机Fugaku,主要用于训练日语输入。与GPT-4和其他专有模式不同,它将与其他开源LLM一起向所有用户提供其代码。

日本文部科学省正在资助创建一个针对科学需求的人工智能项目,该LLM的开发成本至少为300亿日元,预计将于2031年公开发布。超级计算机制造商NEC在5月份开始使用基于日语的生成式人工智能,并声称它将创建内部报告所需时间缩短了50%、将内部软件源代码缩短了80%。

与此同时,软银投资约200亿日元开发基于日语文本的生成式人工智能,并计划明年推出自己的LLM,其目标是帮助企业实现业务数字化、提高生产率。

日本研究人员希望开发出一个精确、有效的人工智能聊天机器人促进本国的科学发展,弥补日本与世界其他地区之间的差距。东京庆应义塾大学医学院医学技术研究员Shotaro Kinoshita表示,如果日文版的ChatGPT能够表述准确,有望为那些想学习日语或进行日本研究的人带来好处,从而产生积极影响。(辛雨)



美容仪价格跳水 要不要捡个漏?
科技

美容仪价格跳水 要不要捡个漏?

本文转自:西宁晚报 近日,#家用射频美容仪价格“大跳水”#等话题在社交媒体引发热议。记者在网络平台搜索数款品牌美容仪,曾经原价近2000元的两轮滚轮美容仪,使用消费券后只需611元,相当于打了3折。在淘宝个人店铺,同款美容仪价格已跌破100元。  [详情]

超快科学与量子感知国际会议明日起在三亚举办
科技

超快科学与量子感知国际会议明日起在三亚举办

本文转自:三亚日报 本报讯(记者 郭志华 张慧膑 林林 实习生 何承儒)1月23日,记者从三亚崖州湾科技城管理局获悉,超快科学与量子感知国际会议(USQS)将于1月25日至29日在三亚崖州湾科技城举办。 超快科学与量子感知国际会议致力于加强全球研究人员之间的合作,促进超快科学与量子感知领域的发展及其 [详情]

西安环普荣获“2023年度创新活力园区”
科技

西安环普荣获“2023年度创新活力园区”

本文转自:西安日报 本报讯(记者 李猛)近日,中国软件园区“数实融合与产业高质量发展论坛”研讨交流会表彰了行业内作出突出贡献的软硬件企业以及优秀园区。西安环普国际科技园荣获“2023年度创新活力园区”。 记者了解到,“数实融合与产业高质量发展论坛”由工业和信息化部信息化和软件服务业司指导,中国软件园 [详情]

闲鱼线下循环店试运营 二手电商线下“开打”
科技

闲鱼线下循环店试运营 二手电商线下“开打”

本文转自:广州日报 广州日报讯 (全媒体记者 邓莉)闲鱼正准备将实体门店开到消费者的家门口。闲鱼发布公告称,首家闲鱼循环商店将于1月28日在杭州拱墅区开业,除闲置实物商品交易外,还可以寄售跑腿、遛狗等服务。据闲鱼介绍,这是“闲鱼”App首次落地线下的全品类二手实体店,目前 [详情]

“福田区公共数据授权运营专区”开设
科技

“福田区公共数据授权运营专区”开设

本文转自:广州日报 广州日报讯 (全媒体记者刘畅)记者昨日获悉,深圳数据交易所与福田区政务服务数据管理局近日联合发布“福田区公共数据授权运营专区”,以规范、促进福田区公共数据开发利用,加快释放公共数据价值。福田区在深圳全市率先推动公共数据授权运营改革,在全国率先出台了区县级公共数据授权运营管理办法, [详情]