Google翻译史上最大更新!为何AI模型PaLM 2是幕后功臣?


Google翻译更厉害了! Google宣布,其支持语言总数从133种增加到243种,一共新增了哪些语言?

Google翻译史上最大更新!

Google宣布,Google翻译新增110种语言的支持,使其支持语言总数从133种增加到243种,甚至包括了网友敲碗多年的广东话,为Google翻译推出后最大规模的更新!

Google指出,本次更新仰赖于PaLM 2 AI语言模型。据Google研究学者Isaac Caswell指出,PaLM 2 AI模型在学习高相关性语言时表现特别优异,例如,与印地语相关的阿瓦德语(Awadhi)和马尔瓦尔语(Marwadi),以及接近法语系的克里奥尔语(French-based creole languages),如塞席尔克里奥尔语(Creole),及毛里裘斯克里奥尔语(Morisien)。

Google也懂广东话了

在此一波新增的语言中,Google翻译也支持广东话了。 Caswell表示,广东话「长期以来都是Google翻译最受欢迎的请求语言之一」。然而,广东话在书写上经常与普通话重叠,因此找到合适的数据并训练模型是一大挑战。

此外,Caswell指出,新增语言中约有四分之一来自非洲,显示了Google对推动非洲语言数字化的重视。

Caswell受访时透露,大多数新增语言都有至少一百万名使用者,且「有些语言的使用者数量达到数亿人」。这些语言的纳入,扩大了Google翻译的使用范围,也加强了其在多语言环境中的实用性。

什么是PaLM 2?它有多强?

Google表示,此次语言扩展背后的技术支持,主要来自于PaLM 2 AI语言模型的强大学习能力。这一模型不仅能有效学习和理解新语言,还能在相关语言之间建立联系,从而提高翻译的准确性和自然性。

PaLM 2是Google于2023年发布的第二代大型语言训练模型(LLM),当时Google指出,相较于一代PaLM,二代不论是在数理、逻辑推理、编码等领域处理能力皆大幅提升。

Google PaLM 2 也可细分为4种版本,由大到小分别是「Unicorn、Bison、Otter、Gecko」。它们能在不同种类的装置中运用,轻量级别的Gecko 甚至可以直接在行动装置上离线使用。

Google表示,PaLM 2 使用超过100种语言进行训练,主要擅长理解与生成自然语言、翻译、编码、问答、摘要、创作写作、数理逻辑、常识推理;尤其语意理解的部分,PaLM 2 能够读懂像是猜谜、成语等非字面意义的文字。

本文链接地址:https://www.wwsww.cn/hqfx/26444.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。