突破文字转语音技术
美国人工智慧研究实验室「OpenAI」开发ChatGPT之后,科技巨头Meta在人工智能研发上也有所突破。今年二月,Meta成立专门研究AI的开发团队,计画打造名为「LLaMA」大型语言模型。
根据Meta5月22日发布消息指出,其开发出一种由AI驱动的「文字转语音技术」(text-to-speech technology),名为「大型多语言语音模型」(Massively Multilingual Speech,MMS),未来可识别的语言超过4千种,比任何已知文本转语音的技术强大40倍以上。
「文字转语音」和「语音转文字」之技术,在Meta团队努力下,从100种语言扩展到1,100多种语言。此功能让人们在使用VR或AR服务时,使用自己喜欢的语言时,AI也可以听得懂。
Meta公司表示,开发该功能最大目的,是为「保护面临消失危机的语言」。「这世界有非常多语言正在消失,目前语音辨识技术的缺陷,会加速语言消失的速度。我们希望人们能更容易使用喜欢的语言,获取资讯或取得服务。」
至于是怎么做到的?其实,要能辨识上千种语言,就要餵给AI系统同样多、甚至更多的语音音频数据。
目前其语音数据库裡,仅有100多种语言,「为克服此问题,我们转向蒐集宗教文本,像是圣经──已被翻译成非常多语言,这些内容也被广泛应用在文本翻译研究工作上。」
这些翻译的内容多半有公开录音,可找到人们使用不同语言的阅读情况。Meta公司创建了1,100多种、以不同语言来阅读新约圣经的资料库,平均每种语言的数据资料有32小时。
餵AI海量语言的圣经故事、信息和诗歌
假若其纳入更多基督教灵修读物的语言资料,AI可识别的语言就能累积到4,000多种。此外,所收集的阅读资料多为男性,但研究分析并未看出男生和女生在声音表现上的差异。
团队希望,未来能让MMS习得更多语言,并在方言语音技术上有所突破。随此消息一同发布的研究论文中,Meta团队提到,研究用的数据是来自圣经,包括Faith Comes By Hearing.com、GoTo.Bible、Bible.com等网站。
美国布罗沃德学院(Broward College)语言中心表示,全世界约有7,100种语言。而,Meta公司透过圣经所掌握的语言资料,就有高达6,255种由不同语言或方言录製的圣经故事、福音讲道、经文朗诵和敬拜歌曲。其涵盖的语言资料库相当庞大。
「圣经」成为Meta训练语言模型的工具,该研发团队表示,他们与基督教伦理学家讨论过,对于把新约当成AI学习的材料,大部分信徒应可以接受。
另补充,若AI接触圣经太久,很可能会难以保持中立世界观。外界也有人因此批评Meta的做法,质疑用圣经训练AI,到底是让语言模型更进步,还是在不久将来爆出更大争议?
不论如何,从另一角度来看,这本全球最多人买的书,在AI正兴起的年代,也成了AI「必读」的书。
(资料来源:Evangelical News、Meta、Yahoo)