四川新闻|四川经济|区域视窗|文娱前沿|体育产业|教育在线|健康投资|科技聚焦|旅行天下|四川美酒|四川美食|成都看房

首页 > 经济在线 > 科技聚焦

神经机器模型能翻译两百种语言

http://www.hrnewspaper.com/ 】 【2024-06-07 10:12:22】 【来源:科技日报】

  《自然》5日发表的一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,增加了机器翻译的语言数量。

  神经机器翻译模型利用人工神经网络翻译各种语言。这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都是公开、低成本或是普遍可及的,这类语言被称为低资源语言。一味的增加模型翻译语言数量,可能会影响模型的翻译质量。

  此次,Meta的法国研究团队和“不落下任何语言”(NLLB)团队开发了一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力,实现对低资源语言的翻译。研究团队开发了一个在线多语言翻译工具,名为“NLLB-200”。该工具能容纳200种语言,其低资源语言数量是高资源语言数量的3倍,翻译表现则比当今已有系统高44%。

  由于团队在许多低资源语言上只能获取1000—2000例样本,为了扩大“NLLB-200”的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据,帮助提升其翻译质量。

  研究团队指出,这个工具可以帮助很少被翻译的那些语言的使用者,让他们也能用上互联网和其他技术。此外教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示,目前误译的情况仍有可能出现。

 
 
 
推荐阅读
 
世界首台五百兆瓦冲击式水轮机模型验收
十一个服务外包产业项目签约落地内江市
关爱特殊儿童 瑞众保险自贡中支开启圆梦行动
宋洁入选巴黎奥运会跆拳道项目参赛名单
 
· 磁性大质量恒星现身麦哲伦星系
· 农户桃园受灾 绵阳人保财险快速查勘
· 速来围观 彭州敖平西瓜季进入倒计时
· 波尔图文化区夏日美食地图攻略亮相
 
热门点击
  1. 谷歌透露下一个野心是构建健康人体地图
  2. 美敦力与先健科技扩大战略合作
  3. 高科技掌控生活 装上千里眼家里宝宝活动
  4. 四川律贝生物攻坚克难长薄鳅繁殖再创佳
  5. 四川省三项档案课题获国家立项
  6. 四川增强自主创新驱动升级  
  7. 院士创新工作站落户成都清科
  8. 易观智库发布中国搜索引擎报告
  9. 成都将建医药电商平台字号
  10. 陌陌游戏开发者沙龙于成都举办
 
关于我们 - 联系我们 - 郑重声明 - 广告刊列

人力资源报@ 版权所有 未经书面授权 不得复制或建立镜像
蜀ICP备12029325号-1