执游网

搜狗击败讯飞阿里 获IWSLT国际口语机器翻译评测大赛冠军

  近日,在刚刚落幕的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛上,搜狗击败讯飞、阿里巴巴, APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等国际国内多个强劲对手,一举夺得了2018年IWSLT大赛Baseline Model(基线模型)赛道冠军,代表中国向世界彰显了AI领域的技术硬实力!

 

  这是搜狗继WMT 2017机器翻译顶级评测大赛夺冠之后,所摘得的又一翻译领域的技术桂冠。短期内连续登顶世界第一的位置,充分证明了搜狗在翻译行业特别是口语翻译领域已位居领先地位。

  IWSLT是什么比赛?

  IWSLT是国际最具影响力的口语机器翻译评测比赛,从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,本届比赛吸引了讯飞、阿里巴巴等国内公司,爱尔兰ADAPT中心,美国约翰霍普金斯大学,德国卡尔斯鲁厄理工学院,芬兰赫尔辛基大学,英国爱丁堡大学,美国AppTek公司等多家国际知名大学、研究机构和公司参加。

  表2 IWSLT2018大赛参赛情况

  本届IWSLT 2018的口语机器翻译任务主要评测基于指定数据集从英语到德语的语音翻译能力,共分为Baseline Model(基线模型赛道)和End-to-End(端到端赛道)两个赛道,其中Baseline Model赛道主要评测语音翻译的流水线方案,输入语音先通过语音识别系统得到语音识别结果,之后将结果送入机器翻译系统获得译文,这也是业内最主流、效果最好的语音翻译解决方案,市场上商用机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法;End-to-End则是本次评测新增设的赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文,这种方法目前仍处于早期研究阶段,受制于语音-文本平行语料难以大规模采集、算法研究不成熟等因素的限制,距离商用仍存在较大距离。本次评测中,在训练集、测试集相同的情况下,Baseline Model赛道最好的系统取得了28.09的BLEU(机器翻译质量评价指标,值越大代表翻译质量越好),而End-to-End赛道最好的系统仅取得了19.4的BLEU,较Baseline Model赛道相差8.69个BLEU,差距非常明显,也证明了Baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。

  搜狗本次参加的是Baseline Model赛道的评测,并取得了第一名的好成绩。评测任务面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,存在噪声、口音、自由表达等复杂语音现象,同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。最终,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,证明了搜狗在口语机器翻译领域强大的实力。

  AI赛道中持续发力,搜狗领跑语音翻译行业

  搜狗的AI战略蓝图之中,语言是最核心的重头戏。一直以来,搜狗都坚持着“自然交互+知识计算”的人工智能核心方向,并持续深耕技术,推动技术向产品的快速转化,2016年,搜狗发布了自有人机交互解决方案-知音引擎。拥有充足真实语料数据优势的搜狗,将语音识别与机器翻译技术相结合,并在2016年推出了全球首款商用AI同传系统-搜狗同传,引领了语音翻译技术的普及与应用。通过数百场的国际会议“实战”,搜狗同传获得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕君”。

 

  与此同时,搜狗也推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,帮助用户打破了跨国交流时的语言困境。2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能。作为首款智能翻译硬件,它支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。该项产品在京东平台首发当日即告售罄,首日销售额破千万。与此同时,搜狗还推出了录音翻译笔,提供录音转写、对话翻译、同声传译等功能,把AI同传落地到了消费级产品之中,开拓了语音翻译的新航道。

最热新游

黄仁勋最新表态:存储芯片供应紧张的局面将持续数年

  当地时间6月7日,英伟达CEO黄仁勋在韩国表示,存储芯片供应紧张的局面将持续数年。

  另据韩国媒体报道,黄仁勋与SK集团会长崔泰源将于周一(6月8日)宣布合作计划。黄仁勋说:“我们的合作覆盖多个领域,包括人工智能超级计算机、中央处理器、新型个人电脑以及机器人(15.870, 0.30, 1.93%)技术。此次会面就是为敲定相关规划。”

  黄仁勋:内存短缺将持续数年

  6月7日,黄仁勋时隔七个月举行“Kkanbu聚会”。他当天造访了首尔三成洞的Kkanbu炸鸡店,去年他曾在此与三星电子会长李在镕、现代汽车集团会长郑义宣共享炸鸡啤酒。此次,他与SK集团高管们共饮啤酒。

  据韩国媒体报道,黄仁勋一行与SK集团会长崔泰源、SK海力士社长郭鲁正、SK电讯社长郑载贤同席而坐。餐桌上摆放着炸鸡拼盘、凯利啤酒瓶和烧酒瓶。SK高管们手撕炸鸡,黄仁勋与他们碰杯共饮生啤。

  在店内交谈约30分钟后,黄仁勋向店外的记者分发炸鸡,崔泰源则分发SK海力士“HBM芯片”零食袋。崔泰源还为部分市民持有的半导体基板模型签名。

  黄仁勋对媒体记者表示:“我们的合作覆盖多个领域,包括人工智能超级计算机、中央处理器、新型个人电脑以及机器人技术。此次会面就是为敲定相关规划,明日或将公布具体内容。”他补充道,“托尼(崔泰源)和我是非常亲密的朋友。”

  谈及全球存储芯片短缺问题时,黄仁勋指出:“我预计这种情况还将持续数年。”他说,“整个行业供应链,从晶圆、封装到硅光模块等环节均供应不足,根源在于市场需求居高不下。这一紧缺状况还会持续数年。”

  黄仁勋与崔泰源会长并肩而坐的位置,正是去年11月他会见李在镕和郑义宣的同一地点,两人还进行了“交杯酒”仪式。

  与此同时,崔泰源将于当地时间6月8日上午8时30分在首尔钟路区瑞麟大楼与黄仁勋再次会面。SK集团相关人士透露:“这将是30分钟的会议,在私下会晤后说明英伟达与SK之间的合作方向。”

  另据NewSis报道,黄仁勋和崔泰源将于8日上午直接向媒体宣布“SK-NVIDIA”合作计划。

  谈及与李在镕的会面,黄仁勋表示:“他正在出差。”并补充道:“几周前他来加州看我,我们共进了愉快的晚餐。”黄仁勋还暗示将于8日与三星电子副会长全永铉会面,当被问及相关问题时回应:“我很期待与他见面。”

  英伟达将在韩国设立研发中心

  据外媒7日报道,英伟达将在韩国设立研发(R&D)中心,目前已开始招聘相关人才。该中心预计将成为英伟达加强与韩国人工智能(AI)技术合作的重要据点。

  据报道,英伟达未来计划与三星、SK、现代汽车、LG等韩国主要企业携手强化AI供应链,并在机器人(Robotics)和物理AI(Physical AI)领域展开合作。

  黄仁勋表示,他此行为韩国带来了“众多商业机会”这一惊喜礼物,同时首次公开了英伟达在韩国建设研发中心的计划。此前,业界曾预测,黄仁勋此次访韩可能推动英伟达在韩国建立AI相关研发中心,如今这一计划已被正式确认。

  黄仁勋表示:“我们已经开始招聘相关人才,并计划在新的园区持续扩大招聘规模。待人才储备达到一定规模后,我们将立即启动研发中心建设。”

  他指出,人工智能、机器人技术以及先进制造业环境,是英伟达决定在韩国设立研发中心的重要原因。

  6月5日,黄仁勋发布了芯片行业的重要消息:三大存储巨头——三星电子、SK海力士和美光科技均已获准供应英伟达下一代Vera Rubin平台所需的最尖端高带宽存储器。

  黄仁勋此次访问正值三星电子和SK海力士的存储芯片需求激增之际,这为韩国的经济增长提供了支撑。

  作为英伟达HBM产品的主要供应商,SK海力士上个月市值突破了1万亿美元,加入竞争对手三星电子和美国美光科技的行列。

  近日,英伟达首席财务官科莱特·克雷斯在美国银行全球技术会议上的发言中指出,随着新一代芯片的推出,英伟达认为其可触达市场(addressable market,即潜在市场规模 )有望翻倍。

  美国银行在克雷斯发表主题演讲后重申了对这家芯片制造商的“买入”评级及350美元的目标价,该目标价较周五(6月5日)收盘价有70%的上涨空间。

  美国银行的分析师维韦克·阿里亚在报告中写道,英伟达凭借其新创新获得的增长空间十分可观。他援引英伟达的预测称,每一代新系统都能显著扩大公司的可触达市场:从当前Blackwell Ultra的每吉瓦约400亿美元,到Vera Rubin和Rubin Ultra的每吉瓦600亿至800亿美元,再到Feynman的每吉瓦约1000亿美元。

 

  阿里亚指出,尽管具体数字可能存在差异,但英伟达每一代都在覆盖AI系统中更多的环节。阿里亚还将英伟达称为“多元化之王”,这得益于其同时为超大规模企业以及日益增长的AI云、工业和企业公司提供服务的混合业务结构。