执游网

搜狗击败讯飞阿里 获IWSLT国际口语机器翻译评测大赛冠军

  近日,在刚刚落幕的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛上,搜狗击败讯飞、阿里巴巴, APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等国际国内多个强劲对手,一举夺得了2018年IWSLT大赛Baseline Model(基线模型)赛道冠军,代表中国向世界彰显了AI领域的技术硬实力!

 

  这是搜狗继WMT 2017机器翻译顶级评测大赛夺冠之后,所摘得的又一翻译领域的技术桂冠。短期内连续登顶世界第一的位置,充分证明了搜狗在翻译行业特别是口语翻译领域已位居领先地位。

  IWSLT是什么比赛?

  IWSLT是国际最具影响力的口语机器翻译评测比赛,从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,本届比赛吸引了讯飞、阿里巴巴等国内公司,爱尔兰ADAPT中心,美国约翰霍普金斯大学,德国卡尔斯鲁厄理工学院,芬兰赫尔辛基大学,英国爱丁堡大学,美国AppTek公司等多家国际知名大学、研究机构和公司参加。

  表2 IWSLT2018大赛参赛情况

  本届IWSLT 2018的口语机器翻译任务主要评测基于指定数据集从英语到德语的语音翻译能力,共分为Baseline Model(基线模型赛道)和End-to-End(端到端赛道)两个赛道,其中Baseline Model赛道主要评测语音翻译的流水线方案,输入语音先通过语音识别系统得到语音识别结果,之后将结果送入机器翻译系统获得译文,这也是业内最主流、效果最好的语音翻译解决方案,市场上商用机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法;End-to-End则是本次评测新增设的赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文,这种方法目前仍处于早期研究阶段,受制于语音-文本平行语料难以大规模采集、算法研究不成熟等因素的限制,距离商用仍存在较大距离。本次评测中,在训练集、测试集相同的情况下,Baseline Model赛道最好的系统取得了28.09的BLEU(机器翻译质量评价指标,值越大代表翻译质量越好),而End-to-End赛道最好的系统仅取得了19.4的BLEU,较Baseline Model赛道相差8.69个BLEU,差距非常明显,也证明了Baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。

  搜狗本次参加的是Baseline Model赛道的评测,并取得了第一名的好成绩。评测任务面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,存在噪声、口音、自由表达等复杂语音现象,同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。最终,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,证明了搜狗在口语机器翻译领域强大的实力。

  AI赛道中持续发力,搜狗领跑语音翻译行业

  搜狗的AI战略蓝图之中,语言是最核心的重头戏。一直以来,搜狗都坚持着“自然交互+知识计算”的人工智能核心方向,并持续深耕技术,推动技术向产品的快速转化,2016年,搜狗发布了自有人机交互解决方案-知音引擎。拥有充足真实语料数据优势的搜狗,将语音识别与机器翻译技术相结合,并在2016年推出了全球首款商用AI同传系统-搜狗同传,引领了语音翻译技术的普及与应用。通过数百场的国际会议“实战”,搜狗同传获得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕君”。

 

  与此同时,搜狗也推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,帮助用户打破了跨国交流时的语言困境。2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能。作为首款智能翻译硬件,它支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。该项产品在京东平台首发当日即告售罄,首日销售额破千万。与此同时,搜狗还推出了录音翻译笔,提供录音转写、对话翻译、同声传译等功能,把AI同传落地到了消费级产品之中,开拓了语音翻译的新航道。

最热新游

抢抓市场先机 权益类基金建仓按下“加速键”

  本报记者 方凌晨

  近期,多只新成立权益类基金的单位净值悄然发生变化,基金经理们正在积极建仓。

  Wind资讯数据显示,截至6月19日,6月份以来新成立的权益类基金已有47只。值得注意的是,多只成立时间不足半个月的基金已步入建仓阶段,单位净值发生了变动。在业内人士看来,当前政策层面的大力支持推动了市场估值逐步修复,A股市场结构性投资机会丰富,基金经理正抓紧时机加速建仓。

  一般而言,在基金成立之后,基金经理会根据市场情况、投资策略等情况把握建仓节奏。根据相关规定,基金管理人应当自基金合同生效之日起六个月内使基金的投资组合比例符合基金合同的有关约定。

  深圳市前海排排网基金销售有限责任公司公募产品运营曾方芳在接受《证券日报》记者采访时表示,近期基金经理加速建仓、积极布局A股市场的原因主要有两方面。一是政策层面持续释放积极信号,为中国资产营造良好的修复空间;二是在政策支持下,新兴产业展现出强劲的发展潜力,市场结构性投资机会日益凸显。

  基金单位净值的波动反映出基金经理的积极建仓动作。以成立于6月4日的汇添富中证油气资源ETF发起式联接为例,6月6日,汇添富中证油气资源ETF发起式联接A份额的单位净值从此前的1元变为1.0012元。近期受到市场关注的医药医疗主题基金也积极建仓,抢抓市场机会。例如,成立于6月4日的宝盈创新医疗(13.050, -0.54, -3.97%)混合发起式,6月13日单位净值变为1.0006元。

  为了抓住建仓良机,部分基金发行、成立等环节也在提速。例如,永赢制造升级智选混合发起募集期为6月3日至6月9日,募集结束后于6月11日迅速成立,随后便开启积极建仓模式。此外,还有部分基金提前结束募集,这在很大程度上也出于把握市场机会、加速开启投资运作的考虑。

  业内人士认为,目前市场上结构性机会丰富。

  从新消费领域来看,德邦基金资深研究员江杨磊认为,展望未来,除了潮玩之外,文化产业“出海”也有望成为新的发展趋势之一。影视、音乐、游戏等多元文化内容在传播过程中,具备更强的适应性,或将催生出更多投资机会。

  科技板块方面,摩根士丹利基金权益投资部总监、大摩数字经济基金经理雷志勇表示:“近期全球人工智能关注度回升,算力产业链标的估值也明显恢复。可以看到,无论是需求端还是供应端,算力板块都呈现持续高景气的状态。在AI大模型、AI Agent(智能体)持续在B端、C端渗透的背景下,人工智能尤其是算力板块,将持续具备投资价值。”

 

  这些新成立的基金持仓情况尚无披露,投资者在投资时该如何把握?曾方芳建议,投资者可从三方面着手选择基金产品。首先,投资者需要评估自身的风险承受能力、投资周期及财务状况,选择与个人投资目标及风险偏好相匹配的基金产品;其次,投资者可以深入分析基金的投资策略与目标,通过仔细研读基金合同等公开资料,了解基金的投资目标、投资范围、风险收益特征等;最后,投资者应考察基金管理人的综合实力,包括过往产品业绩表现、旗下优质产品数量、评级稳定性,以及基金经理的投资风格与过往业绩等核心要素。