执游网

搜狗击败讯飞阿里 获IWSLT国际口语机器翻译评测大赛冠军

  近日,在刚刚落幕的IWSLT(International Workshop on Spoken Language Translation)国际顶级口语机器翻译评测大赛上,搜狗击败讯飞、阿里巴巴, APPTEK(美国应用科技公司)、AFRL(美国空军研究实验室)以及KIT(德国卡尔斯鲁厄理工学院)等国际国内多个强劲对手,一举夺得了2018年IWSLT大赛Baseline Model(基线模型)赛道冠军,代表中国向世界彰显了AI领域的技术硬实力!

 

  这是搜狗继WMT 2017机器翻译顶级评测大赛夺冠之后,所摘得的又一翻译领域的技术桂冠。短期内连续登顶世界第一的位置,充分证明了搜狗在翻译行业特别是口语翻译领域已位居领先地位。

  IWSLT是什么比赛?

  IWSLT是国际最具影响力的口语机器翻译评测比赛,从2004年开始已经举办了15届。每届比赛都吸引了世界各地机器翻译领域的知名企业和研究机构参与,本届比赛吸引了讯飞、阿里巴巴等国内公司,爱尔兰ADAPT中心,美国约翰霍普金斯大学,德国卡尔斯鲁厄理工学院,芬兰赫尔辛基大学,英国爱丁堡大学,美国AppTek公司等多家国际知名大学、研究机构和公司参加。

  表2 IWSLT2018大赛参赛情况

  本届IWSLT 2018的口语机器翻译任务主要评测基于指定数据集从英语到德语的语音翻译能力,共分为Baseline Model(基线模型赛道)和End-to-End(端到端赛道)两个赛道,其中Baseline Model赛道主要评测语音翻译的流水线方案,输入语音先通过语音识别系统得到语音识别结果,之后将结果送入机器翻译系统获得译文,这也是业内最主流、效果最好的语音翻译解决方案,市场上商用机器同传、翻译机等语音翻译类产品几乎都采用了类似的方法;End-to-End则是本次评测新增设的赛道,主要鼓励参赛方探索基于神经网络的端到端语音翻译解决方案,希望能够输入语音,基于深度神经网络模型直接输出译文,这种方法目前仍处于早期研究阶段,受制于语音-文本平行语料难以大规模采集、算法研究不成熟等因素的限制,距离商用仍存在较大距离。本次评测中,在训练集、测试集相同的情况下,Baseline Model赛道最好的系统取得了28.09的BLEU(机器翻译质量评价指标,值越大代表翻译质量越好),而End-to-End赛道最好的系统仅取得了19.4的BLEU,较Baseline Model赛道相差8.69个BLEU,差距非常明显,也证明了Baseline Model赛道评测的算法仍是目前最可行和实用的解决方案。

  搜狗本次参加的是Baseline Model赛道的评测,并取得了第一名的好成绩。评测任务面向TED演讲和大会学术报告场景,测试集包括来自英国、欧洲、印度等各个国家的英语演讲者,存在噪声、口音、自由表达等复杂语音现象,同时语言中存在大量领域专有名词和口语化的表达(如:大量语气词、错误语法表达等),具有极强的实战意义和挑战性。最终,搜狗提交的系统BLEU值达到28.09,领先排名第二的科大讯飞1.6个BLEU,证明了搜狗在口语机器翻译领域强大的实力。

  AI赛道中持续发力,搜狗领跑语音翻译行业

  搜狗的AI战略蓝图之中,语言是最核心的重头戏。一直以来,搜狗都坚持着“自然交互+知识计算”的人工智能核心方向,并持续深耕技术,推动技术向产品的快速转化,2016年,搜狗发布了自有人机交互解决方案-知音引擎。拥有充足真实语料数据优势的搜狗,将语音识别与机器翻译技术相结合,并在2016年推出了全球首款商用AI同传系统-搜狗同传,引领了语音翻译技术的普及与应用。通过数百场的国际会议“实战”,搜狗同传获得了无数媒体和观众的好评,成为当下炙手可热的“AI字幕君”。

 

  与此同时,搜狗也推出了一系列的智能硬件,将语音翻译技术应用到了更广阔的场景之中,帮助用户打破了跨国交流时的语言困境。2018年3月,搜狗推出了搜狗旅行翻译宝,具备离线翻译功能与拍照翻译功能。作为首款智能翻译硬件,它支持42种语言对话翻译,解决了旅游场景中用户听不懂、看不懂、不会说等真实痛点。该项产品在京东平台首发当日即告售罄,首日销售额破千万。与此同时,搜狗还推出了录音翻译笔,提供录音转写、对话翻译、同声传译等功能,把AI同传落地到了消费级产品之中,开拓了语音翻译的新航道。

最热新游

中信证券:中国资产新叙事 科技制造大重估

  中国资产吸引力渐升,科技制造投资逻辑焕然一新。长期而言,中国前沿技术的关键突破有望重塑全球科技格局,以DeepSeek成功“出圈”为中国科技创新力量的缩影,国内投资者信心迎来重振,产业向高附加值加速转型。短期来看,恒生科技与纳指估值趋于收敛,全球资金因AI催化与美经济走弱,青睐高性价比的中国科技资产。投资逻辑从短期主题转向中长期产业深耕,科技研发从“负估值”成本转为“正估值”资产,继而引发系统性重估。DeepSeek以卓越性能、低成本和开源生态引领国内科技突破,改变全球对中国科技的预期。产业端,各行业加速AI与传统产业基础结合,解决实际问题并创造经济价值。市场端,科技制造板块春季尽显进攻性,推动资产价值重估。政策端,鼓励央国企科技制造并购,推动产业高质量发展。着眼未来,在新旧动能转换期,应把握中长期投资机遇,聚焦AI+、智能驾驶、人形机器人(20.000, 0.05, 0.25%)、低空经济、商业航天、生物制造、未来能源、半导体先进制程等科技制造领域。

  ▍中国资产吸引力提升,科技制造投资逻辑重塑。

  在外部科技封锁的严峻挑战下,中国前沿技术取得一系列关键突破,正重塑全球科技发展格局。DeepSeek成功“出圈”不仅极大提升了国内投资者的中长期风险偏好,更是对中国产业向高附加值转型升级的有力背书。伴随AI叙事持续催化叠加美国经济走弱,全球资金配置倾向正发生显著变化。中国科技资产凭借其高性价比、业绩预期上修潜力以及坚实的安全边际正成为全球资金青睐的新方向。随着AI等新技术成熟和新商业模式清晰,众多新兴产业迎来从导入期向成长期的关键跨越,推动中国科技投资逻辑从短期主题驱动向中长期产业深耕转型。在此过程中,科技研发支出也从以往的被视为“负估值”的成本项,转变为驱动增长的“正估值”资产。科技创新不仅将重构传统产业的底层运作逻辑,更有望引发组织形态、价值网络乃至社会契约的系统性变革,创造全新的产业发展机遇。

  ▍DeepSeek引领国内科技突破,推动市场风格及情绪积极转变。

  DeepSeek以优异的性能、显著下降的成本、开源生态引发“蝴蝶效应”,成为全球最热门的AI大模型,以一己之力,改变“美国AI断崖式领先”的预期,引发中国AI资产价值重估。我们认为,当前仍处于AI时代早期,以及中国科技资产重估的开端,DeepSeek将带来巨大产业影响:各行业纷纷加速垂类AI 应用探索,带来训练算力需求“脉冲式”增长,推理算力需求、大企业大模型本地部署需求亦高速成长。展望未来,预计美国仍将持续拉高AI的技术上限,中国更大的机遇在于将AI技术与传统产业基础结合,解决实际问题并创造经济价值。当前正值春季躁动窗口,科技板块以其卓越的高成长性与创新性,尽显极致进攻性。这种市场情绪与风格的转变,有望成为推动科技板块及中国底层资产价格重估的强劲动力,引领中国资产在科技制造领域开启价值重估的全新篇章。

  ▍政策赋能央国企科技并购,助力市值管理与科技强国。

  2024年以来,我国并购重组政策持续加码,各级政府纷纷加大支持力度,推动资本市场高质量发展。政策积极鼓励+产业高质量发展背景下,并购重组是满足当下政府、一级市场与二级市场利益的“最大公约数”。央国企凭借资源整合和资金优势积极参与并购重组,推动科技创新和产业升级。实证数据显示,并购重组对科技类央企市值提升具有显著正面效应,未来在政策支持和市场需求的驱动下,A股市场有望迎来新一轮并购潮,进一步推动科技强国战略的实施。

  ▍新质生产力发展提速,着眼中长期产业投资。

  我国正处于新旧动能转换期,产业升级换挡需求强烈,更应着眼于中长期维度的新兴产业突破。AI等新技术成熟和新商业模式清晰催化下,传统产业整合和新质生产力发展双双提速。结合当下国内外科技重点发展领域及我国国情,我们认为值得重点投资及关注的科技制造方向为:

  ①AI+:模型推理和成本不断优化,算力、应用及端侧发展趋势明朗;

  ②智能驾驶:预计2025年NOA加速渗透,比亚迪(396.410, 11.84, 3.08%)引领的智驾平权浪潮仍在继续;

  ③人形机器人:国内外共振的技术突破有望在2025年迎来产业奇点;

  ④低空经济:2025年政策基建加速落地,车链入局打造商业闭环;

  ⑤商业航天:2025卫星发射进入爆发期,中美星座建设竞速升级;

  ⑥生物制造:新质生产力重要一极,预计2025年迎来政策催化;

  ⑦未来能源:多种技术路径持续落地,有望多点开花;

  ⑧半导体先进制程:外部限制倒逼国内厂商积极扩产,自主可控及国产替代逻辑持续强化。

  ▍风险因素:

 

  宏观经济复苏不及预期风险;地缘政治摩擦加剧;产业政策不及预期;各行业内竞争加剧;中美冲突进一步激化;AI等核心技术发展不及预期风险;科技领域政策监管持续收紧风险;宏观经济波动导致企业IT支出不及预期风险;产业安全事故风险;企业AI应用进展不及预期等;国产替代进程不及预期;先进制程技术发展不及预期。