执游网

比AI视频换脸还可怕!DeepMind新AI可生成逼真视频

近日,DeepMind的研究人员研发了一个名叫Dual Video Discriminator GAN(DVD-GAN)的人工智能模型,该模型通过能够通过学习一系列的YouTube视频数据集,生成高度逼真且连贯的256 x 256像素视频,最长可达48帧。

  目前,DVD-GAN的研究成果已于美国时间2019年7月15日发表在arxiv上,名为《在复杂数据集上的高效视频生成(Efficient Video Generation on Complex Datasets)》。

  一、AI造假视频比造假图片更难

  最近,俄罗斯AI研究人员开发的FaceApp着实大火了一把,这款应用通过人工智能技术能够改变用户自拍照的年龄、外貌、发色和性别,甚至可以生成虚构的人物照片。这直接让人们近距离地感受了人工智能技术给我们的生活带来的乐趣。

  但是否有人想过,有朝一日这些技术也能应用在视频领域呢?

  如果说BigGAN是DeepMind在图像领域开发的能够生成高度逼真图像的图像生成器,那么DeepMind研究人员们开发的DVD-GAN,就是人工智能在视频剪辑生成领域的最新突破。

  研究人员在论文中表示,生成自然视频对生成式建模来说是一个较大的挑战,同时还会受到数据复杂性和计算需求增加的困扰。

  因此,之前业界的研究人员们在研究视频生成领域时,几乎都围绕着相对简单的数据集,或者采用有限的时间信息来降低任务的复杂程度。

  而这次,DeepMind的研究人员们主要针对视频合成和视频预测的任务,将生成图像模型的强大功能和逼真效果扩展到视频领域。

  二、DVD-GAN:基于BigGAN模型结构

  研究人员们基于BigGAN的模型结构,构建了DVD-GAN的系统,并引入了一系列用于视频生成的调整,使DVD-GAN能够在Kinetics-600上进行训练。

  Kinetics-600是一组由50万段10秒高分辨率的YouTube视频剪辑汇编而成的训练数据集,它最初是为识别人类动作而制作的,比目前其他常用的语料库还大一个数量级。

  同时,研究人员们表示,Kinetics-600具有多样化特征,能消除他们对过拟合(Overfitting)的担忧。过拟合主要是指机器学习时选择的模型所包含的参数过多,以至出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。

  另一方面,DeepMind的研究人员们利用生成对抗网络(GANs)来区分生成样本和真实世界样本,该网络主要由生成器和判别器两部分组成。

  GANs曾被应用在把文字转换成一幕幕的场景故事,或生成人造星系图像等任务中。而研究人员们这次使用的是名为BigGANs的生成对抗网络,该网络以大批量和数百万个参数而得名。

  值得一提的是,DVD-GAN包含两个判别器。一个是空间判别器(Spatial Discriminator:D_S),该判别器通过随机采样全分辨率帧并单独处理,以评估单个帧的内容和结构;另一个是时间判别器(Temporal Discriminator:D_T),它可以提供一个能生成动作的学习信号。

  此外,DVD-GAN还有一个单独的Transformer模块,它可以让学习信息在整合AI模型中传播。

  三、训练12至96小时即可生成视频

  研究论文表明,在经过Google第三代TPU训练了12至96个小时后,DVD-GAN可以成功地生成视频,这些视频内容包含了物体的组成和运动,以及各种复杂的纹理。

  不足的是,DVD-GAN生成的视频内容有时较为“诡异”,例如生成的物体和人形奇形怪状,甚至人体忽长忽短地变化。

  但研究人员指出,当把DVD-GAN放在UCF-101(一个包含13320个人类动作视频的较小数据集)上进行评估后,DVD-GAN生成的样本初始值最高为32.97。

  DeepMind的研究人员们希望能进一步强调在大型复杂视频数据集上训练生成模型的好处,例如Kinetics-600。

  “我们设想通过DVD-GAN在这个数据集上建立强大的基线,该基线将被用作未来建模生成领域的参考点。”研究人员表示,“尽管在不受约束的环境下持续生成逼真的视频还需要进行很多工作,但我们相信DVD-GAN是我们朝这个方向迈出的重要一步。”

  结语:用AI生成高度逼真视频的一次尝试

  不管是BigGAN还是FaceApp,以往的研究人员们在人工智能生成图像领域进行了许多具有突破性的研究,但在视频领域,除了AI换脸曾火了一把之外,并没有更多的突破性进展。

  而DeepMind的研究人员们基于BigGAN架构和Kinetics-600训练数据集开发的DVD-GAN,利用计算高效的判别器分解,扩展到时间更长、分辨率更高的视频。就目前来说,虽然这一成果还有些许不足,但这无疑是研究人员们利用AI生成高度逼真视频的一次重要尝试。

美国最受欢迎的苹果手机是iPhone XR:占总销售额48%

  7月23日上午消息,市场调研机构CIRP发布一则报告,报告中指出根据苹果公司第三季度销售情况,iPhone XR为最受美国群众喜爱的苹果手机。

  这份报告的主要内容是iPhone在美国的销售情况。在CIRP的数据中,苹果最新推出的iPhone产品系列,XR,XS和XS Max占该公司第三季度销售额的67%。而iPhone XR占同期苹果手机销售额的48%。这一比例高于iPhone 8 Plus和iPhone X去年同时期销售额的总和。

  CIRP合伙人兼联合创始人乔什·诺维茨(Josh Lowitz)表示:“相对于老款的iPhone 7和8来说,iPhone XR是一款新型的手机,而且它的价格还要低于iPhone XS和XS Max,所以iPhone XR是一个非常不错的选择。”

  iPhone 第三季度销售额对比图  除去最新的iPhone系列的销售状况。CIRP还发布了苹果服务与iPhone用户关系的最新数据。该公司发现,35%的iPhone用户注册了Apple Music, 48%的用户为iCloud服务买单。近30%的用户使用Apple Podcasts(苹果播客),15%的用户使用了Apple News和Apple TV。但是只有3%到6%的用户为他们的iPhone或iPad购买了AppleCare(延长保修服务)。

  iPhone用户选择服务付费比例  CIRP合伙人兼联合创始人Mike Levin表示:“服务的成功取决于竞争对手以及苹果公司的服务程度。例如,很长一段时间里苹果一直是少有的播客应用之一,所以iPhone用户使用该播客的人比较多。

 

  相比之下,Apple TV与Netflix等媒体视频服务竞争,普及率较低。尽管苹果多年来一直提供延长保修期,但移动运营商和百思买(Best Buy)等零售商也提供自己的和第三方的保修期,因此AppleCare的使用率要低得多。在苹果停止iTunes之后,Apple Music是其唯一的音乐服务,但其35%的市场份额仍然落后于Spotify和Pandora。”

电动牙刷销量暴增 未来市场规模超过500亿

  据了解,在今年的“618”电商年中大促中,电动牙刷扮演了黑马的角色,仅在天猫平台上,“618”开局的第一分钟就卖掉了14051支,16个小时销量破40万支。

  不知不觉,电动牙刷已成为了新的热门商品。相关数据统计,2019年1~4月,在淘宝天猫购买电动牙刷的消费者人数比去年同期增长了175%。

  据智研咨询此前发布的《2017~2022年中国电动牙刷行业市场供需预测及投资战略研究报告》预估,中国电动牙刷市场2020年的市场规模将达500亿元。2018年电动牙刷消费者调查结果显示,57.6%的消费者是女性,以中青年为主,21~30岁的消费者比例接近一半,收入水平主要集中在每月3000元到7000元。

  越来越多的人选择电动牙刷  据了解,今年以来电动牙刷销量上涨还要多亏是三四线以下城市的消费者,从数据显示,2019年三四线及以下城市消费者购买电动牙刷的人数比去年同期增长了228%,增速几乎达到全国消费者增速的1.5倍。

 

  电动牙刷的市场越来越大,但是要注意刷牙的时候还要注意,不要震动过大导致牙龈出血的情况。

Infocomm China 2019,讯飞转写机再成焦点

  2019年7月17-19日,北京Infocomm China 2019在北京国家会议中心顺利举行。展会吸引了数万名业内人士与垂直市场的最终用户入场参观。InfoComm China 展会致力于提高中国专业视听和交互体验式通信技术市场的专业水平和知名度,已成为亚太地区专业视听和交互体验式通信技术业内商家、厂商和来自各垂直行业最终用户汇集的首选及最重大的平台。讯飞转写机2018年在此展会上华丽亮相后,今年继续参加到此展会中。

  讯飞转写机在会前邀请了业内集成商、工程商到场参加。同时,现场参观的客户对于讯飞转写机“全离线”的转写效果以及强大的应用功能都表现出浓厚的兴趣。

  讯飞转写机是一款专业的离线语音转文字设备,集实时转写、非实时转写、同步翻译、多种方言识别、行业语言模型等众多领先技术于一体,拥有讲话速记、演讲记录、字幕上屏、录音文件转写等核心功能,操作简单,使用方便。

  讯飞转写机

  一小时的会议,5分钟出稿,会议纪要素材马上到手,讯飞转写机可以同步记录各种讲话。同时,还可以把领导的讲话,全部标注出来,不用担心会遗漏领导的讲话。讯飞转写机还可以把培训材料,浓缩成一个二维码,手机一扫,即可看到关键的PPT、对应的文字,听到现场的声音。大大提高大家接受信息的效率。针对涉外沟通的场景,只需要从原来的大屏幕中引出一根视频线,插在转写机上,然后再从转写机上引出一根视频线插回屏幕,会议字幕和翻译一下就都有了。关键的信息,从语音秒变成文字,开会效率大大提高。

 

  讯飞转写机还支持中英文混合识别、拥有“语音+图像”同步智能识别,识别结果更精准;内置的“全离线”语音技术,让老板再也不用担心数据安全问题。

小米众筹四周年,小米有品推出吉祥物形象

  7月16日,是小米众筹4周年的纪念日。在过去的4年时间里,小米众筹共众筹成功370期项目,累计参与人次超过200万,映趣剃须刀、大方1080P高清云台摄像机、小方智能摄像机等十款产品占据了销量TOP10,速珂CU智能锂电车、多亲AI功能电话等十款产品荣登支付金额TOP10榜单。

  今日,在小米众筹4周年之际,小米有品的吉祥物-长颈鹿“奇奇”也正式揭开了神秘的面纱。官方介绍称,长颈鹿“奇奇”之所以能够从众多吉祥物里脱颖而出,是因为它代表了“高”。一来长劲鹿本身个子高,拥有高视野可以看向新奇远方,“生来好奇”的天性与小米众筹的理念十分契合;二来也寓意着有品的“高科技感”、“高颜值”、“高性价比”的产品属性。

  从材质上来看,纪念版长颈鹿“奇奇” 由铜师傅生产制造,特A级实心精黄铜打造,表面采取真金鎏镀工艺,经过泥雕、蜡模、浇铸、打磨等多道繁复工序细致锤炼,最终纯手工打磨而成。除此之外,长颈鹿的底部刻有“小米有品吉祥物 众筹4周年纪念版”字样,给予众筹参与者满满的仪式感。

 

  作为小米有品中的明星栏目,小米众筹一直是探索新奇酷、黑科技的阵地。扫拖一体的扫地机器人、可自动感应出泡的洗手机、感应开盖自动打包的智能垃圾桶等都是小米众筹的爆款商品,也因此让更多高端产品走进千家万户。不少米粉也表示,是小米众筹让他们体验到了更智能、更便捷的生活方式。

最热新游

美国股市:标普500指数七连涨 市场看好脆弱的停火有望维持

  华尔街交易员推动美股走高,以色列同意与黎巴嫩直接谈判提振了市场对停火协议能够维持的预期。

  美股连续第七个交易日上涨,标普500指数创10月以来最长连涨。

  随着对人工智能颠覆性影响的担忧持续,软件股出现抛售。

  德克萨斯州太平洋土地公司大跌16%,其最大持股公司的CEO离世。

  亚马逊(233.65, 12.40, 5.60%)走高,此前该公司CEO致股东的一封信被视作确认了公司在人工智能领域的潜力,并为其在该技术上的大规模投入提供了依据。

  美国和伊朗同意停火两周后,双方准备在巴基斯坦举行和谈,但以色列攻击黎巴嫩以及霍尔木兹海峡的开放等问题仍未得到解决。

  以色列总理内塔尼亚胡同意与黎巴嫩举行直接会谈,重点是解除与德黑兰结盟的真主党武装。据NBC报道,特朗普已要求以色列缩减袭击,以确保与伊朗的谈判取得成功。

  “对市场而言,没什么比停火协议的持久性、霍尔木兹海峡的航运量以及最终能否达成真正的永久协议重要,”Janus Henderson Investors的Bradford Smith说。

  eToro的Bret Kenwell表示,最新数据尚未反映近期能源价格飙升的情况,但周五的消费者价格指数将会捕捉到其中的一些影响。

  周四另一份报告显示美国持续申领失业金人数降至接近两年来最低水平,进一步证明了劳动力市场企稳。

  LPL Financial的Jeff Roach表示,“我们看到申请失业金的人数仍然很低。尽管经济增速放缓,但劳动力市场保持稳定,这给了美联储一些时间去观望并履行其双重使命。”

  截至收盘,标普500指数上涨0.6%,报6824.66点。

  道琼斯(48185.8008, 275.88, 0.58%)工业平均指数上涨0.6%,报48185.8点。

 

  纳斯达克(22822.4171, 187.42, 0.83%)综合指数上涨0.8%,报22822.42点。