执游网

比AI视频换脸还可怕!DeepMind新AI可生成逼真视频

近日,DeepMind的研究人员研发了一个名叫Dual Video Discriminator GAN(DVD-GAN)的人工智能模型,该模型通过能够通过学习一系列的YouTube视频数据集,生成高度逼真且连贯的256 x 256像素视频,最长可达48帧。

  目前,DVD-GAN的研究成果已于美国时间2019年7月15日发表在arxiv上,名为《在复杂数据集上的高效视频生成(Efficient Video Generation on Complex Datasets)》。

  一、AI造假视频比造假图片更难

  最近,俄罗斯AI研究人员开发的FaceApp着实大火了一把,这款应用通过人工智能技术能够改变用户自拍照的年龄、外貌、发色和性别,甚至可以生成虚构的人物照片。这直接让人们近距离地感受了人工智能技术给我们的生活带来的乐趣。

  但是否有人想过,有朝一日这些技术也能应用在视频领域呢?

  如果说BigGAN是DeepMind在图像领域开发的能够生成高度逼真图像的图像生成器,那么DeepMind研究人员们开发的DVD-GAN,就是人工智能在视频剪辑生成领域的最新突破。

  研究人员在论文中表示,生成自然视频对生成式建模来说是一个较大的挑战,同时还会受到数据复杂性和计算需求增加的困扰。

  因此,之前业界的研究人员们在研究视频生成领域时,几乎都围绕着相对简单的数据集,或者采用有限的时间信息来降低任务的复杂程度。

  而这次,DeepMind的研究人员们主要针对视频合成和视频预测的任务,将生成图像模型的强大功能和逼真效果扩展到视频领域。

  二、DVD-GAN:基于BigGAN模型结构

  研究人员们基于BigGAN的模型结构,构建了DVD-GAN的系统,并引入了一系列用于视频生成的调整,使DVD-GAN能够在Kinetics-600上进行训练。

  Kinetics-600是一组由50万段10秒高分辨率的YouTube视频剪辑汇编而成的训练数据集,它最初是为识别人类动作而制作的,比目前其他常用的语料库还大一个数量级。

  同时,研究人员们表示,Kinetics-600具有多样化特征,能消除他们对过拟合(Overfitting)的担忧。过拟合主要是指机器学习时选择的模型所包含的参数过多,以至出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。

  另一方面,DeepMind的研究人员们利用生成对抗网络(GANs)来区分生成样本和真实世界样本,该网络主要由生成器和判别器两部分组成。

  GANs曾被应用在把文字转换成一幕幕的场景故事,或生成人造星系图像等任务中。而研究人员们这次使用的是名为BigGANs的生成对抗网络,该网络以大批量和数百万个参数而得名。

  值得一提的是,DVD-GAN包含两个判别器。一个是空间判别器(Spatial Discriminator:D_S),该判别器通过随机采样全分辨率帧并单独处理,以评估单个帧的内容和结构;另一个是时间判别器(Temporal Discriminator:D_T),它可以提供一个能生成动作的学习信号。

  此外,DVD-GAN还有一个单独的Transformer模块,它可以让学习信息在整合AI模型中传播。

  三、训练12至96小时即可生成视频

  研究论文表明,在经过Google第三代TPU训练了12至96个小时后,DVD-GAN可以成功地生成视频,这些视频内容包含了物体的组成和运动,以及各种复杂的纹理。

  不足的是,DVD-GAN生成的视频内容有时较为“诡异”,例如生成的物体和人形奇形怪状,甚至人体忽长忽短地变化。

  但研究人员指出,当把DVD-GAN放在UCF-101(一个包含13320个人类动作视频的较小数据集)上进行评估后,DVD-GAN生成的样本初始值最高为32.97。

  DeepMind的研究人员们希望能进一步强调在大型复杂视频数据集上训练生成模型的好处,例如Kinetics-600。

  “我们设想通过DVD-GAN在这个数据集上建立强大的基线,该基线将被用作未来建模生成领域的参考点。”研究人员表示,“尽管在不受约束的环境下持续生成逼真的视频还需要进行很多工作,但我们相信DVD-GAN是我们朝这个方向迈出的重要一步。”

  结语:用AI生成高度逼真视频的一次尝试

  不管是BigGAN还是FaceApp,以往的研究人员们在人工智能生成图像领域进行了许多具有突破性的研究,但在视频领域,除了AI换脸曾火了一把之外,并没有更多的突破性进展。

  而DeepMind的研究人员们基于BigGAN架构和Kinetics-600训练数据集开发的DVD-GAN,利用计算高效的判别器分解,扩展到时间更长、分辨率更高的视频。就目前来说,虽然这一成果还有些许不足,但这无疑是研究人员们利用AI生成高度逼真视频的一次重要尝试。

最热新游

凡事尽力而为,结果顺其自然

  今天是春节最后一天假期,对于很多年轻人来说,心情可能是复杂的。

  想放假休息吃喝玩乐,但是呆在家里难免被家长说一些自己不喜欢的话题,比如催婚或者事业进展等问题。

  每年的春节也是相亲旺季,平时天南地北的年轻人都回到老家,十里八乡的就有了撮合见面的机会,可能七大姑八大姨早早就计划好了安排谁谁谁了解一下。

  年轻人不愿意结婚生小孩,很多人觉得是经济问题导致的,其实不是,是社会观念的原因,这股观念起源于城市,现在风靡全国。

  房贷压力和养育小孩的压力,这只是表象,以前男女到了适婚年龄,就会很自然的经过媒妁之言组建家庭,生三五个孩子是常规现象,生八个十个也不算什么。

  那个年代温饱都是问题,但是丝毫不影响人口增长,为了让人们少生,计划生育都出来了,而且非常严格,公职人员如果超生了,会被处分,普通人家超生了,那就是罚款。

  一直到2016年,才允许生二胎,到2021年,才彻底取消超生罚款,你看才过去几年。

  数据的变化更直观,10年前,每年新生儿都有1600万左右,而去年新生儿数量跌破800万,是真的腰斩,而且可能还会持续下跌。

  十年前,你不要我生,我偏要生,罚款都要生,五年前可以生了,但是我不怎么想生了,到今天,你鼓励我生,我偏不生,生一个补贴一万,给我钱也不生。

  你看这个观念转变有多快,几年时间就大部分年轻人统一认同了这个观念,很大一个原因是信息太发达了,而社会又出现了巨大的割裂。

  改革开放后,社会财富和资源逐渐开始集中,经过几十年的演变,分化越来越严重,有成就的一代普遍看不起自己的后代,年轻人自己也越来越难以在社会找到自己的价值。

  极端一点比如曹德旺,他那几个儿子看到他就跟老鼠看到猫一样,还有大量企业主,一边望子成龙望女成凤,一边看着子女各种不满,觉得哪都比不上自己当年,这个我见过太多了。

  至于普通人家,以前觉得读书是出人头地最好的出路,但是后来发现遍地都是大学生,毕业之后同样很难找到自己满意的工作。

  所以年轻人迷茫了,我能做什么?我的未来在哪里?

  有一部分人不愿意面对现实,选择考公务员或者考研,就算考不上,也要多考两年,至少能晚一点进入社会。

  还有一部分人在社会流浪,不知道明天何去何从,没有明确的目标和执行路径,频繁换工作甚至换城市,当然还有一部分干脆就不工作,直接啃老了。

  这是现在很多年轻人的现状,有人说一代不如一代,其实这是不对的,这一代年轻人不是比不上前人,而是他们面临的竞争更激烈。

  改革开放的时候遍地商机,无数人下海经商,所以催生了下海潮,而且大部分确实发家致富了,那个时候拼的是胆量。

  这是新中国第一波商业浪潮,第二波是大众创新万众创业,主要是八零后和九零后这代人,他们抓住GDP高速增长的尾巴,也抓住了互联网这波机会。

  我还记得当年的盛况,我那个时候在上海,只要愿意,每天都有参加不完的路演,无数创业者怀揣梦想,带着他们的Demo或PPT希望找到投资

  成功的也非常多,但那个时候失败率就已经很高了,创业公司生存概率不足5%。

  那个时候觉得95%以上的淘汰率很残酷,放在今天看来,好像也还好,现在创业门槛已经非常高,甚至很难找到一个自己认为很有想象空间的事情,因为好像每个事情都人满为患。

  而且越到后面这个现象会越突出,因为人工智能时代又要来了,本来就僧多粥少,人工智能一定会取代大量岗位。

  这次回老家过年,我就发现无人快递车都已经跑在乡下的路上了,虽说我早就知道这个事,但亲眼所见,还是有点唏嘘。

  如果未来不需要那么多人送快递了,不需要那么多人送外卖了,不需要那么多人开出租车了,你们知道这会减少多少工作岗位吗?

  实现这一点很难吗?要说人形机器人走进千家万花还为时尚早,但是现在L3已经放开了,距离L4真的很远吗?

  我就不制造焦虑说其他行业了,新技术催生的新岗位是有限的,和淘汰的传统岗位相比,一定是不成正比的,否则新技术也就没价值。

  你看粥越来越少,僧减少也就是必然的了,这是不愿意结婚生子的最底层原因,也符合物竞天择适者生存的规律。

  在这种现状的催化下,年轻人逐渐回归到自己身上,去年不是很流行一个词叫“爱你,老己”吗,爱自己成为了年轻人的价值观。

  既然主要是爱自己,当然没空去爱别人,对于年轻人来说,老婆孩子都是别人,我自己都顾不上,哪能顾得上别人,这是和传统观念最大的区别。

  这是客观存在的因素,不是年轻人的问题,但是有一个风气我觉得不是很妥,以前努力干活叫劳动光荣,现在努力干活叫“牛马”。

  认为自己是牛马这个事情,我是经常批评的,这是主观上的自暴自弃,现在的竞争程度确实比以前要大很多,但并不是完全没机会。

  即便是此时此刻,只要是一个正常人,愿意选择一个事情,扎下去做十年,我并不觉得十年后就会没成果,极大概率是会有很大收获的。

  当然前提是要真努力,不是完成任务,或者三天打鱼两天晒网。

  而且我始终觉得不以成败论英雄,也就是不管结果怎么样,你得从思想和行动上都尽全力去做。

  很多人之所以迷茫或者痛苦,根源是着重点弄反了,太注重结果,过程反倒或多或少的注水,如果没有获得及时回馈,就会忽视过程,甚至动摇初心,大概率就会自我怀疑,最后中途放弃。

  这一点年轻人比上一代要差一些,上一代韧性要更强一些,可能因为吃苦更多一些,因为他们毕竟经历了物资短缺的时代。

  当然年轻人也有优秀的,比如昨晚赵心童和希金斯的决赛,赵心童夺冠后采访的时候说,他热爱台球,享受比赛。

  我相信他说的是真话,因为他有这样的心态,所以才拿到这么好的成果。

  现在的年轻人创新能力更强一些,思维更跳跃富有个性,但是也比较极端,要么干脆躺下,要么生活快节奏,感情快节奏,工作快节奏,什么都想快速拿到结果,投资也想短时间高收益。

  你看,从这个角度来说,成功的赛道并不拥挤,因为走的人少。

  条条大路通罗马,既然客观上其他赛道很拥挤,那就换一条不拥挤的嘛。

  任何事情,你把时间拉长去看,真的会不一样,你们都是经历了股市或长或短时间的,你们自己去回顾股市的表现,不就是涨多了就跌,跌多了就涨,没别的了。

  实际上如果真有10年的心态,结果一定用不了那么久,很多事情两三年就会有比较好的收获,就算是股市,也就几年轮回一次。

  凡事尽力而为,结果顺其自然,你会过得很幸福。

 

  我对优秀公司的看法和平时的交易操作计划,放在专栏里面,公司的估值请参考下面这个《A+H股核心资产研究汇总》表。