前位置: 网站首页 > 财经产经 正文

  • 文章正文

超维视界硬核科技!人工智能数字人“Lucy”以假乱真

浙江企业新闻网  2019-05-23 15:55:39

人工智能数字人,顾名思义,即拥人工智能的可视化数字虚拟人。现如今,人工智能数字体人的市场需求极为广阔。在文化领域,通过娱乐营销,打造没有人设崩塌、不受场地时间以及精力限制的偶像艺人;在市场领域,可以成为AI形象进行代言,与品牌合作,提供应用场景所需要的形象;在服务领域,为特定交互服务提供场景交互服务的形象,比如银行、机场、医院、教育等场景。

作为人工智能虚拟人,本文的主人公Lucy是由超维视界(北京)传媒科技有限公司研发而成。她细腻的肌肤,灵动的眼神无限逼近真人,甚至可以说是到了以假乱真的地步。此外Lucy更具有人的情感模型与语音交互系统,如此,她便能够与正常人一样,自然沟通,与外界实时交互。

\

那么Lucy的背后又有哪些秘密呢?

超维视界的研发人员表示,打造Lucy的第一步就是完成口唇同步。口型同步的技术正在被越来越广泛地使用到动漫、游戏、电影、新媒体和交互应用之上。口型同步是一种利用计算机技术将2D或3D虚拟人物的口型匹配到语音之上,通过不断改变人物嘴部及脸部的形状,做出逼近真人说话的效果,并保证声音和画面准确匹配的技术。

\

第二步便是像人一样进行深度学习。Lucy人工智能机器学习的背后是基于深度学习的音素编码序列生成的虚拟人驱动参数算法。现在的主流算法是GMM-HMM(对HMM输出概率进行建模),但当面对更加复杂的语音识别环境时,GMM逐渐显示出建模能力不足的问题。据超维视界现有的研发成果显示,将深度学习应用于提取语音特征和取代GMM-HMM中的GMM模型非常成功,因此他们将持续把虚拟人的深度学习应用到语音识别当中。

\

此外,Lucy具有面部识别,情绪识别以及肢体模仿的功能,她对自然人声会话与75种语言翻译也极为擅长,通过精确的表情计算,Lucy可实现对面部表情实时完美驱动。研发团队进一步对Lucy的生动性、语音保真性、视觉保真性与匹配性进行了长时间的反复测试,并一步步地做到尽可能的无限接近真实。

\

Lucy的声音、长相与学习的背后皆是人工智能,她的功能涉及交互、翻译与教育等多个领域。软件银行集团董事长兼总裁孙正义认为,数字资产会成为人类最大的资产。随着科技的进步和市场的成熟,未来“数字分身”的普及率将大大提高,每个人都将拥有虚拟世界中的另一个自己,通过“感知、行为、认知”三个维度重建一个自己,在真正的数字时代到来之际,创造无限的可能。To see is to believe, to believe is to see.因为看见,所以相信,因为相信,所以看见。

\

据悉,成立于2018年的超维视界(北京)传媒科技有限公司是由资深研发、市场、管理与影视等诸多精英所组成的实力型团队,他们研发实力雄厚,中心优势显著。目前公司总部位于北京市朝阳区,“Lucy”背后的研发团队近30人,技术团队核心成员主要来自清华大学与北京大学,在信息科学技术、电子工程与软件与微电子等领域均有着多年的科研、开发经验与项目经历。

\

超维视界的创始人及CEO吕柯憬表示,计算机自动生成人像过程中,将加载上匹配角色特征、人物性格设定、AI流程科技等的复合系统,因此,虚拟人的真实感和画面的精细度,以及内容生产的智能化程度将成倍提升。

在人工智能虚拟人的科技史上,这是一次具有划时代意义的深远变革。在未来,每个人都会有一个“数字分身”,超维视界会让这项应用得到持续进化,让我们都有机会体验不一样的科技。

未来,值得期待。

[责任编辑:fyym]

分享到:

【相关链接】关于 新闻

网友评论:

已有0条评论

验证码: