百度“小灵”首秀,AI为何能赚足眼球?

来源:橘子装修网 - 家居风水 时间:2020-05-12 10:16

内容摘要:​百度大脑在检测到人脸后,对人脸进行分析,对眼、耳、鼻嘴等150个关键点进行定位,识别出人的年龄、性别、表情等,然后基于这些面部特征,用深度学习的算法去学习归纳,学习人类的表情,使得表情更加丰富自然,便形成了我们看到的人工智能虚拟主持人“小灵”在晚会上能够“真实唇动”。

今年是“五四运动”一百周年,中央政府电视广播总服务台举行了主题风格为“我们是追梦人”的 2019《五月的鲜花》五四晚会,在这次晚会节目中,百度大脑AI虚拟主持人“小灵”在诸多颜值爆表节目主持人、知名演员中出类拔萃,赚足了粉丝们的目光。

眼前一亮清纯少女

在许多的印像之中,智能机器人仅仅十分机械设备的设备与数据信息的融合,可是从花束安全通道中一出场的虚拟主持人“小灵”,就要人眼前一亮,归功于百度强劲的3D建模技术性和AR能力,化身为变成立体式三d的清纯少女,与尼格买提、易烊千玺同场比赛。

开朗动感开口脆

百度“小灵”首秀,AI为何能赚足眼球?

“小灵”并不是是第一位人工智能技术节目主持人,可对比于不取悦的设备音,“小灵”的音质看起来当然许多,令人听着有一种舒适度,缘故取决于百度在AI语音库的制做上花了挺大的时间。AI语音库制做的流程大约是三步:第一先明确音质、设计风格、商品的特点,将文字变为声频;第二配音演员依据要求试音,搜集音频;第三步资金投入生产流水线,开展音频实际效果提升,丰富多彩音质。百度大脑因此提前准备了几十个音库,找播音与主持技术专业的学员技术专业视频录制了各种各样的响声,具有比较丰富的音质引流矩阵。

小表情唇动显当然

除开响声信息内容外,唇动视觉效果一样十分关键。人的小表情由脸部肌肉和唇动相互构成,而人到不一样的场所、情绪的小表情各有不同,将会一些情况下大家都不可以把一些小表情开展恰当的归类,可是“小灵”能够保证。百度根据“很多的脸部特点数据信息”出示了唇动技术性,百度称作“中国第一家三维”唇动“指数预测分析”,能够保证“全自动将键入式声频立即转化成嘴形动漫”。百度大脑在检验到面部后,对面部开展剖析,对眼、耳、鼻嘴等150个关键环节开展精准定位,鉴别出人的年纪、性別、小表情等,随后根据这种脸部特点,用深度神经网络的优化算法去学习梳理,学习培训人们的小表情,促使小表情更为丰富多彩当然,便产生了大家见到的人工智能技术虚拟主持人“小灵”在晚会节目上可以“真正唇动”。

以往AI虚拟形象在讲话的情况下嘴唇一张一合,讲话与嘴唇不配对也令人觉得十分难堪。百度大脑根据很多的脸部特点数据信息,对讲话人的唇动的个人行为特点开展了很多的科学研究,根据人工智能技术的深度神经网络,完成了中国第一家“唇动”指数预测分析。截止到现阶段,目前市面上只能百度能够全自动将键入式声频立即转化成嘴形动漫。

专业知识累积超丰富多彩

在晚会节目上,“小灵”会和观众们调侃“假如欢呼声再热情一点,我能有更优异的主要表现”。也有那样一个情景:谈起自身的“第一部卡通片” ,主持人小尼要想共享《喜洋洋灰太狼》,“小灵”却切断他:“小尼哥,它是零零后的童年记忆,属于你的应该是《黑猫警长》、《葫芦兄弟》。”

百度“小灵”首秀,AI为何能赚足眼球?

百度“小灵”首秀,AI为何能赚足眼球?

“小灵”巧舌如簧的演讲口才、极好的场控能力,不可多得整场最精彩纷呈的地区。这一身后,必须即时互动交流与了解,更必须“专业知识”,而这与百度的人工智能技术优化算法和超出千亿元级的知识图谱不无关系。

百度知识图谱借助大量的系统日志数据信息、网页页面数据信息和行业报告,综合性应用词义了解、专业知识发掘、专业知识融合与补齐等技术性,提炼高精密专业知识,并机构成图普,从而根据知识图谱开展了解、逻辑推理和测算等,在这个基础上,适用百度诸多商品,而且扩展出普遍的应用领域。据了解,知识图谱早已助推DuerOS(会话式人工智能技术系统软件)完成10大品类超出100种能力,为智能音响、智能电视机等各种终端设备产生全方位精确的人机交互技术问与答能力。

知识图谱还能依据现有专业知识开展逻辑推理。比如,依据“发生爆炸或是点燃化学物质和设备不能随身携带飞机场”、“乙醇是发生爆炸或是点燃化学物质”这两个专业知识,推论乙醇不能随身携带飞机场,当客户键入查寻以后,将立即意见反馈推论結果。知识图谱的扶持,完成客户与运用中间更智能化的互动。

人机交互技术AR

在百度APP小灵AR页面上,例如“北大红楼名字的来历”等五四主题,“小灵”都能够巧舌如簧。在现场及其百度APP“五四青年节”百度搜索页都能参加的“根据面部识别来测是什么花”主题活动,观众们还能够根据百度APP扫描二维码,让小灵立即出現在观众们的手机屏上,完成即时互动交流,这全是借助于百度AR Lab(百度增强现实技术试验室)。百度AR在2020年的开发人员交流会上发布了DuMix AR 3.0,在MVP一部分界定情景,随后对內容开展认知,依据不一样规定开展展现,对总体目标开展追踪,最终根据面部小表情、身体手式、视频语音等开展人机交互技术,随后应用服务平台专用工具对素材图片开展制做管理方法,进行发布,最终进到产品化经营。百度AR Lab的业务流程已普遍遮盖营销推广、游戏娱乐、文化教育、文化艺术等各行各业。

不得不承认,“小灵”在晚会节目上机敏又技术专业的首次亮相可以说吸粉成千上万。而这一切,都不可或缺百度大脑的多种AI技术性的强劲支撑点。目前为止,百度大脑AI开发者平台对外开放了171项技术性能力,涉及到智慧城市、智慧课堂、自动驾驶等诸多行业。

说到AI开发者平台,当然免不了腾迅。前不久,2019“AI Everything Summit”高峰会在阿联酋迪拜国际贸易中心举办,腾迅集团公司高級实行高级副总裁刘胜义意味着腾迅参加高峰会并发布主题风格演说,明确提出“AI善行”的发展理念,他强调,在人工智能技术的时期,“人”至关重要,“AI善行”将协助人们提高生活质量,为社会经济发展造就新的将会。腾迅不断探寻将人工智能技术关键技术于找寻失踪工作人员,打造出“会寻找亲人的AI”;在健康医疗行业,腾迅着眼于打造出“会救人的AI”;而且投身“AI+农牧业”的运用探寻,在食材、电力能源和水源等难题上出示自主创新处理构思。

无论运用的行业怎样,每家公司全是以“人”为立足点,从本身的遗传基因考虑找寻适合的突破口,运用AI协助人们提高生活质量,明确提出制造行业解决方法。坚信百度和腾迅也会胆大试着,探寻大量将会。

网友评论
暂无评论...
取 消

Copyright © 2008-2019 橘子装修网 All Rights Reserved