| 频道 | 直播 | 专题 视频
您现在的位置: 首页 > 微纵科技 > 微纵企业>百度发AI输入--人机交互智能时代下的革新

百度发布"AI输入"人机交互智能时代下的革新

原创作者:王向瑞出处:微纵企业2018-01-19 17:50

  西装革履,黑色墨镜下可透过眼膜识别分析数据,这种在好莱坞大片里才能看到的场景,离我们远吗?在AI智能时代,技术驱动智能产品的发展,智能硬件结合大数据分析下的产物也许离我们不再遥远。最先到来的一定是基本用户需求下催生的AI应用,1月17日,百度输入法在北京发布“AI输入”,让我们基于输入法落地的AI功能,开启全感官输入时代。

百度发布“AI输入”人机交互智能时代下的革新
百度副总裁、AI技术平台体系(AIG)总负责人王海峰为发布会致辞

  此外,作为此次发布会的亮点之一,百度语音技术部总监高亮,在大会上发布了百度语音技术的最新突破——Deep Peak 2模型。该技术全称为“基于 LSTM 和 CTC 的上下文无关音素组合建模”,该模型突破了沿用十几年的传统模型,能够更充分地发挥神经网络模型的参数优势,大幅提升中英文、多种口音、多种风格(如朗读、聊天、轻声)混合输入的识别准确率,聊天场景下的相对正确率较行业领先水平提升20%,让机器更轻松适应用户的自然对话。

  此前,百度“实时语音识别上屏技术”就曾在2017年百度世界大会上收获诸多关注,而此次应用了最新Deep Peak 2模型的“实时语音识别上屏技术”在识别准确率上更上了一层楼。华少在现场也即兴挑战了一下百度语音识别技术,最终百度AI在58秒内实时正确识别了华少426字的“脱口秀”,令全场嘉宾赞叹不已。

百度发布“AI输入”人机交互智能时代下的革新
华少现场挑战百度语音识别技术

  随后,百度输入法负责人蔡玉婷宣布了百度输入法v8.0版本的正式上线,该版本在此前已有的AI功能上增加了“语音速记”和“AR表情”两大全新AI功能。

  其中,“语音速记”在输入法领域独家首发了“声纹识别”技术,该技术针对2-3人小型会议场景,可根据声纹自动区别发言人,实现智能化的语音识别。而“AR表情”功能基于百度领先的人脸识别技术和 AR 技术,用户不仅可根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。制作出来的AR表情,可以直接通过输入法搜索、语音输入和键盘输入时展示出来。同时,百度输入法还与桃花坞等中国非物质文化遗产达成合作,将中国民间传统艺术如年画等引入到表情中,让众多古典人物形象冲破次元壁垒“活”了起来,成为对中国历史文化最好的传承。

  百度输入法v8.0版本AR表情功能

  蔡玉婷现场表示,“百度输入法v8.0版本不仅在功能上落地,更拥抱年轻文化,贴近用户的个性化需求。语音识别、图像识别等AI技术在输入法中的应用,让输入法跳脱出语言的局限,懂得用户多种不同的表达形态。”百度输入法除了完成用文字输入形式的人机交互外,还能从声音、图片,甚至有望从动作、眼神中捕捉信息,让用户拥有更自然、更个性化的体验。

  AI技术的发展带来开启了AI输入的全感官输入时代, 百度输入法v8.0版本的推出,让这个AI智能时代下的产物更加鲜活的贴近用户。

原创及转载声明:
本站原创文章文字版权归微纵网所有,部分图片来源网络,转载务必注明作者和出处:微纵科技。
本站已入驻企鹅号、UC大鱼号、熊掌号和今日头条等平台,并签订原创协议,请勿转发到这些平台。

分享到