1月17日,百度输入法在北京达美生活中心举办发布会,正式发布8.0版本,该版本在此前已有的AI功能上增加了“语音速记”和“AR表情”两大全新AI功能。
其中,“语音速记”采用了百度的“声纹识别”技术,该技术针对2-3人小型会议场景,可根据声纹自动识别发言人,实现智能化的语音识别。而“AR表情”功能基于百度的人脸识别技术和AR技术,用户可以根据相机或相册进行人脸识别、制作表情包,还支持用户通过自己的表情控制虚拟人物形象。在现场,百度输入法宣布与桃花坞等非物质文化遗产合作。
百度语音技术部总监高亮表示,通过百度最新的Deep Peak2模型,即“基于LSTM和CTC的上下文无关音素组合建模”,更充分发挥神经网络模型的参数优势,让机器可以更轻松适应用户的自然对话,语聊相对正确率提升20%。
评论