2020第三方手机输入法春季报:语音输入需求激增,搜狗领跑地位稳定

近日,赛诺市场研究对外发布了《2020年中国第三方手机输入法春季报》(以下简称“报告”)。报告指出“语音为主,触控为辅”上升为时代主流,AI赋能下的人机交互则成为输入法行业的未来发展趋势。

截止报告期,国内第三方输入法市场九成以上份额被搜狗、讯飞、百度瓜分。其中,搜狗份额占比超讯飞与百度之总和,领跑地位依旧稳定。

手机屏幕截图 描述已自动生成

报告中指出,2020年春季第三方输入法市场语音需求的激增主要围绕着:即时通讯、线上办公、互联网教育、弹幕追剧、手游内对话和与AIoT设备智能交互,六大使用场景展开,而这些使用场景大多都与疫情带来的影响密切相关。无论是远程医疗、远程教育还是远程办公,作为人们远距离交流的最强辅助工具,输入法产品发挥了重要作用。

手机屏幕截图 描述已自动生成

人工智能时代,输入法的语音服务也被推上了新的高度。新一代的智慧语音输入法不仅能够帮助人们进行准确的语音与文字转化,还能进行多语种间的灵活转换和翻译,甚至能基于使用者语言习惯的进行一些个性化的工作。

手机屏幕截图 描述已自动生成

以搜狗输入法为例,它不仅能完成对于粤语、东北话、南京话、贵州话等10种方言和中、英、日、韩、俄等9种外语语言转写成文字,还支持中文与英、日、韩、法、西、俄、德等6种外语的语音实时翻译。这让搜狗输入法成为目前业内支持外语语音识别最多、多国语音翻译更畅快的输入法。

手机屏幕截图 描述已自动生成

人类的双语学习往往需要经过长期的教育和练习才能实现切换自如,而搜狗输入法的AI语音翻译模型,则能在短时间内完成从语音识别、文字转换、实时上屏并最终转化为准确外语的过程,让即使不懂外语的用户也可以与国际友人进行顺畅交流。

另外,就报告中提出的缺乏「语音候选词」功能问题,搜狗输入法在其最新发布的10.8版本也进行了更新优化。

手机屏幕截图 描述已自动生成

新版本将其称之为“AI语音替换词“。当用户语音输入“陈姐”时,系统会同时提供程姐、成姐、晨姐等发音相近的替换词,方便快捷替换。快速解决由于发音不准、模糊,以及同音不同字等原因导致的识别率较低问题。

白色的计算器 描述已自动生成

同时在个性化语音服务方面,搜狗早在19年5月就推出了个性变声功能。只要用户在语音输入中输入想说的话,再选择一个喜爱的角色,就会瞬间把声音转化成该角色的声音,不仅还原度极高,而且自由度极大。

手机屏幕截图 描述已自动生成

在表征学习上,对目标音色语料进行声纹特征编码,提取说话人的音色embedding,再分别从输入音频中学习内容和韵律embedding。把“说话人归一化”模块对内容embedding进行统一规整,去除音色信息。通过对音频特征的压缩编码及特征抽取,学习表征韵律的风格特征。

然后基于表征学习得到的特征,通过Attention和Decoder模块进行加权特征编码,并利用WaveRNN神经网络声码器恢复成波形,最终得到带有目标音色的音频。这样一来,由源端音色到指定音色的转化就变得轻易而精密了。

图片包含 游戏机, 仪表, 蓝色, 街道 描述已自动生成

在以上技术原理的支持下,“变声”功能对用户本身的音色没有任何限制,每个人均可变声到预先指定的音色,真正具有“任意人变声到同一人”的能力。同时,打破了音色转换的局限,将输入的语音内容、语速、停顿、情感等均转化为超高逼真度的指定角色声音,因此可以达到更自然的变声沟通。

报告在结尾还提到,借助人工智能技术的进步,语音并非仅限于识别,更重要的是参与到人的决策、渗透入生活,并真正为人们带来便利。同时,多种技术的复核、年轻用户的开拓、为视听障碍人群搭建沟通桥梁和多元输入方式的探索,也将成为未来输入法行业发展的新趋势

 

为您推荐

联系我们

联系我们

工作时间:周一至周五,9:00-17:30,节假日休息

返回顶部