首页 电商 正文

百度语音交互持续迭代 打造端到端信号声学一体化建模等前沿技术

2024-03-21 21:58
admin

9月15日,AI领域的行业盛会“百度世界2020”大会于线上隆重召开,一大波硬核技术袭来:百度创始人、董事长兼CEO李彦宏与总台央视主持人康辉“虚拟人”亮相、颠覆搜索形态的“度晓晓”、没有驾驶员的“全自动驾驶”、各行各业赋能案例……既有硬核技术,又有“接地气”的落地应用。

(百度世界2020央视新闻直播间)

在当天的百度大脑分论坛上,百度语音首席架构师贾磊重点讲解了百度端到端语音交互技术。他表示,百度语音交互技术持续迭代升级,已发展成为基于深度学习技术的端到端的语音识别和语音合成技术。在语音识别层面,百度推出端到端信号声学一体化建模的技术,语音合成方面,最新的Meitron和单人千面合成个性化技术亮相。同时交出了百度语音技术最新成绩单:日均调用量超过155亿次,广泛应用在移动端、智能家居、和语音IoT等场景,智能语音产业化成果丰硕。

(百度语音首席架构师贾磊)

会上,贾磊分别从语音识别和语音合成两个技术维度详解了百度语音技术的发展迭代和最新成果。在语音识别方面,百度语音识别技术持续创新,从2012年首推深度学习技术,到2019年在业内首先把注意力模型应用于在线语音识别,推出流式多级的截断注意力模型SMLTA;再到如今全面进化为端到端的信号声学一体化建模技术,在助力百度自身业务发展的同时,更好地赋能多场景、多产业应用。

作为百度语音识别技术的最新成果,端到端的信号声学一体化建模技术很好地解决了传统数字信号处理和语音识别级联系统的各种问题,抛弃了各自学科的学科假设,通过端到端的建模,大幅提升了远场语音识别率。

据贾磊介绍,端到端的信号声学一体化建模技术由模型波束技术和模型AEC技术组成。前者进化为多分区融合的模型波束建模技术,在国际上由百度首次提出,较单分区技术进一步提升识别性能15%以上;后者是升级为基于双LOSS实值掩蔽的模型AEC技术,可以解决设备有非线性情况下的回波消除问题,使得设备即使在播放音乐的时候,也能够进行成功的打断和高精准的语音识别。

此外,贾磊还在会上介绍了百度今年推出的端侧全双工语音交互技术。据他介绍,百度端侧全双工语音交互技术将复杂的建模过程转化为3个端到端的深度学习过程,即信号声学一体化建模、声学语言一体化建模以及语义置信一体化建模。通过端到端的建模,该技术能够将整个复杂的端侧交互转变成若干个深度学习计算,使得依靠一颗AI芯片就能完成端侧的全双工语音交互,从而大幅度提升车载手机等语音交互性能,显著改善用户体验。

而在语音合成方面,百度自2013年启动语音合成研发,历经参数合成、拼接合成、深度学习语音合成和端到端的语音合成,到如今全新升级为包含个性化、多风格多角色、单人千面的语音合成系统,百度语音合成技术始终处于升级迭代中。

会上,贾磊依次介绍了百度语音合成技术的最新成果——个性化TTS,多风格、多角色,单人千面。个性化TTS是个性化定制的Meitron语音合成系统的最新演进,是基于子带分解和GAN_loss的端侧神经网络声码器,也是业内首个在手机端多人通用的端侧的基于神经计算的声码器。个性化TTS相较于传统的基于信号处理和参数的声码器,ABX提升可以达到65:35,其已应用于地图导航,目前每日的导航播报超过1亿次。

多风格、多角色的语音合成,则是针对娱乐内容产业(例如小说)中存在的多个角色交替、多种情感需求并存的播报需求而研发的新技术。此前,用单一音色播报缺乏表现力,播报语音和文字本身的角色情感不一致,用户长时间听感到单调疲倦。百度通过深度学习技术对小说文本进行分析,判断出角色、身份、情感,再借助多风格、多角色语音合成技术去合成小说中的声音,从而实现声音自然流畅、情感表现力丰富、用户体验优美的效果。

针对一个发音人需要用不同风格播报文本的应用场景,百度推出单人千面语音合成技术。该技术能够把说话人的语音、文本、风格、内容、音色都进行分离,在进行语音合成的时候自由组合,从而能够让一个发音人同时去播报新闻、小说、脱口秀、读书、诗歌等不同风格。

“百度智能语音交互的产业化成果丰硕,目前百度智能语音的日均调用量超过155亿次,广泛应用于移动端、智能家居、智能车载、智能服务以及语音IoT,极大地提高了中国社会的智能化程度。”贾磊表示。语音技术作为百度大脑的重要AI能力之一,不但应用于百度搜索、百度输入法、百度地图、小度音箱等百度系列产品,更通过百度大脑AI开放平台广泛赋能众多行业和场景的合作伙伴。未来,百度还将持续创新升级语音交互技术,推进语音技术应用落地,助力更多产业智能化转型升级。

相关文章

  • 怎么把文档变成音频?

    怎么把文档变成音频? 一般要下载可以将文字转换成语音的软件,可以在手机应用商店里搜索“文字转语音”,然后下载相应软件并安装,打开后选择一篇文章进行文本扫描,将其转换成音频保存即可。怎么把文档变成音频?一般需要下载相应的文字转语音软件,有些是免费的,有些是收费的。具体步骤如下:1、首先在手机自带的应用商店里搜索关键词“文字转语音”,找到相应软件下载并安装它。2、选择任意一篇文章进行文本扫描,复制其扫描后的电子文稿粘贴至如

    2024-03-18 10:03
  • 阿里宝卡申请渠道有哪些?要怎么申请?

     阿里宝卡申请渠道有哪些?要怎么申请? 具体内容如下:阿里大宝卡套餐费59元,有2GB的全国流量+500分钟国内语音。并且支持淘宝、天猫、优酷视频免流量。阿里小宝卡套餐费19元,可是套餐内包含1GB全国流量、100分钟国内语音,淘宝、天猫、优酷视频免流量。在满足购物、看视频的需求下,套餐内的流量和语音基本够咱们运用。宝卡请求渠道有哪些?怎么请求?宝卡能够在

    2024-03-14 16:20
  • 支付宝怎么不报金额?如何设置支付宝收钱码语音金额播报?

     支付宝怎么不报金额?如何设置支付宝收钱码语音金额播报? 然后,用户是通过蚂蚁商家的收款码扫码付出才会有语音播报余额。,知道为什么你的付出宝怎样不报金额了吗?那就是您没有做以上这两件事哦。,有关付出宝怎样不报金额以及付出宝收款语音金额播报的设置要什么条件,小编已经为我们做了简略的分析了,小编认为,只要有条件,最好仍是设置付出宝收钱码语音金额播报,这样自己定心他人也方便,不需要重复给您承认有没有到账了。

    2024-03-14 16:16
  • 支付宝手机语音报数设置方法介绍

     支付宝手机语音报数设置方法介绍 对于咱们普通用户而言,经过付出宝收款,咱们仍是不需要设置付出宝手机语音报数,但是对于那些商家,尤其是那些开零售店的商家而言,每天的流动资金非常之多,并且现在在无现金化社会的前提下,身上不带现金,就靠着手机完成付出,对错常常见的一件事。,然后,用户是经过蚂蚁商家的收款码扫码付出才会有语音播报余额。,具体的过程请大家接着往下看! 1)首要进入【我的】页面,然后在右上角找到【设置】的功用; 2)在设置的

    2024-03-14 16:16
  • 支付宝收款语音播报如何设置?方法很简单

     支付宝收款语音播报如何设置?方法很简单 支付宝收款语音播报怎样设置?支付宝收款语音播报设置详细步骤: 1、首要先登录支付宝账号,登录成功后会进入到主面板,在主面板的右下角会有一个“我的”按钮,选项该按钮。,5、然后会进入到消息设置页面,在这个面板上会有一个“二维码收钱到帐语音提示”,此刻咱们单击该选项后方的按钮。,6、单击之后会发现该选项后方的按钮已经变成蓝色的了,这就说明已经成功设置语音提示功能,以后只要收款后就会主动播报语音了。

    2024-03-14 16:15
  • 拼多多语音通话会被监听吗?如何保护隐私安全?

    拼多多语音通话会被监听吗?如何保护隐私安全? 那么,拼多多的语音通话会被监听吗?如何保护隐私安全?本文将探讨这个问题。,这个功能可以帮助用户更方便地进行沟通,例如在购物时询问商品信息、协商价格等。,事实上,任何互联网应用程序都有可能被监听,包括拼多多的语音通话功能。

    2024-03-13 16:02
  • 做微商丢单就是因为这些小细节…

    做微商丢单就是因为这些小细节… 在做微商的过程中,往往做不好的地方,都是因为小细节没有做好。同样,有些业绩低的微商,就败在细节问题。你有发现哪些容易出错的小细节吗?下面,为大家总结一下做微商容易出错的几点细节:跟客户在聊天时,经常出现错别字,有时会撤回,有时会就这样算了,有时会在下面补上正确的字,但不管是哪种形式的补救都是没用的,反而给客户造成一种不好的体验感。所以,在打完字的时候,自己要检查一遍,是否有错别字,或者语句不通的地

    2024-03-22 22:18
  • 做微商要重视的5个小细节,你做好了吗?

    做微商要重视的5个小细节,你做好了吗? 3.不经过客户的同意就直接打语音电话有些微商觉得文字不能解释清晰,然后就直接给客户打语音电话了,这种做法也是错误的。,4.一直刷表情包有些微商觉得自己比较佛系,别人问她,她都喜欢用刷表情包,这也容易会引起客户的反感。,所以,我们在使用表情包了要恰当,并且不能过于频繁,刷个不停。

    2024-03-22 21:08
  • 抖音语音直播可以赚钱吗?如何做抖音语音直播?

    抖音语音直播可以赚钱吗?如何做抖音语音直播? 现在抖音直播方式越来越多,除了视频直播之外,还有语音直播,但是很多朋友对这方面并不是太了解,想知道抖音语音直播可以赚钱吗?我们来简单看一下抖音语音直播只要做的起来是可以赚钱的1.打赏这个变现方式比较传统,也就是听众觉得你说的好,然后给你打赏2.引流你可以给自己的抖音号导流粉丝,也可以将平台用户引流到自己的私域流量中,之后在进行相关方面的变现3.其他方式还可以卖账号,可做培训,可直播带货,可导流卖粉

    2024-03-22 18:33
  • 抖音音频直播能赚钱吗?是什么?

    抖音音频直播能赚钱吗?是什么? 在抖音,大家可以尝试着去做直播,那么大家做直播一定要有自己的特点,或者是一些才艺展示,或者是可以非常活跃直播间的氛围,讲一些段子,抖音音频直播能赚钱吗?一、抖音音频直播能赚钱吗?抖音语音直播只要做的起来是可以赚钱的二、什么是抖音语音直播?这是抖音最新推出的一种直播方式,进入语音直播后,除了不需要开启视频,其他功能都与视频直播一致内部不仅有评论、送礼等功能,还拥有独特的聊天室选项,可以增加8个连麦席

    2024-03-22 18:00