您的位置首页  科技

平安科技:平安科技深圳有限公司

  • 来源:互联网
  • |
  • 2024-09-11
  • |
  • 0 条评论
  • |
  • |
  • T小字 T大字

金融界 2024 年 9 月 10 日消息,天眼查知识产权信息显示,平安科技(深圳)有限公司申请一项名为“基于潜在扩散模型的语音合成方法、装置、

平安科技:平安科技深圳有限公司

 

金融界 2024 年 9 月 10 日消息,天眼查知识产权信息显示,平安科技(深圳)有限公司申请一项名为“基于潜在扩散模型的语音合成方法、装置、服务器及介质“,公开号 CN202410854549.0 ,申请日期为 2024 年 6 月。

专利摘要显示,本申请实施例提供一种基于潜在扩散模型的语音合成方法、装置、服务器及存储介质,该方法包括:获取待合成的目标文本;根据目标文本,确定语音情感特征和目标时长信息;通过预设的目标语音合成模型中的神经网络音频编码器,对目标文本进行编码处理,得到第一隐向量;通过残差向量量化器,对第一隐向量进行量化压缩处理,得到第二隐向量;对语音情感特征的向量表示、目标时长信息的向量表示和第二隐向量进行融合处理,得到融合隐向量;通过潜在扩散模型,对融合隐向量进行逆向扩散处理,得到目标隐向量;通过神经网络音频解码器,对目标隐向量进行解码处理,得到合成语音。

本申请提高了合成语音的自然度和质量,使得合成语音更加贴近真实的语音本文源自金融界

免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186