语音技术

基于深度学习技术,对音频和文字进行相互转换和识别。包括语音识别、语音合成等技术。
产品优势
企业级平台

企业级语音合成处理平台,7x24小时云服务。

服务可靠

依托云服务,根据调用量提供弹性服务,扩展性好,技术成熟稳定。

简单易用

支持通过RestAPI接口方式调用。 

产品列表
语音识别



提供高准确率的语音识别服务,快速将语音识别成文字,满足各场景实际需求。





语音合成



基于海量语音文本数据的人工智能语音合成技术,合成定制化的语音效果。





应用场景
  • 语音输入
  • 人机交互
  • 有声读物
  • 车载导航

图片 2053

场景特点

需要输入语音的场景,如语音搜索、社交聊天、游戏娱乐。

解决方案

摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷。

推荐产品

语音识别

语音合成

图片 2053

场景特点

人与机器进行互动唤醒。

解决方案

通过语音识别服务,对终端设备进行语音唤醒,发送语音命令,对设备进行实时操作,实现人机交互。

推荐产品

语音识别

语音合成

图片 2053

场景特点

需要输出语音的文化娱乐场景。

解决方案

针对小说、新闻、书籍等读物场景,可快速将文本内容合成高质量语音,提供媲美人声的听觉体验,降低有声内容创作门槛。

推荐产品

语音识别

语音合成

图片 2053

场景特点

需要输出语音的交通场景。

解决方案

使用语音合成服务将车载导航数据转换成语音素材,为用户提供精确的车载导航服务。

推荐产品

语音识别

语音合成

帮助文档