微软语音服务,提供语音到文本、文本到语音和语音翻译功能。
它允许用户创建自定义的语音识别模型,以及提供访问一系列预先训练的模型。它还提供了用于创建和管理自定义语音的工具。
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
几分钟内把一个概念变成一个完整的播客
设计和开发音频优先的产品和数据驱动的解决方案
一款适用于PC和Mac的语音转换器
Verbatik是一款AI驱动的文本到语音生成器,包含142种语言和口音的600多种自然声音
TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音
Spakfly是一款文本转语音软件,可以将任何文本转换成逼真的、听起来像人的画外音
要发表评论,您必须先登录。
几分钟内把一个概念变成一个完整的播客