微软语音服务,提供语音到文本、文本到语音和语音翻译功能。
它允许用户创建自定义的语音识别模型,以及提供访问一系列预先训练的模型。它还提供了用于创建和管理自定义语音的工具。
Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
转录和理解语音的AI模型
语音朗读软件Ondoku。这是一种无需安装,任何人都可以免费使用的语音朗读服务。
VALL-E是一种用于文本到语音生成 (TTS) 的语言建模方法
Clipchamp的文字转语音生成器
TTSMaker是一个免费的文本转语音工具,提供语音生成服务,支持多种语言。
Verbatik是一款AI驱动的文本到语音生成器,包含142种语言和口音的600多种自然声音
要发表评论,您必须先登录。
转录和理解语音的AI模型