名称: /AIGC-Audio/AudioGPT
地址: https://github.com/AIGC-Audio/AudioGPT
fork: 151 star: 2,002 开发语言: Python
简介: AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head
AudioGPT 是一款处理音频的开源应用,可以根据输入的文本内容生成演讲(Text-to-Speech),图片生成音频(Image-to-Audio),声音检测(Sound Detection)等,同时还支持 prompt 用法。
AudioGPT 在 huggingface 上部署了在线 demo,因此我们可以在线体验其功能
地址:https://huggingface.co/spaces/AIGC-Audio/AudioGPT
在网站上,AudioGPT 提供了很多的示例,比如 Generate a speech with text “here we go”,Generate an audio of a dog barking,可以帮助我们更好地与AudioGPT 交谈,获得更好的使用体验。
AudioGPT 支持根据输入的文本内容生成演讲,演讲风格转换,演讲识别等。
AudioGPT 目前支持根据输入的文本生成歌曲,是唱出来的那种。
AudioGPT 支持文本转音频,音频修复,图像转音频,声音识别等。
除了上面介绍的能力之外,AudioGPT 还支持 Prompt,并给出了使用的示例,我们可以根据这些示例,学习如何使用Prompt 来与AudioGPT 进行交互。
Prompt 使用介绍,可以参看如下链接:
链接中,详细介绍了如何使用 Prompt 与 AudioGPT 交互,让 AudioGPT 根据其能力帮助我们解决不同的问题。
比如,根据文本生成演讲内容
根据文本内容唱歌
以上内容,均来自于 Github,更多内容参看:
https://github.com/AIGC-Audio/AudioGPT