AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌-武穆逸仙 In March 2026

名称: /AIGC-Audio/AudioGPT

地址: https://github.com/AIGC-Audio/AudioGPT

fork: 151 star: 2,002 开发语言: Python

简介: AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head

AudioGPT 是一款处理音频的开源应用，可以根据输入的文本内容生成演讲(Text-to-Speech)，图片生成音频(Image-to-Audio)，声音检测(Sound Detection)等，同时还支持 prompt 用法。

在线体验

AudioGPT 在 huggingface 上部署了在线 demo，因此我们可以在线体验其功能

地址：https://huggingface.co/spaces/AIGC-Audio/AudioGPT

AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌

在网站上，AudioGPT 提供了很多的示例，比如 Generate a speech with text “here we go”，Generate an audio of a dog barking，可以帮助我们更好地与AudioGPT 交谈，获得更好的使用体验。

支持的能力

AudioGPT 在 github 上列出了目前支持的能力列表，还有很多的功能正在实现中，大家可以期待下。

演讲相关的能力

AudioGPT 支持根据输入的文本内容生成演讲，演讲风格转换，演讲识别等。

AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌

歌曲相关的能力

AudioGPT 目前支持根据输入的文本生成歌曲，是唱出来的那种。

AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌

音频相关的能力

AudioGPT 支持文本转音频，音频修复，图像转音频，声音识别等。

AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌

Prompt 相关

除了上面介绍的能力之外，AudioGPT 还支持 Prompt，并给出了使用的示例，我们可以根据这些示例，学习如何使用Prompt 来与AudioGPT 进行交互。

Prompt 使用介绍，可以参看如下链接：

https://github.com/AIGC-Audio/AudioGPT/blob/main/assets/README.md

链接中，详细介绍了如何使用 Prompt 与 AudioGPT 交互，让 AudioGPT 根据其能力帮助我们解决不同的问题。

比如，根据文本生成演讲内容

AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌

根据文本内容唱歌

AudioGPT，一款处理音频的开源应用，不仅可以演讲和声音识别，还可以唱歌

以上内容，均来自于 Github，更多内容参看：

https://github.com/AIGC-Audio/AudioGPT

博主的文章没有高度、深度和广度，只是凑字数。利用读书、参考、引用、抄袭、复制和粘贴等多种方式打造成自己的纯镀 24k 文章！如若有侵权，请联系博主删除。

☆ END ☆

网络技术

喜欢就点个赞吧