AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

名称: /AIGC-Audio/AudioGPT

地址: https://github.com/AIGC-Audio/AudioGPT

fork: 151    star: 2,002    开发语言: Python

简介: AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head

                                            

AudioGPT 是一款处理音频的开源应用,可以根据输入的文本内容生成演讲(Text-to-Speech),图片生成音频(Image-to-Audio),声音检测(Sound Detection)等,同时还支持 prompt 用法。

 

01
在线体验

AudioGPT 在 huggingface 上部署了在线 demo,因此我们可以在线体验其功能

地址:https://huggingface.co/spaces/AIGC-Audio/AudioGPT

AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

在网站上,AudioGPT 提供了很多的示例,比如 Generate a speech with text “here we go”,Generate an audio of a dog barking,可以帮助我们更好地与AudioGPT 交谈,获得更好的使用体验。

 

02
支持的能力
AudioGPT 在 github 上列出了目前支持的能力列表,还有很多的功能正在实现中,大家可以期待下。
演讲相关的能力

AudioGPT 支持根据输入的文本内容生成演讲,演讲风格转换,演讲识别等。

AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

歌曲相关的能力

AudioGPT 目前支持根据输入的文本生成歌曲,是唱出来的那种。

AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

音频相关的能力

AudioGPT 支持文本转音频,音频修复,图像转音频,声音识别等。

AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

Prompt 相关

除了上面介绍的能力之外,AudioGPT 还支持 Prompt,并给出了使用的示例,我们可以根据这些示例,学习如何使用Prompt 来与AudioGPT 进行交互。

Prompt 使用介绍,可以参看如下链接:

https://github.com/AIGC-Audio/AudioGPT/blob/main/assets/README.md

链接中,详细介绍了如何使用 Prompt 与 AudioGPT 交互,让 AudioGPT 根据其能力帮助我们解决不同的问题。

比如,根据文本生成演讲内容

AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

根据文本内容唱歌

AudioGPT,一款处理音频的开源应用,不仅可以演讲和声音识别,还可以唱歌

以上内容,均来自于 Github,更内容参看:

https://github.com/AIGC-Audio/AudioGPT

© 版权声明

☆ END ☆
喜欢就点个赞吧
点赞0 分享
图片正在生成中,请稍后...