我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?
公众号关注 “GitHub AI 开源”

设为 “星标”,跟踪 AI 前沿!

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?

GitHub 作为开发者技术创新的主要阵地,每天都会诞生非常多好玩又有趣的开源项目。

这些项目,有的非常接近地气,就是简单的 hello world;有的非常前沿,代表了未来的发展的方向。

所以,这么多的开源项目,我们不可能看得过来,没有时间,也没有那么多的精力。

所以我就写了一个爬虫,专门用来跟踪每天登上 Github Trend 的热门项目。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?

从 2022 年到现在,我大约收录了 6000 多个热门的开源项目,也见证了一个又一个的热点事件。

gpt 来了

gpt3.5 刚刚兴起的时候,出现了很多制作 gpt web UI 的开源项目,接连好几天都有相关的项目登上热搜,收获了非常多的 star 和 forks。

之后就是全民学习 prompt,又出现了很多的学习如何写作 prompt 的开源仓库。这些仓库的内容都非常全面,涉及绘画,法律,面试,语言学习等。

同时期,还特别流行如何将 gpt 接入微信,很多人都借此赚到了第一桶金。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?

再往往后就是 Facebook 开源了 LLM 大模型,接着 Github 就开始出现了很多的国内大模型,比如本草 等。

虽然现在飞书在进行裁员,但是 2023 飞书整合 gpt-3.5 的开源项目连续好几天都登上了 Github Trend, 收获了很多的 star 和 forks。两相对比之下,眼见他起高楼,眼见他楼塌了。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?

AI 编程火了

GPT-4.5 公布之后,GitHub Trend 连续上榜的开源项目大都是 AI 编程相关的,都是奔着  “code less, make more“ 的目标在前进。比如 gpt-pilot,只需要给定需求,它可以自主完成 90%的工作量。

后续出现的 OpenDevin 理念更加激进,已经可以完成 100%的软件开发任务。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?

AI 绘画也火了
虽然现在 Stable Diffusion 被曝团队集体离职,但是它刚出时,展示出来的绘画能力,可是吸引了广泛的关注。

国内也有很多人围绕 SD 做了很多的产品,比如 B 站秋叶大佬的整合安装包,大幅降低了 SD 的门槛。
还有很多围绕 SD 建立的网站,比如吐司,很多玩家会在吐司上分享自己的 lora。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?

短视频领域又爆了
让我们再把视线转移到现在
Open AI 公布王炸产品 sora 之后,虽然没有进行公开测试,但是却像一颗石子投入了湖面一样,虽然没有什么浪花,但是却泛起了很多的涟漪。
更何况 sora 不是一个小石子,而是一个好几吨的大石头。

sora 的出现为了大模型的发展指出了新的赛道。

随后,GitHub 上视频内容生成相关的开源项目就像雨后的春笋一样,一个接一个的冒了出来,且功能也越来越完善,越来越接近商业化。

首先是北京大学推出了 open-sora,宣称要开源 sora,但是受限硬件资源,进展比较缓慢。

然后 hpcaitech 迅速入局,紧随其后就推出了 open-sora,将视频成本降低了 46%,序列扩充至近百万,训练三天就能生成2 秒的 512×512 视频。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?
再接着就是 Mora 的问世,功能更加接近 sora,将视频生成推向了一个新的高度。

我用爬虫,抓取了 github 6000 多个开源项目,发现了什么?


紧接着,可以生成类似 抖音 和 YouTube 短视频的工具 MoneyPrinterTurboMoneyPrinter 又火了。

只需要输入主题,这些工具就可以一件生成高清短视频,并自动完成音乐,字幕的适配,真正的做到了一键生成,彻底告别手动剪辑。

写在最后:

gpt 问世之后,短短两年的时间,AI  已经渗透到了各个领域,许多之前看似不可能的实现,现在都已经变成了可能。

下一个 AI 爆火的领域又会哪里呢?
往期精彩回顾
© 版权声明

☆ END ☆
喜欢就点个赞吧
点赞0 分享
图片正在生成中,请稍后...