这个开源网络爬虫火了，竟让作者写免责声明-武穆逸仙 In September 2025

公众号关注 “GitHub AI 开源”

设为 “星标”，每天逛逛 GitHub！

这个开源网络爬虫火了，竟让作者写免责声明

hello，大家好。

这期给大家介绍一款开源网络爬虫，可以爬取社交媒体上的图片、视频、评论，适用于微博，小红书，抖音，B 站等。

这个网络爬虫项目开源不到 10 个月，就收到 12k stars 和 4k forks。由于热度太高，就有人偷了代码，在网上卖钱用于商业行为，所以作者不得不写了一个免责声明，同时提醒大家不要上当受骗：

这个开源网络爬虫火了，竟让作者写免责声明

项目简介

MediaCrawler 是一个开源免费的自媒体爬虫解决方案，使用 Python 语言编写，支持多个自媒体平台，包括某书、某音、某博、B 站、某手。

做到了开箱即用，使用 Python 原生协程模式进行开发，方便实现二次开发以及实现高并发爬虫的模型，亦可使用同样的解决方案去规避一些逆向难度高的网站。

这个开源网络爬虫火了，竟让作者写免责声明

项目特点

开箱即用
适用于主流的媒体网站，比如小红书，抖音等
支持多种数据保存方式，如 mysql , csv，json等

安装

1. 下载代码

2. 创建 python 虚拟环境

# 进入项目根目录cd MediaCrawler
# 创建虚拟环境# 注意 python 版本需要 3.7 - 3.9 python -m venv venv
# macos & linux 激活虚拟环境source venv/bin/activate
# windows 激活虚拟环境venvScriptsactivate

3. 安装依赖

pip3 install -r requirements.txt

4.安装 playwright 浏览器驱动

playwright install

运行爬虫程序

执行下面的命令，就可以运行爬虫，抓取指定网站的信息：

# 从配置文件中读取关键词搜索相关的帖子并爬取帖子信息与评论python main.py --platform xhs --lt qrcode --type search
# 从配置文件中读取指定的帖子 ID 列表获取指定帖子的信息与评论信息python main.py --platform xhs --lt qrcode --type detail
# 打开对应 APP 扫二维码登录  # 其他平台爬虫使用示例，执行下面的命令查看python main.py --help