使用 GPT 与文件聊天，100%私密安全，无数据泄露-武穆逸仙 In December 2025

名称: /imartinez/privateGPT

地址: https://github.com/imartinez/privateGPT

fork: 3k star: 26.6k 开发语言: Python

项目简介: Interact privately with your documents using the power of GPT, 100% privately, no data leaks

ChatGPT 问世后，出现了很多能够与文件聊天的应用，比如下面的链接就是一个可以与 PDF 文件聊天的应用：https://github.com/mayooear/gpt4-pdf-chatbot-langchain

但是目前的与文件聊天的应用，均需要联网。如果我们的文件有保密要求的话，就只能望洋兴叹，干着急了。

privateGPT可以在没有互联网连接的情况下，可以 LLM 的回答对文档提出的问题，保证 100%私有，任何时候都没有数据离开运行环境。因此，我们可以在没有互联网连接的情况下，就能与文件聊天！

使用 GPT 与文件聊天，100%私密安全，无数据泄露

工作原理

privateGPT 核心只有两个脚本，ingest.py 和 privateGPT.py。

ingest.py使用工具解析文档并创建在本地使用的embeddings 。然后，使用向量存储将结果存储在本地矢量数据库中。
privateGPT.py使用基于本地的 LLM 来理解问题并创建回答。答案的上下文是使用相似性搜索从本地向量存储中提取的，以便从文档 GPT4All-J 中找到正确的上下文。
GPT4All-J包装器是在 LangChain 0.0.162 中引入的。

使用 GPT 与文件聊天，100%私密安全，无数据泄露