使用 GPT 与文件聊天,100%私密安全,无数据泄露

名称: /imartinez/privateGPT

地址: https://github.com/imartinez/privateGPT

fork: 3k    star: 26.6k    开发语言: Python

项目简介: Interact privately with your documents using the power of GPT, 100% privately, no data leaks      

ChatGPT 问世后,出现了很多能够与文件聊天的应用,比如下面的链接就是一个可以与 PDF 文件聊天的应用:https://github.com/mayooear/gpt4-pdf-chatbot-langchain

但是目前的与文件聊天的应用,均需要联网。如果我们的文件有保密要求的话,就只能望洋兴叹,干着急了。
privateGPT可以在没有互联网连接的情况下,可以 LLM 的回答对文档提出的问题,保证 100%私有,任何时候都没有数据离开运行环境。因此,我们可以在没有互联网连接的情况下,就能与文件聊天!

使用 GPT 与文件聊天,100%私密安全,无数据泄露

 

01
工作原理
privateGPT 核心只有两个脚本,ingest.py 和 privateGPT.py。
  • ingest.py使用工具解析文档并创建在本地使用的embeddings 。然后,使用向量存储将结果存储在本地矢量数据库中。
  • privateGPT.py使用基于本地的 LLM 来理解问题并创建回答。答案的上下文是使用相似性搜索从本地向量存储中提取的,以便从文档 GPT4All-J 中找到正确的上下文。
  • GPT4All-J包装器是在 LangChain 0.0.162 中引入的。

使用 GPT 与文件聊天,100%私密安全,无数据泄露

02
使用介绍
privateGPT 使用简单,只需要简单两步就可以开启文件聊天。
第一步:导入文件
python ingest.py
允许导入很多的文件,但是导入文件速度和文件的大小有关,文件越大速度也会约满。导入所有的文件都是存储在本地的,因此非常的安全,不会存在文件外发,造成泄密的可能。

第二步:开始聊天

首先需要执行下面的命令,打开聊天的大门:

python privateGPT.py
稍等片刻,就会得到下面的提示:
> Enter a query:
然后,输入你的问题,等待大约 20 秒左右(等待时长取决与硬件水平),就能得到回答了,同时还有与 4 处与回答相关的上下文。
如果想要问另外的问题,不需要重新运行脚本,直接输入问题,敲下 enter 键就行了。
03
环境配置

安装 python 依赖

pip install -r requirements.txt
下载模型
然后下载 2 个模型并将它们放在 ./models 下。
LLM:默认为 ggml-gpt4all-j-v1.3-groovy.bin。如果更喜欢 GPT4All-J ,只需下载并在 privateGPT.py 中引用即可。
Embedding:默认为 ggml-model-q4_0.bin。如果更喜欢其他兼容的嵌入模型,只需下载它并在 privateGPT.py 和 ingest.py 中引用它。

更多的内容可以到GitHub 查看:
https://github.com/imartinez/privateGPT

END

使用 GPT 与文件聊天,100%私密安全,无数据泄露
© 版权声明

☆ END ☆
喜欢就点个赞吧
点赞0 分享
图片正在生成中,请稍后...