deepseek快速进行本地部署

需要说明的是，这里是借助Lmstudio/Ollama直接部署，无需安装python。

1、因Ollama 未自带GUI图形界面，所以本文以LmStudio为例。

如图，根据你对应的电脑系统下载并安装LmStudio。

2、安装完打开软件，在如图所示右下角齿轮修改设置→语言→改为“中文”。

3、然后点击软件左边的“发现”，查找模型。如果你有本地的大模型，也可以在“我的模型”里面设置你的模型文件（文件类型为.gguf）

4、在”发现“搜索 ”deepseek ，选择你电脑配置能用的数量级模型。例如我电脑是CPU Intel i5-12400f 内存16G 显卡 GTX3070 ，我选择的是dp-7B的先玩玩。（装都是能装的，主要是Token的生成速度不同，我这配置用7B每秒15个token左右）。

5、你也可以通过指定配置来提高模型推理的能力。

内存方面：

量化模型：使用模型量化技术，将模型的参数从浮点数转换为低精度的数据类型（如 8 位整数或 4 位整数），可以显著减少内存占用。在 transformers 库中，可以通过指定 load_in_8bit=True 或 load_in_4bit=True 来实现。

显存方面：

推理参数设置：

6、效果演示：

本作品采用知识共享署名 4.0 国际许可协议进行许可