ChatGLM-6B云服务器部署（以恒源云为例）

原創

2023-04-10 13:23

写在前面：

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数，使用了和 ChatGPT 相似的技术，针对中文问答和对话进行了优化。由于其对显存硬件要求较高（详见下图），对于硬件配置较低的使用者不太友好，因此可尝试部署在云端，以此实现低配高效。

一、下载源码和模型

源码：https://github.com/THUDM/ChatGLM-6B

模型：https://huggingface.co/THUDM/chatglm-6b（模型文件较大，若Huggingface上下载较慢可用清华云盘https://cloud.tsinghua.edu.cn/d/fb9f16d6dc8f482596c2/）

将模型文件放入chatglm_6b的文件夹内

然后将两个文件夹压缩成zip格式。

二、上传模型数据

注册好账号后，下载oss_windows_x86_64.exe，重命名为oss.exe后，在在当前目录进入cmd，执行.\oss login命令，输入恒源云平台账号和密码登录。

执行.\oss cp 压缩文件所在目录\xxx.zip oss:// 命令，上传本地当前目录数据到个人数据根目录

三、创建实例

在恒源云筛选需要的主机配置（GPU需在16G以上），选择实例镜像，创建实例。

四、使用实例

1.打开JupyterLab来登陆实例

2.打开终端（Terminal）进入实例系统内

3.执行oss login命令，登陆个人数据空间，输入恒源云平台账号和密码登录，账号为手机号

4.执行cd /hy-tmp命令，进入下载路径，如果有共享存储的机型可以用选择hy-nas
6.执行oss cp oss://xxx.zip .命令，将个人数据中的xxx.zip下载到当前目录中
7.执行unzip -q xxx.zip命令，解压 xxx.zip 文件到当前目录

8.执行cd /hy-tmp/ChatGLM-6B-main指令转到解压后的文件夹

9.执行pip install -r requirements.txt，安装依赖。此处如报错，要注意是否正确打开文件夹路径（ requirements.txt文件位于/hy-tmp/ChatGLM-6B-main内）

10.执行python cli_demo.py运行cli_demo.py文件。运行中需要加载8个模型。如果途中报错如图，先检查自己的库中是否装了下面三个库 certifi、cryptography、pyOpenSSL，没有的话请依次安装：

pip install certifi
pip install cryptography
pip install pyOpenSSL

程序会在命令行中进行交互式的对话，在命令行中输入指示并回车即可生成回复，输入 clear 可以清空对话历史，输入 stop 终止程序。

至此，就基本完成了命令行式的交互。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

ChatGLM-6B云服务器部署（以恒源云为例）

写在前面：

一、下载源码和模型

二、上传模型数据

三、创建实例

四、使用实例

美团一面：项目中有 10000 个 if else 如何优化？想了半天，被问懵了！

京东面试：如何进行JVM调优？

Python 将PowerPoint (PPT/PPTX) 转为HTML

SQL优化-20231016

基於Deepspeed實現LLaMA-13B或70B模型的微調

基於vllm 0.3.0部署 llama2-70B模型

基於TigerBot-13b訓練其函數調用能力

使用8卡3090微調llama2-70B模型

8卡3090GPU雲服務器上採用VLLM部署中文llama2-70b模型及OpenAI格式接口

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結