# LLMexperiment
#### **本实验基于大连理工大学软件学院胡燕教授的操作系统课程**
实验准备:
选择一个合适的基于Linux的部署平台,比如使用VMWare虚拟机配置的ubuntu或者云服务器
注:本次实验使用的是魔搭平台的云服务器
## 1. qwen1.5-0.5b模型部署
### 1.1 模型简介
模型简介请访问魔搭社区:
https://www.modelscope.cn/models/qwen/Qwen1.5-0.5B-Chat-GGUF/summary
### 1.2下载llama.cpp
#### (1)使用git命令克隆llama.cpp项目
git clone https://github.com/ggerganov/llama.cpp
![alt text](image.png)
#### (2)编译llama.cpp
cd llama.cpp
make -j
![alt text](image-1.png)
### 1.3 加载模型并执行
在llama.cpp目录中执行命令
./main -m /path/to/local/dir/qwen/Qwen1.5-0.5B-Chat-GGUF/qwen1_5-0_5b-chat-q5_k_m.gguf -n 512 --color -i -cml
**上述命令中的"/path/to/local/dir"在执⾏时需要替换为实际的本地⽬录**。
若是使用魔搭平台,则应为:
./main-m/mnt/workspace/llama.cpp/qwen/Qwen1.5-0.5B-Chat-GGUF/qwen1_5-0_5b-chat-q5_k_m.gguf -n 512 --color -i-cml
![alt text](image-2.png)
### 1.4 模型测试
最后执行结束后,我们就可以与qwen大模型进行对话了!
![alt text](image-3.png)
![alt text](image-4.png)
## 2.基于OpenVINO的模型量化实践
### 2.1 安装基本环境
#### (1) 创建目录qwen-ov
mkdir qwen-ov
cd qwen-ov
#### (2)克隆qwen-ov模型:
git clone https://github.com/OpenVINO-dev-contest/Qwen2.openvino
![alt text](image-6.png)
#### (3)创建python虚拟环境:
python3 -m venv openvino_env
source openvino_env/bin/activate
#### (4)升级pip:
python3 -m pip install --upgrade pip
![alt text](image-7.png)
#### (5)安装依赖的包(等待时间较长):
pip install wheel setuptools
![alt text](image-8.png)
pip install -r requirements.txt
![alt text](image-9.png)
**如果安装依赖时出现以下问题:**
![alt text](image-5.png)
**解决方案1:**
pip install nncf==2.8.1 optimum-intel>=1.16.0 transformers>=4.38.2 openvino>=2024.0.0 onnx>=1.15.0 huggingface-hub>=0.21.3
**解决方案2:**
##### (1)先进入到requirements.txt所在的目录
cd Qwen2.openvino
##### (2)然后再安装相关依赖
pip install -r requirements.txt
### 2.2 下载模型
export HF_ENDPOINT=https://hf-mirror.com
huggingface-cli download --resume-download --local-dir-use-symlinks False Qwen/Qwen1.5-0.5B-Chat --local-dir {your_path}/Qwen1.5-0.5B-Chat
![alt text](image-16.png)
### 2.3 转换模型
python3 convert.py --model_id Qwen/Qwen1.5-0.5B-Chat --precision int4 --output {your_path}/Qwen1.5-0.5B-Chat-ov
![alt text](image-17.png)
![alt text](image-14.png)
### 2.4 加载模型并执行
python3 chat.py --model_path {your_path}/Qwen1.5-0.5B-Chat-ov --max_sequence_length 4096 --device CPU
![alt text](image-18.png)
## 3.智谱 ChatGLM3-6B 模型部署
### 3.1安装基本环境
### (1)克隆相关库
git clone https://github.com/THUDM/ChatGLM3
#### (2) 创建一个新的 Anaconda 环境
conda create -n chatglm3 python=3.8
![alt text](image-19.png)
创建成功后激活相关环境:
conda activate chatglm3
#### (3) 进入克隆的项目文件
cd ChatGLM3
#### (4) 安装相关依赖
pip install -r requirements.txt
![alt text](image-20.png)
#### (5) 下载ChatGLM3-6b 模型
git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git
![alt text](image-21.png)
#### (6) 修改cli_demo.py中的路径
先进入basic_demo
cd basic_demo
修改cli_demo.py中的路径为自己的实际路径
vim cli_demo.py
修改后:
![alt text](image-24.png)
### 3.2 模型运行
python cli_demo.py
![alt text](image-25.png)
![alt text](image-26.png)
这样ChatGLM3-6b模型就部署完成了
季风泯灭的季节
- 粉丝: 2118
- 资源: 3370
最新资源
- (2025)计算机网络技术考试题库(含答案).doc
- (2025)监理工程师《合同管理》考试题库及答案.doc
- (2025)辐射安全与防护培训考试题库及答案.docx
- (2025)高压电工考试题库及答案.docx
- (2025)工业机器人技术题库及答案.docx
- (2025)工作票三种人资格工作许可人考试题库及答案.docx
- (2025)工业机器人系统操作员技术及理论知识竞赛试题库(附含答案).docx
- (2025)公司员工疫情防控知识考试题库及答案.docx
- (2025)公文写作基础知识试题库及答案.docx
- (2025)公文筐考试题库及答案.docx
- (2025)公务员结构化面试万能模板.docx
- (2025)公务员考试常用数学公式总结归纳.docx
- (2025)国家基层糖尿病防治管理指南认证考试试题及答案.docx
- (2025)国学经典知识竞赛题库及答案.docx
- (2025)汉字听写大会竞赛试题库及答案(通用版).docx
- (2025)过程气体事业部产品测试题及答案.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈