聊聊ChatGLM-6B部署与微调的深入理解-摩杜云开发者社区

聊聊ChatGLM-6B部署与微调的深入理解

zhNCThJtfE8g 2024年01月02日 17 0

大模型

ChatGLM的部署，主要是两个步骤：

在Github上下载chatglm的库文件
在Hugging Face上下载模型参数与配置文件

ChatGLM包

从Github上看ChatGLM项目文件的结构来看，仅仅是包含三种部署方式的py代码与微调的py代码

而相关的实现细节，比如神经网络、激活函数、损失函数等具体的实现，并不在该项目源码中。
不管以哪种方式部署，最核心就是三句代码，其作用是引入模型参数，初始化transformers配置；以web部署的方式为例：

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
model = model.eval()

// 引入Gradio，实现web方式的使用

// 调用模型方法，开始进行对话推理
xx = model.stream_chat(xxxx);

web的调用是基于Gradio；
api的调用是基于fastapi；
cli的调用是基于python解释器；

Hugging Face

Hugging Face平台的模型库如下：

除去与训练后的模型参数(xxx.bin)外，其余的文件是huggingface的文件结构。

微调

微调的解决方案一般是P-Tuning或LoRA；ChatGLM-6B是基于P-Tuning v2实现的微调，P-Tuning v2是基于连续提示(continuous prompts)的思想。微调会生成新的模型参数文件，也称为checkpoint文件。
微调时可以选择全参数微调或是部分参数微调，其流程是训练+推理。训练生成新的checkpoint文件(模型参数)；推理则是加载模型参数文件。
训练前，需要调整参数，一般修改train.sh脚本文件就行。
推理时，加载原模型文件与微调后生成的checkpoint文件。还是通过那三句代码。
输出的checkpoint文件如下：

checkpoint文件夹内的文件如下：

transformers的联系

目前的模型，都会对接到Hugging Face平台的transformers库中，通过transformers库来管控大模型。所以在推理阶段通过三句代码就能调用AI模型。在微调阶段，生成的checkpoint文件中，其结构是Hugging Face平台的文件结构，包含transformers的相关配置及初始化信息。

总结

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：畅联云杂谈一：什么是畅联云平台下一篇： ChatGPT高质量prompt技巧指南-《向 ChatGPT 提问获取高质量答案的艺术：Prompt 工程技术完全指南》图书分享

分享：

最后一次编辑于 2024年01月02日 0

暂无评论

推荐阅读

大模型高效微调详解-从Adpter、PrefixTuning到LoRA

5OTSDeIZ9rqt 13天前 30 0 0 大模型

解密Prompt系列28. LLM Agent之金融领域摸索：FinMem & FinAgent

rYK3XVfHhGRB 13天前 31 0 0 大模型

Lora训练的参数和性能

NnaYPU9EV93V 13天前 25 0 0 大模型

开源医疗大模型排行榜: 健康领域大模型基准测试

QKcLjRV1cZqV 20天前 25 0 0 大模型

BiLSTM算法（二）

7B6SM42ujHWs 2024年04月10日 23 0 0 大模型

一文彻底整明白，基于Ollama工具的LLM大语言模型Web可视化对话机器人部署指南

CCMY6VB0yzoR 3天前 19 0 0 大模型

解密prompt系列27. LLM对齐经验之如何降低通用能力损失

rYK3XVfHhGRB 2024年04月13日 60 0 0 大模型

DashVector + ModelScope 玩转多模态检索

MhG91MnAND4r 4天前 7 0 0 大模型

一键部署，玩转AI！天翼云Llama 3大模型学习机来了！

1H97ZBKLEqYv 4天前 12 0 0 大模型

欢迎 Llama 3：Meta 的新一代开源大语言模型

QKcLjRV1cZqV 28天前 29 0 0 大模型

如何拥有自己的专属GPT-本地部署目前最强大模型llama3

O2yjgOPqUj0W 25天前 42 0 0 大模型

使用ollama分别在我的window、mac、小米手机上部署体验llama3-8b

p3KwAFlRikPF 29天前 47 0 0 大模型

聊聊从大模型来看NLP解决方案之UIE

zhNCThJtfE8g 29天前 27 0 0 大模型

玩转AI，笔记本电脑安装属于自己的Llama 3 8B大模型和对话客户端

CCMY6VB0yzoR 4天前 11 0 0 大模型

大模型+电力预测？

eKreP5gc7PAg 2024年04月20日 22 0 0 大模型

从零在win10上测试whisper、faster-whisper、whisperx在CPU和GPU的各自表现情况

p3KwAFlRikPF 4天前 16 0 0 大模型

华为云引领首个代码大模型国际标准立项

YqbaJkf98QJO 4天前 13 0 0 大模型

通过ORPO技术微调 llama3大模型(Fine-tune Llama 3 with ORPO)

p3KwAFlRikPF 28天前 28 0 0 大模型

聊聊大模型的屏蔽词工程

zhNCThJtfE8g 2024年04月16日 49 0 0 大模型

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

YqbaJkf98QJO 2024年04月12日 45 0 0 大模型

zhNCThJtfE8g

作者其他文章更多

聊聊从大模型来看NLP解决方案之UIE

2024-04-22

聊聊大模型的屏蔽词工程

2024-04-16

聊聊ChatGLM3多用户并发API调用的问题

2024-04-09

聊聊多模态大模型处理的思考

2024-03-27

聊聊大模型"打字机"效果的背后技术——SSE

2024-03-27

聊聊ShareGPT格式的微调数据集

2024-03-25

聊聊心理医疗领域大模型的落地思考

2024-03-21

聊聊大模型微调训练全流程的思考

2024-03-18

聊聊ChatGLM-6B医疗数据微调

2024-03-16

聊聊大模型的微调实现及其应用

2024-03-15

最新推荐更多

聊聊大模型的屏蔽词工程

2024-04-16

深度学习基本概念简介

2024-04-16

读天才与算法：人脑与AI的数学思维笔记01_洛夫莱斯测试

2024-04-16

RAG算法优化+新增代码仓库支持，CodeGeeX的@repo功能效果提升

2024-04-16

机器学习基本概念简介

2024-04-15

GPT连问工具随想

2024-04-15

读所罗门的密码笔记20_更好的自己

2024-04-15

Pytorch DistributedDataParallel（DDP）教程一：快速入门理论篇

2024-04-15

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

2024-04-15

向量数据库之Lancedb学习记录

2024-04-15

读所罗门的密码笔记19_治理模式

2024-04-14

解密prompt系列27. LLM对齐经验之如何降低通用能力损失

2024-04-13

读所罗门的密码笔记18_大宪章

2024-04-13

向量数据库Chroma学习记录

2024-04-13

最全能的AI换脸软件，FaceFusion下载介绍（可直播）

2024-04-13

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

2024-04-12

读所罗门的密码笔记17_网络安全

2024-04-12

基于香橙派AIpro将开源框架模型转换为昇腾模型

2024-04-12

元启发式算法库 MEALPY 初体验-遗传算法为例

2024-04-11

读所罗门的密码笔记16_直通心智

2024-04-11