NLP
chatglm2-6b 标签描述

背景: 目前,大模型的技术应用已经遍地开花。最快的应用方式无非是利用自有垂直领域的数据进行模型微调。chatglm2-6b在国内开源的大模型上,效果比较突出。本文章分享的内容是用chatglm2-6b模型在集团EA的P40机器上进行垂直领域的LORA微调。 一、chatglm2-6b介绍 github:https://github.com/THUDM/ChatGLM2-6B chatglm2-6b相比于chatglm有几方面的提升: 1.性能提升:相比初代模型,升级了ChatGLM2-6B的基座模型,同时在各项数据集评测上取得了不错的成绩; 2.更长的上下文:我们将基座模型的上下文长度(Con...