深度学习
MindSpore 标签描述

本文分享自华为云社区《基于MindSpore的ChatGLM微调》,作者:JeffDing。 基于MindSpore的ChatGLM微调 克隆HuggingFace模型 克隆chatglm-6b代码仓,下载分布式的模型文件 gitlfsinstall gitclonehttps://huggingface.co/THUDM/chatglm-6b 准备环境 安装Transformer pipinstalltransformers 执行python脚本,合并模型权重。 fromtransformersimportAutoModel importtorchaspt pt_ckpt_pat...

本文分享自华为云社区 《【云享问答】第3期:大模型时代,如何快速开发AI应用》,作者:华为云社区精选。 大模型快速普及应用的当下,AI浪潮汹涌而至,对于开发者来说,开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵,从数据处理、算法开发、模型训练到部署,全方位拆解AI开发全流程,本期 【云享问答】 通过这14个问题,带你上手华为云一站式AI开发平台ModelArts,实现AI应用的快速开发。 Q1、AI开发的基本流程是怎样的? 一个典型的AI应用开发包括数据处理、算法开发、模型训练、模型部署等,在ModelArts上可以完成以...

本文分享自华为云社区《DTSETechTalk|第47期:MoE:LLM终身学习的可能性》,作者:华为云社区精选。 在DTSETechTalk的第47期直播《MoE:LLM终身学习的可能性》中,昇思MindSpore技术专家吕老师与各位开发者分享有关于LLMlifelonglearning的概念,帮助大家了解持续学习的特性与理论知识,同时也详细介绍了MoE的发展史,让我们更为直观的去理解其中技术要点。 Continuallifelonglearning(终身学习) 终身学习系统被定义为一种能够从连续的信息中学习的自适应算法,随着时间的推移,这些信息逐步可用,并且所要学习的任务数量(例如,分类任...