预热篇1：大模型训练显卡选型-摩杜云开发者社区

预热篇1：大模型训练显卡选型

zpBjFmCagU9I 2023年11月12日 40 0

AI综合

AI模型训练主要使用GPU的算力，GPU,显卡这些知识大家都懂的，还是简单说一下GPU吧：GPU是显卡的核心部分，GPU承担着与 CPU 不同的定位和功能，芯片设计思路也完全不同，GPU Core 小而且多，它不承担系统管理、调度的功能，完全专注于使用(大量的)小核心并行化地执行运算。

GPU的几个主要用途：

1、处理图形渲染，包括游戏、视频和动画。

2、加速通用计算，如深度学习、科学模拟等。

3、高度并行处理，适用于大规模数据处理和处理密集型任务。

这里我们把NVIDIA显示芯片的显卡称为N卡，而将采用AMD显示芯片的显卡称为A卡，这两种显卡是目前的主流

Nvidia有个很有名次的编程框架CUDA，但是记住CUDA Core是商业营销概念，不能单纯用 CUDA Core的数量比较显卡性能

Nvidia 中大名鼎鼎的就是A100了，下面看看A100的架构

128个SM(流式多处理器)

流式多处理器包含TensorCore，TensorCore专门用于AI需要的矩阵运算

再探谈国产的华为昇腾AI芯片

华为昇腾AI芯片采用自研达芬奇架构，集成了2个AI Core，是昇腾AI芯片的计算核心，主要负责执行矩阵，向量，标量计算密集的算子任务，华为昇腾AI芯片对TensorFlow、PyTorch这些深度学习框架都支持。

就应用场景来说，升腾910主要被用于较小规模的AI任务，如人脸识别、图像分类和目标检测，适合嵌入式设备或中小规模的数据中心。支持国产，过几天会整理国产大模型ChatGLM，在升腾910上的部署、推理和训练的文章。

英伟达A100主要被用于大规模的数据中心和企业级应用，如机器学习、人工智能和深度学习等方面的高强度计算。它可以处理大规模的数据集，提供更高的能力和对多任务并发工作负载的支持。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： es笔记五之term-level的查询操作下一篇：偏差与方差区别

分享：

最后一次编辑于 2023年11月12日 0

暂无评论

推荐阅读

第六届·2024 MindSpore 量子计算黑客松热身赛赛题解读

YqbaJkf98QJO 2024年05月17日 65 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记24_预测性文本生成器

BD8Mqa3Ktdyv 2024年05月17日 40 0 0 AI综合

读人工智能时代与人类未来笔记01_重塑人类社会秩序

BD8Mqa3Ktdyv 2024年05月17日 35 0 0 AI综合

RustDesk 自建服务器部署和使用教程

166Ve614hKdJ 2024年05月17日 39 0 0 AI综合

读人工智能时代与人类未来笔记08_全球网络平台

BD8Mqa3Ktdyv 2024年05月20日 35 0 0 AI综合

用ChatGPT-4生成三体世界中的著名场景

oaRbYQvpZaaT 2024年05月20日 41 0 0 AI综合

全民AI的时代，如何创建一个属于自己的AI机器人

oaRbYQvpZaaT 2024年05月20日 50 0 0 AI综合

PaliGemma 正式发布 — Google 最新发布的前沿开放视觉语言模型

QKcLjRV1cZqV 2024年05月18日 48 0 0 AI综合

读人工智能时代与人类未来笔记06_机器学习的力量

BD8Mqa3Ktdyv 2024年05月18日 62 0 0 AI综合

开源RAG框架汇总

yCJS27XXARYK 2024年05月17日 56 0 0 AI综合

AI已来，我与AI一起用Python编写了一个消消乐小游戏

CCMY6VB0yzoR 2024年05月17日 65 0 0 AI综合

InLine Chat功能优化对标Github Copilot，CodeGeeX带来更高效、更直观的编程体验！

aEHR1Z2tWTaD 2024年05月17日 46 0 0 AI综合

OpenVoiceV2本地部署教程,苹果MacOs部署流程,声音响度统一,文字转语音,TTS

xvI3oTgzRc2D 2024年05月17日 60 0 0 AI综合

读人工智能时代与人类未来笔记07_人工智能往何处去

BD8Mqa3Ktdyv 2024年05月20日 45 0 0 AI综合

读人工智能时代与人类未来笔记03_演变

BD8Mqa3Ktdyv 2024年05月17日 31 0 0 AI综合

Photoshop AI生成式填充工具，PS AI怎么用，怎么注册升级PS AI账号？

En07e7YvOk1U 2024年05月17日 58 0 0 AI综合

读人工智能时代与人类未来笔记02_技术变革

BD8Mqa3Ktdyv 2024年05月17日 45 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记23_人工智能讲故事

BD8Mqa3Ktdyv 2024年05月17日 58 0 0 AI综合

读天才与算法：人脑与AI的数学思维笔记22_中文房间

BD8Mqa3Ktdyv 2024年05月17日 41 0 0 AI综合

AI 一键生成高清短视频，视频 UP 主们卷起来...

166Ve614hKdJ 2024年05月17日 38 0 0 AI综合

zpBjFmCagU9I

作者其他文章更多

开发篇1：使用原生api和Langchain调用大模型

2024-01-13

预热篇1：大模型训练显卡选型

2023-11-12

最新推荐更多

聊聊大模型的屏蔽词工程

2024-04-16

深度学习基本概念简介

2024-04-16

读天才与算法：人脑与AI的数学思维笔记01_洛夫莱斯测试

2024-04-16

RAG算法优化+新增代码仓库支持，CodeGeeX的@repo功能效果提升

2024-04-16

机器学习基本概念简介

2024-04-15

GPT连问工具随想

2024-04-15

读所罗门的密码笔记20_更好的自己

2024-04-15

Pytorch DistributedDataParallel（DDP）教程一：快速入门理论篇

2024-04-15

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

2024-04-15

向量数据库之Lancedb学习记录

2024-04-15

读所罗门的密码笔记19_治理模式

2024-04-14

解密prompt系列27. LLM对齐经验之如何降低通用能力损失

2024-04-13

读所罗门的密码笔记18_大宪章

2024-04-13

向量数据库Chroma学习记录

2024-04-13

最全能的AI换脸软件，FaceFusion下载介绍（可直播）

2024-04-13

“大模型驱动的软件研发” 华为云助推企业研发智能化升级

2024-04-12

读所罗门的密码笔记17_网络安全

2024-04-12

基于香橙派AIpro将开源框架模型转换为昇腾模型

2024-04-12

元启发式算法库 MEALPY 初体验-遗传算法为例

2024-04-11

读所罗门的密码笔记16_直通心智

2024-04-11