全球生成式AI全景图：AI应用进入大爆发时代（2023）-摩杜云开发者社区

全球生成式AI全景图：AI应用进入大爆发时代（2023）_应用开发

生成式人工智能是自个人 PC 出现和互联网诞生以来最具颠覆性的技术创新，随着大模型以及 ChatGPT 等一系列“杀手级”应用的诞生，生成式 AI 在文本、图像、代码、音频、视频和 3D模型等领域展现出了强大的能力。模型、算力、生态推动为 AI 应用进入大爆发时代：

1）算法及模型的快速进步：2017 年 Transformer 模型及 2022 年 ChatGPT 的发布标志着GenAI 在文本领域的重大飞跃，并在多项能力上超越了人类基准，随着未来更强大的语言大模型（如 GPT-5），以及多模态大模型和视觉大模型的技术突破，将带动 AI 应用的持续进化。

2）算力基础设施将更快、更便宜：虽然短期内大模型训练需求的激增导致了算力成本的持续上涨，但是随着英伟达算力芯片的不断更新迭代，微软、亚马逊、谷歌等在 AI 云服务资本开支的不断加大，AI 应用的发展将得到更加强有力的支撑。

3）AI 生态的逐渐成熟：AI 组件层（AI Stack）的完善和产业分工细化，为 AI 应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。

全球生成式AI全景图：AI应用进入大爆发时代（2023）_应用开发_02

全球生成式AI全景图：AI应用进入大爆发时代（2023）_模态_03

全球生成式AI全景图：AI应用进入大爆发时代（2023）_模态_04

在语言大模型和多模态多模态大模型快速取得质变的同时，视觉领域的基础大模型 Vision Transformer（VIT）在 2020 年诞生后，近三年语义分割、目标检测、图像分类、实例分割等主要视觉任务上的能力均有明显提升。Vision Transformer（VIT）于 2020 年由 Google 提出，可以看成是 Transformer 的图形版本，在尽可能少的改造下将标准的 Transformer 模型直接迁移至图像领域变成 Vision Transformer 模型。

当前视觉大模型相当于 20 年前后的语言大模型：

1）Transformer 于 2017 年由 Google 提出，Vision Transformer 于 2020 年提出；

2）当前最大的语言模型已经超过万亿参数量级，当前最大的视觉模型刚刚达到百亿参数量级；

3）从 GPT-2（2019）开始，语言模型开始具备通用能力，而当前视觉模型基本仍只能处理特定视觉任务。

全球生成式AI全景图：AI应用进入大爆发时代（2023）_应用开发_05

全球生成式AI全景图：AI应用进入大爆发时代（2023）_应用开发_06

AI 组件层（AI Stack）是 AI 生态的重要组成部分，为模型训练、数据整合、应用开发、应用部署等提供支撑，AI 组件层的完善和产业分工细化，代表 AI 生态的逐渐成熟。AI 组件层具体包括了模型训练、数据整合、应用开发、应用部署等几个关键环节，各环节均已经初步跑出了一系列组件工具，可预见随着各个头部工具厂商不断拓展自身的产品线，AI 组件层的一体化和平台化程度会越来越高。

全球生成式AI全景图：AI应用进入大爆发时代（2023）_模态_07

全球生成式AI全景图：AI应用进入大爆发时代（2023）_人工智能_08

生成式 AI 应用按应用领域可以分为：通过工具，通用软件、行业软件、智能硬件四大类。具体来看：

1）工具型应用：包括聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等，应用领域主要集中在 C 端，产品的同质化程度较高，对底层模型的能力存在高度依赖，目前 C 端应用正进入第一轮洗牌阶段；

2）通用软件：主要包括办公软件、企业服务、IT 运维、软件开发、网络安全、数据智能等领域，各个赛道上均已出现标杆产品，大多数是智能助理（Coplilot）的形态，预计将在四季度进入商业化落地的关键阶段；

3）行业软件：涉及金融、医疗、教育、工业、游戏、法律等多个行业，行业间差异化程度较大，2B 场景下产品目前成熟度仍低于通用软件，金融、医疗等头部厂商开始打造垂类大模型，未来对行业数据价值的充分挖掘是竞争的关键；

4）智能硬件：汽车、机器人、智能终端等，无论智能驾驶还是机器人均具备巨大的市场空间，当前的瓶颈在于感知层与决策层，需要计算机视觉等底层技术的进一步突破。

全球生成式AI全景图：AI应用进入大爆发时代（2023）_数据_09

全球生成式AI全景图：AI应用进入大爆发时代（2023）_人工智能_10

全球生成式AI全景图：AI应用进入大爆发时代（2023）_数据_11

创意工具作为 AIGC 的关键应用领域，涉及到多种模态的生成和转换，其发展高度依赖于生成算法、大模型与多模态三大底层技术的进步：

1）生成算法：生成对抗网络（GAN）、变分自编码器（VAE）、扩散模型（Diffusion Model）、NeRF（2020）等算法的涌现，其中关键性的突破来自于近年来图片生成算法和 3D 模型生成算法的进步，

2）大模型：大模型可以广泛适用于各类下游任务，当前已经成为 AIGC 的底层框架：

3）多模态技术：多模态相关技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成，比较代表性的包括 Openai 公司的CLIP 模型。

全球生成式AI全景图：AI应用进入大爆发时代（2023）_数据_12

生成式 AI 相关标的涉及模型、算法、应用、算力四大类型厂商，重点看好具备明确商业化前景，能够基础行业纵深，场景卡位，数据资源的来构建竞争壁垒的应用产生过。此外，看好AI Infra 的应用工具链，作为 AI 中间层，工具链主要环节包括向量数据库等数据工具和应用开发组件等。