全球生成式AI全景图:AI应用进入大爆发时代(2023)
  jnyjONGydcL2 2023年11月02日 19 0


全球生成式AI全景图:AI应用进入大爆发时代(2023)_应用开发

生成式人工智能是自个人 PC 出现和互联网诞生以来最具颠覆性的技术创新,随着大模型以及 ChatGPT 等一系列“杀手级”应用的诞生,生成式 AI 在文本、图像、代码、音频、视频和 3D模型等领域展现出了强大的能力。模型、算力、生态推动为 AI 应用进入大爆发时代:

1)算法及模型的快速进步:2017 年 Transformer 模型及 2022 年 ChatGPT 的发布标志着GenAI 在文本领域的重大飞跃,并在多项能力上超越了人类基准,随着未来更强大的语言大模型(如 GPT-5),以及多模态大模型和视觉大模型的技术突破,将带动 AI 应用的持续进化。

2)算力基础设施将更快、更便宜:虽然短期内大模型训练需求的激增导致了算力成本的持续上涨,但是随着英伟达算力芯片的不断更新迭代,微软、亚马逊、谷歌等在 AI 云服务资本开支的不断加大,AI 应用的发展将得到更加强有力的支撑。

3)AI 生态的逐渐成熟:AI 组件层(AI Stack)的完善和产业分工细化,为 AI 应用在模型训练、数据整合、应用开发、应用部署等环节提供全生命周期的支撑。

全球生成式AI全景图:AI应用进入大爆发时代(2023)_应用开发_02

全球生成式AI全景图:AI应用进入大爆发时代(2023)_模态_03

全球生成式AI全景图:AI应用进入大爆发时代(2023)_模态_04

在语言大模型和多模态多模态大模型快速取得质变的同时,视觉领域的基础大模型 Vision Transformer(VIT)在 2020 年诞生后,近三年语义分割、目标检测、图像分类、实例分割等主要视觉任务上的能力均有明显提升。Vision Transformer(VIT)于 2020 年由 Google 提出,可以看成是 Transformer 的图形版本,在尽可能少的改造下将标准的 Transformer 模型直接迁移至图像领域变成 Vision Transformer 模型。

当前视觉大模型相当于 20 年前后的语言大模型:

1)Transformer 于 2017 年由 Google 提出,Vision Transformer 于 2020 年提出;

2)当前最大的语言模型已经超过万亿参数量级,当前最大的视觉模型刚刚达到百亿参数量级;

3)从 GPT-2(2019)开始,语言模型开始具备通用能力,而当前视觉模型基本仍只能处理特定视觉任务。

全球生成式AI全景图:AI应用进入大爆发时代(2023)_应用开发_05

全球生成式AI全景图:AI应用进入大爆发时代(2023)_应用开发_06

AI 组件层(AI Stack)是 AI 生态的重要组成部分,为模型训练、数据整合、应用开发、应用部署等提供支撑,AI 组件层的完善和产业分工细化,代表 AI 生态的逐渐成熟。AI 组件层具体包括了模型训练、数据整合、应用开发、应用部署等几个关键环节,各环节均已经初步跑出了一系列组件工具,可预见随着各个头部工具厂商不断拓展自身的产品线,AI 组件层的一体化和平台化程度会越来越高。

全球生成式AI全景图:AI应用进入大爆发时代(2023)_模态_07

全球生成式AI全景图:AI应用进入大爆发时代(2023)_人工智能_08

生成式 AI 应用按应用领域可以分为:通过工具,通用软件、行业软件、智能硬件四大类。具体来看:

1)工具型应用:包括聊天机器人、搜索引擎、文本工具、AI 作画以及代码工具等,应用领域主要集中在 C 端,产品的同质化程度较高,对底层模型的能力存在高度依赖,目前 C 端应用正进入第一轮洗牌阶段;

2)通用软件:主要包括办公软件、企业服务、IT 运维、软件开发、网络安全、数据智能等领域,各个赛道上均已出现标杆产品,大多数是智能助理(Coplilot)的形态,预计将在四季度进入商业化落地的关键阶段;

3)行业软件:涉及金融、医疗、教育、工业、游戏、法律等多个行业,行业间差异化程度较大,2B 场景下产品目前成熟度仍低于通用软件,金融、医疗等头部厂商开始打造垂类大模型,未来对行业数据价值的充分挖掘是竞争的关键;

4)智能硬件:汽车、机器人、智能终端等,无论智能驾驶还是机器人均具备巨大的市场空间,当前的瓶颈在于感知层与决策层,需要计算机视觉等底层技术的进一步突破。

全球生成式AI全景图:AI应用进入大爆发时代(2023)_数据_09

全球生成式AI全景图:AI应用进入大爆发时代(2023)_人工智能_10

全球生成式AI全景图:AI应用进入大爆发时代(2023)_数据_11

创意工具作为 AIGC 的关键应用领域,涉及到多种模态的生成和转换,其发展高度依赖于生成算法、大模型与多模态三大底层技术的进步:

1)生成算法:生成对抗网络(GAN)、变分自编码器(VAE)、扩散模型(Diffusion Model)、NeRF(2020)等算法的涌现,其中关键性的突破来自于近年来图片生成算法和 3D 模型生成算法的进步,

2)大模型:大模型可以广泛适用于各类下游任务,当前已经成为 AIGC 的底层框架:

3)多模态技术:多模态相关技术使得语言文字、图像、音视频等多种类型数据可以互相转化和生成,比较代表性的包括 Openai 公司的CLIP 模型。

全球生成式AI全景图:AI应用进入大爆发时代(2023)_数据_12

生成式 AI 相关标的涉及模型、算法、应用、算力四大类型厂商,重点看好具备明确商业化前景,能够基础行业纵深,场景卡位,数据资源的来构建竞争壁垒的应用产生过。此外,看好AI Infra 的应用工具链,作为 AI 中间层,工具链主要环节包括向量数据库等数据工具和应用开发组件等。

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
jnyjONGydcL2