12/10每日总结-摩杜云开发者社区

12/10每日总结

3XDZIv8qh70z 2023年12月11日 19 0

编码器编码器全连接归一化全连接归一化

transformer

transformer架构

12/10每日总结_全连接

transformer的编码器是由多个相同的层叠加而成的，每个层都有两个子层

第一个子层是多头自注意力汇聚，第二个子层是基于位置的前馈网络

收到残差网络的启发，每个子层都采用了残差连接

transformer解码器也是由多个相同的层叠加而成的，并且层中使用了残差连接和层规范化。除了编码器中描述的两个子层之外，解码器还在这两个子层中插入了第三个子层，成为编码器-解码器注意力层，

多头注意力

12/10每日总结_编码器_02

多头注意力是一种特殊的使用自注意力的结构

是说同一k,v,q，希望抽取不同的信息，例如短距离关系和长距离关系

多头注意力使用h个独立的注意力池化，合并各个头输出得到最后的输出

有掩码的多头注意力

训练解码器对于序列中一个元素输出时，不应该考虑该元素之后的元素，可以通过掩码来实现，也就是计算X_i输出时，假装当前序列长度为i

基于位置的前馈网络

也就是图中的逐位前馈网络

实际上就是全连接，batch_size,n—》序列长度,dimension

由于n的长度不是固定的

将输入形状由(b,n,d)变换成(bn,d)
作用两个全连接层
输出形状由(bn,d)变换回(b,n,d)
等价于两层核窗口为1的一维卷积层

层归一化

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇： GPT的工作过程以及如何用好GPT 下一篇： Playground v2发布：生成效果胜过Stable Diffusion XL 2.5倍

分享：

最后一次编辑于 2023年12月11日 0

暂无评论

推荐阅读

分类预测 | Matlab实现基于SDAE堆叠去噪自编码器的数据分类预测

sighgy4X1iDp 2023年12月05日 23 0 0 无人机数据编码器数据编码器无人机

谁提出的全连接神经网络

ksyyEx5xKXha 2023年12月08日 22 0 0 神经网络权重神经网络全连接权重全连接

12/5学习笔记

3XDZIv8qh70z 2023年12月06日 19 0 0 池化搜索全连接全连接搜索池化

12/10每日总结

3XDZIv8qh70z 2023年12月11日 20 0 0 编码器编码器全连接归一化全连接归一化

深入研究与优化目标检测算法，以提高其性能与适用性的探索性研究

TraoyT88zu8W 2023年12月09日 22 0 0 卷积卷积目标检测全连接全连接目标检测

新一代“垫图”神器，IP-Adapter的完整应用解读

GlkGUhBxsw3T 2023年12月23日 104 0 0 IP 图像特征图像特征 IP 编码器编码器

LRM：单幅图像到三维的大型重建模型

NFuyy6GgPVw8 2023年12月11日 23 0 0 3D 图像特征编码器编码器 3D 图像特征

讲解OpenCV对图像的光照归一化处理

zzJeWaZlVwfH 2023年12月23日 34 0 0 直方图均衡化 OpenCV 直方图均衡化归一化归一化 OpenCV

深入解析LLaMA如何改进Transformer的底层结构

YqbaJkf98QJO 2023年12月07日 16 0 0 llama transformer 语言模型 LLM Transformer 归一化 llama 语言模型 LLM 归一化

12/6每日总结

3XDZIv8qh70z 2023年12月07日 17 0 0 循环神经网络词元编码器编码器循环神经网络词元

3XDZIv8qh70z

作者其他文章更多

12/12每日总结

2023-12-23

12/14每日总结

2023-12-23

12/15每日总结

2023-12-23

12/17每日总结

2023-12-23

12/19每日总结数据处理与数据划分

2023-12-23

12/10每日总结

2023-12-11

12/9今日总结

2023-12-10

12/7每日总结

2023-12-08

12/6每日总结

2023-12-07

12/5学习笔记

2023-12-06

最新推荐更多

Spring Boot —— 集成 MyBatis-Plus

2024-05-20

keycloak~作为第三方登录的对接标准

2024-05-20

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17