12/6每日总结-摩杜云开发者社区

12/6每日总结

3XDZIv8qh70z 2023年12月07日 15 0

循环神经网络词元编码器编码器循环神经网络词元

今天继续学习了注意力机制，尤其学了添加了attention的seq2seq模型，还学习了自注意力机制，理解了attention机制的精髓

使用注意力机制的seq2seq

之前提到使用两个循环神经网络的编码器解码器结构实现了seq2seq的学习，实现机器翻译的功能

循环神经网络编码器将可变序列转换为固定形状的上下文变量，然后循环神经网络解码器根据生成的词元和上下文变量按词元生成输出序列词元

然而不是所有的输入词元都对解码某个词元都有用，在每个解码步骤中仍使用编码相同的上下文变量

在此时attention的加入就能改变这一点，科威助力模型Bahdanau，在预测词元时，如果不是所有输入词元都相关，模型将仅对齐输入序列中与当前预测相关的部分，这是通过将上下文变量视为注意力集中的输出来实现的

模型图：

上图就是一个带此结构的编码解码器模型图中，sources经过embedding后进入RNN形成编码器，编码器对于每次词的输出作为key和 value（它们是同样的）解码器RNN对上一个词的输出是query attention的输出与下一个词的词嵌入合并后进入下一次的RNN

自注意力机制

12/6每日总结_词元

12/6每日总结_循环神经网络_02

所谓自注意力就是KVQ都是来自同一个输入所得

【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载，内容版权归原作者所有。本网站的目的在于传递更多信息，不拥有版权，亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@moduyun.com

上一篇：俄罗斯AI突破：Kandinsky-3模型的创新与性能解析下一篇：猎户星空发布Yi-34B微调模型：OrionStar-Yi-34B-Chat的优势探析

分享：

最后一次编辑于 2023年12月07日 0

暂无评论

推荐阅读

分类预测 | Matlab实现基于SDAE堆叠去噪自编码器的数据分类预测

sighgy4X1iDp 2023年12月05日 17 0 0 无人机数据编码器数据编码器无人机

大语言模型与API融合：探索LLMs的概念及实用应用

IpTyf75QlyIY 2023年11月30日 15 0 0 AI LLM AI API 编码器数据数据编码器 API LLM

LLM模型参数助力多模态大模型高效训练

vq0vV6F1YWYp 2023年11月30日 16 0 0 编码器数据数据编码器模态模态

论文阅读：SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation

acjkVgjDeGbH 2023年11月19日 15 0 0 基线点云编码器编码器基线点云

12/10每日总结

3XDZIv8qh70z 2023年12月11日 13 0 0 编码器编码器全连接归一化全连接归一化

新一代“垫图”神器，IP-Adapter的完整应用解读

GlkGUhBxsw3T 2023年12月23日 85 0 0 IP 图像特征图像特征 IP 编码器编码器

LRM：单幅图像到三维的大型重建模型

NFuyy6GgPVw8 2023年12月11日 16 0 0 3D 图像特征编码器编码器 3D 图像特征

结合RNN与Transformer的强大模型

vq0vV6F1YWYp 2023年11月30日 13 0 0 建模编码器深度学习编码器建模深度学习

基于图卷积网络的关系数据建模

dT82YT6m3Dew 2023年11月19日 17 0 0 编码器数据集基线编码器数据集基线

12/6每日总结

3XDZIv8qh70z 2023年12月07日 16 0 0 循环神经网络词元编码器编码器循环神经网络词元

[论文阅读] Dist-GAN: An Improved GAN using Distance Constraints

CFu9A7vdykDj 2023年11月19日 15 0 0 生成器编码器数据数据编码器生成器

3XDZIv8qh70z

作者其他文章更多

12/12每日总结

2023-12-23

12/14每日总结

2023-12-23

12/15每日总结

2023-12-23

12/17每日总结

2023-12-23

12/19每日总结数据处理与数据划分

2023-12-23

12/10每日总结

2023-12-11

12/9今日总结

2023-12-10

12/7每日总结

2023-12-08

12/6每日总结

2023-12-07

12/5学习笔记

2023-12-06

最新推荐更多

【日记】母亲生日，我在跟数字人民币 Battle（612 字）

2024-05-18

FFmpeg开发笔记（二十一）Windows环境给FFmpeg集成AVS3解码器

2024-05-18

Qt学习第二篇（基本小组件的使用）

2024-05-18

全网首一份！你最需要的PPTP MS-CHAP V2 挑战响应编程模拟计算教程！代码基于RFC2759，附全部源码！

2024-05-18

Python 潮流周刊#51：用 Python 绘制美观的图表

2024-05-18

Django测试与持续集成：从入门到精通

2024-05-18

自研WPF插件系统(沙箱运行及热插拔)

2024-05-18

记一次asp.net 8 服务器爆满的解决过程

2024-05-18

非常全能WinForm 开发框架 - ReaLTaiizor

2024-05-18

C#反射

2024-05-18

net core jwt的基本原理和实现

2024-05-18

VUE3/JAVA 操作系统开发日志[day 1]

2024-05-18

Nginx R31 doc 官方文档-01-nginx 如何安装

2024-05-18

2024 年 5 月 8 日周三晴热（471 字）

2024-05-17

2024 年 5 月 9 日周四阴常（137 字）

2024-05-17

2024 年 5 月 10 日周五阴凉（1025 字）

2024-05-17

lua~基本语法

2024-05-17

2024 年 5 月 12 日母亲节周日晴常（197 字）

2024-05-17

2024 年 5 月 13 日周一晴热（376 字）

2024-05-17

2024 年 5 月 14 日周二多云热（270 字）

2024-05-17