BERT模型batch_size对预测结果的影响
  CKzxWsONWzRf 2023年11月02日 81 0

原因:

不同长度文本pad一致长度,添加pad后会对预测有一丢丢影响,虽然mask会抵消大部分影响,但是还是会一留下一点点影响。

解决办法:

多次采用不同的batch_size测试模型,发现离模型训练使用的batch_size越近,与单条预测的结果差别越小,因此推荐结合实际情况,选用与训练batch_size相近的数目。


【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

CKzxWsONWzRf