您当前的位置: 首页 >  段智华 架构

Transformer课程 第43章Transformer模型SqueezeBERT架构

段智华 发布时间:2021-11-27 09:58:52 ,浏览量:2

第43章:使用grouped convolutions进行加速的Transformer模型SqueezeBERT架构内幕及完整源码实现
1,Computer vision中的grouped convolutions数学原理分析
2,把grouped convolutions用来加速Transformer的架构设计
3,SqueezeBertTokenizer源码完整实现分析
4,SqueezeBertEmbeddings源码完整实现分析
5,MatMulWrapper源码完整实现分析
6,SqueezeBertLayerNorm源码完整实现分析
7,ConvDropoutLayerNorm源码完整实现分析
8,ConvActivation源码完整实现分析
9,SqueezeBertSelfAttention源码完整实现分析
10,SqueezeBertModule源码完整实现分析
11,SqueezeBertEncoder源码完整实现分析
12,SqueezeBertPooler源码完整实现分析
13,SqueezeBertPredictionHeadTransform源码完整实现分析
14,SqueezeBertLMPredictionHead源码完整实现分析
15,SqueezeBertOnlyMLMHead源码完整实现分析
16,SqueezeBertPreTrainedModel源码完整实现分析
17,SqueezeBertModel源码完整实现分析
18,SqueezeBertForMaskedLM源码完整实现分析
19,SqueezeBertForSequenceClassification源码完整实现分析
20,Squee

关注
打赏
查看更多评论

段智华

暂无认证

  • 2浏览

    0关注

    1232博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文
立即登录/注册

微信扫码登录