第43章:使用grouped convolutions进行加速的Transformer模型SqueezeBERT架构内幕及完整源码实现
1,Computer vision中的grouped convolutions数学原理分析
2,把grouped convolutions用来加速Transformer的架构设计
3,SqueezeBertTokenizer源码完整实现分析
4,SqueezeBertEmbeddings源码完整实现分析
5,MatMulWrapper源码完整实现分析
6,SqueezeBertLayerNorm源码完整实现分析
7,ConvDropoutLayerNorm源码完整实现分析
8,ConvActivation源码完整实现分析
9,SqueezeBertSelfAttention源码完整实现分析
10,SqueezeBertModule源码完整实现分析
11,SqueezeBertEncoder源码完整实现分析
12,SqueezeBertPooler源码完整实现分析
13,SqueezeBertPredictionHeadTransform源码完整实现分析
14,SqueezeBertLMPredictionHead源码完整实现分析
15,SqueezeBertOnlyMLMHead源码完整实现分析
16,SqueezeBertPreTrainedModel源码完整实现分析
17,SqueezeBertModel源码完整实现分析
18,SqueezeBertForMaskedLM源码完整实现分析
19,SqueezeBertForSequenceClassification源码完整实现分析
20,Squee
Transformer课程 第43章Transformer模型SqueezeBERT架构
关注
打赏
