第44章:Text-to-Text Transfer Transformer (T5)架构内幕及完整源码
1,T5能够把任意的语言问题转化为text-to-text格式背后的数学原理解析
2,T5架构流程解析及其广泛应用
3,T5 model structure详解
4,T5 Pretrained dataset分析
5,T5训练的unsupervised objective解析
6,T5的pretraining, fine-tuning, and evaluating workflow分析
7,T5的Multi-task解析
8,T5模型Scaling剖析
9,混合使用unsupervised and supervised task
10,relative scalar embeddings数学原理分析
11,T5Tokenizer源码完整实现分析
12,load_tf_weights_in_t5源码完整实现分析
13,T5LayerNorm源码完整实现分析
14,T5DenseReluDense源码完整实现分析
15,T5DenseGatedGeluDense源码完整实现分析
16,T5LayerFF源码完整实现分析
17,prune_heads源码完整实现分析
18,relative_position_bucket源码完整实现分析
19,compute_bias源码完整实现分析
20,T5Attention源码完整实现分析
21,T5LayerSelfAttention源码完整实现分析
22,T5LayerCrossAttention源码完整实现分析
23
Transformer课程 第44章Text-to-Text Transfer Transformer (T5)架构
关注
打赏
