以下链接是个人关于 voxelpose (多视角3D人体姿态估算) 所有见解,如有错误欢迎大家指出,我会第一时间纠正。有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励。文末附带 公众号 − \color{blue}{公众号 -} 公众号− 海量资源。 \color{blue}{ 海量资源}。 海量资源。
姿态估计4-00:voxelpose(多视角3D人体姿态估算)-目录-史上最新无死角讲解
前言该章节的内容比较单调,把 cfg 文件注释单独作为一篇博客列出来,是为了大家方便查找和分析(如果有错误的地方,需要大家及时指出)。本人只是拿了一个样品版本,为 configs\campus\prn64_cpn80x80x20.yaml ,注释如下:
config 注释CUDNN:
BENCHMARK: true #
DETERMINISTIC: false # 图片尺寸不固定
ENABLED: true # 使能GPU
BACKBONE_MODEL: '' #
MODEL: 'multi_person_posenet'
DATA_DIR: '' # 数据集目录
GPUS: '0' # 指定GPU训练的
OUTPUT_DIR: 'output' # 输出目录(该目录包含了生成的)
LOG_DIR: 'log' # log打印目录
WORKERS: 4 # 读取数据的线程数目
PRINT_FREQ: 100 # 每迭代100次,进行一次打印
DATASET:
COLOR_RGB: True # 训练数据格式,设置为RGB格式
TRAIN_DATASET: 'campus_synthetic' # 训练数据集名称
TEST_DATASET: 'campus' # 城市数据集名称
DATA_FORMAT: png # 数据集图片格式
DATA_AUGMENTATION: False # 是否使用数据增强
FLIP: False # 是否进行水平翻转
ROOT: 'data/CampusSeq1'
ROT_FACTOR: 45 # 是骨骼根节点序号
SCALE_FACTOR: 0.35 # 缩放因子
TEST_SUBSET: 'validation' # 验证集,子数据集
TRAIN_SUBSET: 'train' # 训练集,子数据集
ROOTIDX: # ?
- 2
- 3
CAMERA_NUM: 3 # 摄像头数目
NETWORK:
PRETRAINED_BACKBONE: '' # 预训练模型主干网络
PRETRAINED: '' # 'models/pytorch/imagenet/resnet50-19c8e357.pth' 预训练模型路径
TARGET_TYPE: gaussian # # 数据增强,高斯模糊
IMAGE_SIZE: # 输入图像大小
- 800
- 640
HEATMAP_SIZE: # 热图大小
- 200
- 160
SIGMA: 3 #是不使用backbone生成heatmap时gaussion的参数
NUM_JOINTS: 17 # 人体关节点数目
USE_GT: False # 是否使用人体关键点的ground truch
LOSS: #
USE_TARGET_WEIGHT: true # 是否对不同loss使用不同权重
TRAIN: # 训练配置
BATCH_SIZE: 1 # batch size
SHUFFLE: true # 孙吉采集数据训练
BEGIN_EPOCH: 0 # 起始的 epoch
END_EPOCH: 30 # 结束的 epoch
RESUME: true # 是否继续进行训练
OPTIMIZER: adam # 指定优化器
LR: 0.0001 # 学习率
TEST: # 测试配置
MODEL_FILE: "model_best.pth.tar" # 测试模型路径
BATCH_SIZE: 4 # 测试时的batch_size
DEBUG: # debug模式相关配置
DEBUG: true # 是否启动debug模式
SAVE_HEATMAPS_GT: true # 保存头部的热图的 ground truch
SAVE_HEATMAPS_PRED: true # 保存每张热图
MULTI_PERSON: # person的相关设置设置
SPACE_SIZE: # # 检测的空间大小,单位为mm
- 12000.0
- 12000.0
- 2000.0
SPACE_CENTER: # 空间的中间坐标,单位为mm
- 3000.0
- 4500.0
- 1000.0
INITIAL_CUBE_SIZE: # 初始立方体形状
- 80
- 80
- 20
MAX_PEOPLE_NUM: 10 # 最大的person数目
THRESHOLD: 0.1 # 阈值
PICT_STRUCT: # 图像的结构
GRID_SIZE: # 每个网格的大小
- 2000.0
- 2000.0
- 2000.0
CUBE_SIZE: # 立方体大小
- 64
- 64
- 64