训练集(Train Set)、验证集(Validation Set)、测试集(Test Set)这三个名词在机器学习领域极其常见,但很多人并不是特别清楚,尤其是后两个经常被混淆。
而交叉验证很多教材和文章概念也不统一,即可用于划分数据集、也可用于模型选择及调参,也容易让大家误解。
为彻底搞明白这几个概念和用法,本文我们深度研究一下。
在本场 Chat 中,会讲到如下内容:
- 训练集,验证集,测试集概念、用法
- 交叉验证在不同教材及 sklearn 中的概念区别
- sklearn 交差验证方法划分数据集语法、参数解析、用法
- 不同数据条件下如何选择交差验证方法
- 运用交叉验证进行模型评估(语法、参数解析、用法)
适合人群:机器学习初学者
阅读全文: http://gitbook.cn/gitchat/activity/5dfca0dbcc57c30203cfbb10
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。