Dataset:titanic(泰坦尼克号)数据集(是否获救二分类预测)的简介、下载、案例应用之详细攻略
目录
titanic(泰坦尼克号)数据集的简介
1、titanic数据集各字段描述及简介
titanic(泰坦尼克号)数据集的下载
titanic(泰坦尼克号)数据集的案例应用
titanic(泰坦尼克号)数据集的简介
泰坦尼克号沉船事故。1912年,当时隶属于英国的世界级豪华客轮泰坦尼克号,因在处女航行中不幸撞上北大西洋冰山而沉没。这场事故使得1500多名乘客罹难。后来,这场震惊世界的惨剧被详细地调查,而且遇难乘客的信息也逐渐被披露。在当时的救援条件下,无法在短时间内确认每位乘客生还的可能性。而今,许多科学家试图通过计算机模拟和分析找出潜藏在数据背后的生还逻辑,通过人工智能算法,尝试揭开这尘封了 100多年的数据的面纱。
titanic泰坦尼克号是当时世界上体积最庞大、内部设施最豪华的客运轮船,有“永不沉没”的美誉。然而不幸的是,在它的处女航中,泰坦尼克号便遭厄运,1912年4月14日23时40分左右,泰坦尼克号与一座冰山相撞,造成右舷船艏至船中部破裂,在2224名船员及乘客中,造成1517人丧生。
此次沉船事件如此严重,主要是因为当时没有足够的救生艇。有些人被获救,除了有运气因素之外,还有一些其他的因素值得分析,比如妇女、儿童、上层阶级等角色人员更可能会被获救。而titanic数据集记录了当时的状况,它被用来实现分类任务,是否获救二分类预测,预测泰坦尼克号上人员的是否获救状况。
数据集下载:Titanic - Machine Learning from Disaster | Kaggle
1、titanic数据集各字段描述及简介
| Variable | Definition | 中文描述 |
| survival | Survival | 该乘客是否获救,1是获救 |
| pclass | Ticket class | 乘客船票等级,1/2/3等舱位,一等票/二等票/三等票 |
| sex | Sex | 乘客性别 |
| Age | Age in years | 乘客年龄,以年为单位 |
| sibsp | # of siblings / spouses aboard the Titanic | 乘客,在泰坦尼克号上的堂兄妹/配偶的个数 |
| parch | # of parents / children aboard the Titanic | 乘客,在泰坦尼克号上的父母/孩子个数 |
| ticket | Ticket number | 乘客船票信息 |
| fare | Passenger fare | 乘客船票价格 |
| cabin | Cabin number | 乘客船舱信息 |
| embarked | Port of Embarkation | 乘客登船港口 C = Cherbourg, 经常将S、C、Q分别编码为0、1、2 |
titanic(泰坦尼克号)数据集的下载
下载地址:Titanic - Machine Learning from Disaster | Kaggle
titanic(泰坦尼克号)数据集的案例应用
相关文章
https://yunyaniu.blog.csdn.net/article/details/81700746
https://yunyaniu.blog.csdn.net/article/details/81749734
https://yunyaniu.blog.csdn.net/article/details/83833397
https://yunyaniu.blog.csdn.net/article/details/86725535
https://yunyaniu.blog.csdn.net/article/details/86725535
等等
