我老师给我原题目是: 使用scikit-learn对给定数据集进行分类任务,详述项目过程,对模型进行调参并给出一组最优参数,阐述最优参数的判断依据和评价指标,阐述为什么要选取这个评价指标。
ok,我知道大家不喜欢废话,于是我直接上代码:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import io
data_str = output = io.StringIO('''编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是
4,青绿,蜷缩,沉闷,清晰,凹陷,硬