《Python机器学习基础教程 》笔记-第1章

Github链接:《第1章》

必要的库和工具

Jupyter Notebook

NumPy

常用多维数组:

SciPy

稠密转稀疏:

直接创建稀疏:

matplotlib

科学绘图库

pandas

操作表格的库

第一个应用:鸢尾花分类

初识数据

训练数据与测试数据

切分样本

观察数据

检查数据,看是否有异常的数据和特殊值,通过组合每2个特征+分类绘制一个散点图的矩阵。

可以从散点图看出,特征与分类具备明显的关联性。

训练第一个模型:K邻近分类算法

做出预测

评估模型

小结

  • 监督学习与非监督学习
  • 可能的品种叫做”分类”,具体每个样本的品种就叫做”标签”
  • 数据集需划分为训练集和测试集
  • 数据集包括了X和y,其中X是特征的二维数组,y是标签的一维数组
  • 本章用到了scikit-learn中任何机器学习算法的核心方法:fit、predict、score

如果文章帮助您解决了工作难题,您可以帮我点击屏幕上的任意广告,或者赞助少量费用来支持我的持续创作,谢谢~