Mai Icy

“机器学习”

《图解机器学习算法》笔记——评估方法和各种数据的处理

有监督学习的评估 现梳理有监督学习的常见的评估方法、提高机器学习性能的方法,以及提高性能时的障碍。 分类问题的评估 混淆矩阵 混淆矩阵可以将分类结果以表格的形式汇总,这样就可以检查哪些标签分类正...

《图解机器学习算法》笔记——无监督学习2

算法五:k-means算法 概述 聚类:把相似的数据汇总为簇的方法 该算法是一种聚类算法。 输入是多个数据点,并设置要聚类的簇数量,例如以下: 给定图a的数据点,要求分成3簇,图中给出了三...

《图解机器学习算法》笔记——无监督学习1

算法一:PCA 概述 是一种降维算法,可以将相关的多变量数据以主成分简洁地表现出来。 它对变量之间存在相关性的数据很有效。 对减少数据的方法: 只选择重要变量,舍弃其余变量 基于原变量构造新变...

《图解机器学习算法》笔记——有监督学习3

算法七:随机森林 概述 随机森林通过多个决策树模型来共同解决问题的算法。单个决策树的性能不一定够高,由多个决策树多数表决得到的结果能有更高的预测精度。 如果每个决策树的结果相同,那么最后的表决...

《图解机器学习算法》笔记——有监督学习2

算法四:支持向量机 概述 支持向量机(Support Vector Machine,SVM)算法应用广泛,可以分类,可以回归。 在处理二元分类上: 支持向量机与逻辑回归的决策边界一样是线性的(...

《图解机器学习算法》笔记——有监督学习1

算法一:线性回归 概述 线性回归很常见,简单带过,就是把xy对应数据拟合成线性关系。 对于直线方程,有 ,其中有两个参数也就是k和b分别是斜率和截距。 学习参数:算法学得的参数例如斜率k和截距...