Mai Icy

Mai Icy

《图解机器学习算法》笔记——评估方法和各种数据的处理

有监督学习的评估 现梳理有监督学习的常见的评估方法、提高机器学习性能的方法,以及提高性能时的障碍。 分类问题的评估 混淆矩阵 混淆矩阵可以将分类结果以表格的形式汇总,这样就可以检查哪些标签分类正...

数据库内核实验报告三

基础实现思路和难度总结 先解决万圣节问题,后需要完成数据库并发的三种控制级别:读已提交,可重复读,可串行化。 本次实验使用MVCC多版本控制实现读已提交和可重复读,使用SS2PL严格两阶段锁来实...

《图解机器学习算法》笔记——无监督学习2

算法五:k-means算法 概述 聚类:把相似的数据汇总为簇的方法 该算法是一种聚类算法。 输入是多个数据点,并设置要聚类的簇数量,例如以下: 给定图a的数据点,要求分成3簇,图中给出了三...

《图解机器学习算法》笔记——无监督学习1

算法一:PCA 概述 是一种降维算法,可以将相关的多变量数据以主成分简洁地表现出来。 它对变量之间存在相关性的数据很有效。 对减少数据的方法: 只选择重要变量,舍弃其余变量 基于原变量构造新变...

数据库管理系统——并发控制2

乐观并发控制技术 时间戳 由数据库创建的用于标识事务串行化顺序的标识符,用TS(T)表示事务T的时间戳。 可以使用物理时钟和逻辑时钟(计数器类似于LSN) 事务和数据项都有时间戳 时间戳排序协议...

数据库管理系统——并发控制1

并发控制概览 进行一个控制级别的复习 并发:在同一时间间隔内有多个事件或者活动发生。 隔离级别 脏读 不可重复读 幻读 读未提交 允许 允许 允许 读已提交 不允许 允许 允许...

《图解机器学习算法》笔记——有监督学习3

算法七:随机森林 概述 随机森林通过多个决策树模型来共同解决问题的算法。单个决策树的性能不一定够高,由多个决策树多数表决得到的结果能有更高的预测精度。 如果每个决策树的结果相同,那么最后的表决...

《图解机器学习算法》笔记——有监督学习2

算法四:支持向量机 概述 支持向量机(Support Vector Machine,SVM)算法应用广泛,可以分类,可以回归。 在处理二元分类上: 支持向量机与逻辑回归的决策边界一样是线性的(...

《图解机器学习算法》笔记——有监督学习1

算法一:线性回归 概述 线性回归很常见,简单带过,就是把xy对应数据拟合成线性关系。 对于直线方程,有 ,其中有两个参数也就是k和b分别是斜率和截距。 学习参数:算法学得的参数例如斜率k和截距...

数据库内核实验报告二

基础实现思路和难度总结 在存储实现的基础上添加事务管理,解决数据库崩溃后的恢复等情况。 数据类架构 对于table来说有Table 和 TablePage Table:是上层操作,负责调用Ta...