Mai Icy
数据库内核实验报告五:查询优化
基础实现思路和难度总结 本次实验内容实现了查询重写和连接顺序优化的查询优化。 查询重写只涉及 分解复合选择谓词 下推选择运算 笛卡尔积转为连接运算 连接顺序优化以 贪心算法 为例 框架基本认...
数据库管理系统——查询优化
逻辑优化(查询重写) 查询重写:按照等价规则对关系代数表达式进行等价转换,提高效率 等价:对于两个关系代数表达式,等价替换后总能得到相同结果,则等价 查询重写规则 笛卡尔积,并,交,连接,都...
数据库管理系统——查询处理
查询处理概述 三步骤: 查询解析:将查询语句转化为容易被数据库执行的表达 查询优化:为优化查询的执行计划而进行各种逻辑等价的转换 查询执行:查询的实际执行 查询解析 通过SQL语句,生成查询...
数据库管理系统——数据库索引
索引概述 按照物理存储类型分类: 聚集索引:一张表只能有一个,按照key排序,范围查找更高效, 非聚集索引:一张表可以有多个,数据不一定按照索引列顺序存储。辅助索引、二级索引 按照指针记录的...
《图解机器学习算法》笔记——评估方法和各种数据的处理
有监督学习的评估 现梳理有监督学习的常见的评估方法、提高机器学习性能的方法,以及提高性能时的障碍。 分类问题的评估 混淆矩阵 混淆矩阵可以将分类结果以表格的形式汇总,这样就可以检查哪些标签分类正...
数据库内核实验报告三:多版本并发控制
基础实现思路和难度总结 先解决万圣节问题,后需要完成数据库并发的三种控制级别:读已提交,可重复读,可串行化。 本次实验使用MVCC多版本控制实现读已提交和可重复读,使用SS2PL严格两阶段锁来实...
《图解机器学习算法》笔记——无监督学习2
算法五:k-means算法 概述 聚类:把相似的数据汇总为簇的方法 该算法是一种聚类算法。 输入是多个数据点,并设置要聚类的簇数量,例如以下: 给定图a的数据点,要求分成3簇,图中给出了三...
《图解机器学习算法》笔记——无监督学习1
算法一:PCA 概述 是一种降维算法,可以将相关的多变量数据以主成分简洁地表现出来。 它对变量之间存在相关性的数据很有效。 对减少数据的方法: 只选择重要变量,舍弃其余变量 基于原变量构造新变...
数据库管理系统——并发控制2
乐观并发控制技术 时间戳 由数据库创建的用于标识事务串行化顺序的标识符,用TS(T)表示事务T的时间戳。 可以使用物理时钟和逻辑时钟(计数器类似于LSN) 事务和数据项都有时间戳 时间戳排序协议...
数据库管理系统——并发控制1
并发控制概览 进行一个控制级别的复习 并发:在同一时间间隔内有多个事件或者活动发生。 隔离级别 脏读 不可重复读 幻读 读未提交 允许 允许 允许 读已提交 不允许 允许 允许...