哪个网站可以自己做名片,淮南电商网站建设价格,做好中心网站建设工作,绥化建设网站验证索引效率
在讲解索引的使用原则之前#xff0c;先通过一个简单的案例#xff0c;来验证一下索引#xff0c;看看是否能够通过索引来提升 数据查询性能。在演示的时候#xff0c;我们还是使用之前准备的一张表 tb_sku , 在这张表中准备了1000w 的记录。 这张表中id为主…验证索引效率
在讲解索引的使用原则之前先通过一个简单的案例来验证一下索引看看是否能够通过索引来提升 数据查询性能。在演示的时候我们还是使用之前准备的一张表 tb_sku , 在这张表中准备了1000w 的记录。 这张表中id为主键有主键索引而其他字段是没有建立索引的。 我们先来查询其中的一条记录看 看里面的字段情况执行如下SQL
select * from tb_sku where id 1\G;可以看到即使有1000w的数据,根据id进行数据查询,性能依然很快因为主键id是有索引的。 那么接 下来我们再来根据 sn 字段进行查询执行如下SQL SELECT * FROM tb_sku WHERE sn 100000003145001;我们可以看到根据sn字段进行查询查询返回了一条数据结果耗时 20.78sec就是因为sn没有索 引而造成查询效率很低。
那么我们可以针对于sn字段建立一个索引建立了索引之后我们再次根据sn进行查询再来看一 下查询耗时情况。
创建索引
create index idx_sku_sn on tb_sku(sn) ;然后再次执行相同的SQL语句再次查看SQL的耗时。\
SELECT * FROM tb_sku WHERE sn 100000003145001;我们明显会看到sn字段建立了索引之后查询性能大大提升。建立索引前后查询耗时都不是一个数 量级的。 最左前缀法则
如果索引了多列联合索引要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始 并且不跳过索引中的列。如果跳跃某一列索引将会部分失效(后面的字段索引失效)。
以 tb_user 表为例我们先来查看一下之前 tb_user 表所创建的索引。 在 tb_user 表中有一个联合索引这个联合索引涉及到三个字段顺序分别为profession agestatus。
对于最左前缀法则指的是查询时最左变的列也就是profession必须存在否则索引全部失效。 而且中间不能跳过某一列否则该列后面的字段索引将失效。 接下来我们来演示几组案例看一下 具体的执行计划
explain select * from tb_user where profession 软件工程 and age 31 and status0; explain select * from tb_user where profession 软件工程 and age 31;explain select * from tb_user where profession 软件工程; 以上的这三组测试中我们发现只要联合索引最左边的字段 profession存在索引就会生效只不 过索引的长度不同。 而且由以上三组测试我们也可以推测出profession字段索引长度为47、age 字段索引长度为2、status字段索引长度为5。 explain select * from tb_user where age 31 and status 0; explain select * from tb_user where status 0; 而通过上面的这两组测试我们也可以看到索引并未生效原因是因为不满足最左前缀法则联合索引 最左边的列profession不存在。 explain select * from tb_user where profession 软件工程 and status 0;上述的SQL查询时存在profession字段最左边的列是存在的索引满足最左前缀法则的基本条 件。但是查询时跳过了age这个列所以后面的列索引是不会使用的也就是索引部分生效所以索 引的长度就是47。 思考题 当执行SQL语句: explain select * from tb_user where age 31 and status 0 and profession 软件工程 时是否满足最左前缀法则走不走 上述的联合索引索引长度 可以看到是完全满足最左前缀法则的索引长度54联合索引是生效的。 注意 最左前缀法则中指的最左边的列是指在查询时联合索引的最左边的字段(即是 第一个字段)必须存在与我们编写SQL时条件编写的先后顺序无关。 范围查询
联合索引中出现范围查询(,)范围查询右侧的列索引失效。
explain select * from tb_user where profession 软件工程 and age 30 and status0; 当范围查询使用 或 时走联合索引了但是索引的长度为49就说明范围查询右边的status字 段是没有走索引的。 explain select * from tb_user where profession 软件工程 and age 30 and
status 0;
当范围查询使用 或 时走联合索引了但是索引的长度为54就说明所有的字段都是走索引 的。
所以在业务允许的情况下尽可能的使用类似于 或 或 。 索引失效情况
索引列运算
不要在索引列上进行运算操作 索引将失效。
在tb_user表中除了前面介绍的联合索引之外还有一个索引是phone字段的单列索引。 A. 当根据phone字段进行等值匹配查询时, 索引生效。
explain select * from tb_user where phone 17799990015;B. 当根据phone字段进行函数运算操作之后索引失效。
explain select * from tb_user where substring(phone,10,2) 15;字符串不加引号
字符串类型字段使用时不加引号索引将失效。
接下来我们通过两组示例来看看对于字符串类型的字段加单引号与不加单引号的区别
explain select * from tb_user where profession 软件工程 and age 31 and status0;
explain select * from tb_user where profession 软件工程 and age 31 and status0; explain select * from tb_user where phone 17799990015;
explain select * from tb_user where phone 17799990015; 经过上面两组示例我们会明显的发现如果字符串不加单引号对于查询结果没什么影响但是数 据库存在隐式类型转换索引将失效。 模糊查询
如果仅仅是尾部模糊匹配索引不会失效。如果是头部模糊匹配索引失效。 接下来我们来看一下这三条SQL语句的执行效果查看一下其执行计划
由于下面查询语句中都是根据profession字段查询符合最左前缀法则联合索引是可以生效的 我们主要看一下模糊查询时%加在关键字之前和加在关键字之后的影响。
explain select * from tb_user where profession like 软件%;
explain select * from tb_user where profession like %工程;
explain select * from tb_user where profession like %工%; 经过上述的测试我们发现在like模糊查询中在关键字后面加%索引可以生效。而如果在关键字 前面加了%索引将会失效。 or连接条件
用or分割开的条件 如果or前的条件中的列有索引而后面的列中没有索引那么涉及的索引都不会 被用到。
explain select * from tb_user where id 10 or age 23;
explain select * from tb_user where phone 17799990017 or age 23;由于age没有索引所以即使id、phone有索引索引也会失效。所以需要针对于age也要建立索引。 然后我们可以对age字段建立索引
create index idx_user_age on tb_user(age);建立了索引之后我们再次执行上述的SQL语句看看前后执行计划的变化。 最终我们发现当or连接的条件左右两侧字段都有索引时索引才会生效。 数据分布影响
如果MySQL评估使用索引比全表更慢则不使用索引。
select * from tb_user where phone 17799990005;
select * from tb_user where phone 17799990015; 经过测试我们发现相同的SQL语句只是传入的字段值不同最终的执行计划也完全不一样这是为 什么呢
就是因为MySQL在查询时会评估使用索引的效率与走全表扫描的效率如果走全表扫描更快则放弃 索引走全表扫描。 因为索引是用来索引少量数据的如果通过索引查询返回大批量的数据则还不 如走全表扫描来的快此时索引就会失效。
接下来我们再来看看 is null 与 is not null 操作是否走索引。 执行如下两条语句
explain select * from tb_user where profession is null;
explain select * from tb_user where profession is not null; 接下来我们做一个操作将profession字段值全部更新为null。 然后再次执行上述的两条SQL查看SQL语句的执行计划。 最终我们看到一模一样的SQL语句先后执行了两次结果查询计划是不一样的为什么会出现这种 现象这是和数据库的数据分布有关系。查询时MySQL会评估走索引快还是全表扫描快如果全表 扫描更快则放弃索引走全表扫描。 因此is null 、is not null是否走索引得具体情况具体 分析并不是固定的。
、 SQL提示
目前tb_user表的数据情况如下: 索引情况如下:
把上述的 idx_user_age, idx_email 这两个之前测试使用过的索引直接删除。
drop index idx_user_age on tb_user;
drop index idx_email on tb_user; A. 执行SQL : explain select * from tb_user where profession 软件工程;
查询走了联合索引。 B. 执行SQL创建profession的单列索引create index idx_user_pro on tb_user(profession); C. 创建单列索引后再次执行A中的SQL语句查看执行计划看看到底走哪个索引。 测试结果我们可以看到possible_keys中 idx_user_pro_age_sta,idx_user_pro 这两个 索引都可能用到最终MySQL选择了idx_user_pro_age_sta索引。这是MySQL自动选择的结果。
那么我们能不能在查询的时候自己来指定使用哪个索引呢 答案是肯定的此时就可以借助于 MySQL的SQL提示来完成。 接下来介绍一下SQL提示。
SQL提示是优化数据库的一个重要手段简单来说就是在SQL语句中加入一些人为的提示来达到优 化操作的目的。 1). use index 建议MySQL使用哪一个索引完成此次查询仅仅是建议mysql内部还会再次进 行评估。
explain select * from tb_user use index(idx_user_pro) where profession 软件工
程; 2). ignore index 忽略指定的索引。
explain select * from tb_user ignore index(idx_user_pro) where profession 软件工
程; 3). force index 强制使用索引。
explain select * from tb_user force index(idx_user_pro) where profession 软件工
程;示例演示
A. use index
explain select * from tb_user use index(idx_user_pro) where profession 软件工
程; B. ignore index
explain select * from tb_user ignore index(idx_user_pro) where profession 软件工
程;C. force index
explain select * from tb_user force index(idx_user_pro_age_sta) where profession
软件工程; 覆盖索引
尽量使用覆盖索引减少select *。 那么什么是覆盖索引呢 覆盖索引是指 查询使用了索引并 且需要返回的列在该索引中已经全部能够找到 。
接下来我们来看一组SQL的执行计划看看执行计划的差别然后再来具体做一个解析。
explain select id, profession from tb_user where profession 软件工程 and age
31 and status 0 ;
explain select id,profession,age, status from tb_user where profession 软件工程
and age 31 and status 0 ;
explain select id,profession,age, status, name from tb_user where profession 软
件工程 and age 31 and status 0 ;
explain select * from tb_user where profession 软件工程 and age 31 and status0;上述这几条SQL的执行结果为: 从上述的执行计划我们可以看到这四条SQL语句的执行计划前面所有的指标都是一样的看不出来差 异。但是此时我们主要关注的是后面的Extra前面两天SQL的结果为 Using where; Using Index ; 而后面两条SQL的结果为: Using index condition 。
Extra含义Using where; Using Index查找使用了索引但是需要的数据都在索引列中能找到所以不需 要回表查询数据Using index condition查找使用了索引但是需要回表查询数据
因为在tb_user表中有一个联合索引 idx_user_pro_age_sta该索引关联了三个字段 profession、age、status而这个索引也是一个二级索引所以叶子节点下面挂的是这一行的主 键id。 所以当我们查询返回的数据在 id、profession、age、status 之中则直接走二级索引 直接返回数据了。 如果超出这个范围就需要拿到主键id再去扫描聚集索引再获取额外的数据了这个过程就是回表。 而我们如果一直使用select * 查询返回所有字段值很容易就会造成回表 查询除非是根据主键查询此时只会扫描聚集索引。 前缀索引
当字段类型为字符串varchartextlongtext等时有时候需要索引很长的字符串这会让 索引变得很大查询时浪费大量的磁盘IO 影响查询效率。此时可以只将字符串的一部分前缀建 立索引这样可以大大节约索引空间从而提高索引效率。
1). 语法 create index idx_xxxx on table_name(column(n)) ;示例:
为tb_user表的email字段建立长度为5的前缀索引。、
create index idx_email_5 on tb_user(email(5));2). 前缀长度
可以根据索引的选择性来决定而选择性是指不重复的索引值基数和数据表的记录总数的比值 索引选择性越高则查询效率越高 唯一索引的选择性是1这是最好的索引选择性性能也是最好的。
select count(distinct email) / count(*) from tb_user ;
select count(distinct substring(email,1,5)) / count(*) from tb_user ; 3). 前缀索引的查询流程 单列索引与联合索引
单列索引即一个索引只包含单个列。
联合索引即一个索引包含了多个列。
我们先来看看 tb_user 表中目前的索引情况: 在查询出来的索引中既有单列索引又有联合索引。 接下来我们来执行一条SQL语句看看其执行计划 通过上述执行计划我们可以看出来在and连接的两个字段 phone、name上都是有单列索引的但是 最终mysql只会选择一个索引也就是说只能走一个字段的索引此时是会回表查询的。
紧接着我们再来创建一个phone和name字段的联合索引来查询一下执行计划
create unique index idx_user_phone_name on tb_user(phone,name);此时查询时就走了联合索引而在联合索引中包含 phone、name的信息在叶子节点下挂的是对 应的主键id所以查询是无需回表查询的。、 在业务场景中如果存在多个查询条件考虑针对于查询字段建立索引时建议建立联合索引 而非单列索引。 如果查询使用的是联合索引具体的结构示意图如下