高性能的MySQL(6)查询慢与重构查询2014-06-23只有好的库表结构、合理的索引还不够,我们还需要合理的设计查询,齐头并进,一个不少才能充分发挥MySQL的优势。一、查询为什么会慢?每一个查询由一系列的子任务组成,每个子任务都会消耗一定的时间。这个我们在之前的单个查询分析时已经简单介绍了,当然还有额外的因素,比方说包括网络,CPU计算,统计信息,执行计划,锁等待等操作,或者底层引擎在调用内存,CPU操作,I/O操作等上的消耗时间。优化查询的目的就是减少和消除这些操作所花费的时间。查询性能低下的最基本原因是访问的数据太多,大部分的性能低下的查询可以通过减少访问的数据量进行优化,一般有2个简单的分析方法:1、确认应用程序是否返回了大量超过需要的数据,这就是说访问了太多的行,也有时候是因为访问了太多的列,这会增加很多额外的开销,包括,网络,CPU,内存等。一些常见的例子:a、查询不需要的记录一个常见的错误是常常会以为MySQL会只返回需要的数据,实际上却是先返回全部的查询结果再进行计算,一个简单有效的解决方法是在查询后面加上LIMIT。b、多表关联时返回全部列比如,要查找所有在电影hreo中出现的演员,不要这样去写
select * from actorinner join film_actor using(actor_id)inner join film using(film_id)where film.title = "hreo";
这会返回三个表的全部列,应该只返回需要的列
select actor.* from actorinner join film_actor using(actor_id)inner join film using(film_id)where film.title = "hreo";
c、不要总是取出全部的列
select * from actor....d、重复查询相同的数据例如在用户评论的地方需要查询用户的头像,如果用户多次评论,可能会反复查询这个数据,可以先缓存起来,这样会更好。2、确认MySQL服务层是否在返回前检索大量超过需要的数据行。如果查询为了返回结果扫描过多的数据,那么就不合适了,一般看3个指标:a、响应时间响应时间分为服务时间和排队时间。这个很难细分,如果是在一个合理的值,那就可以接受。b、扫描的行和返回的行这个在一定程度上能够说明该查询找到需要的数据效率怎么样。理想的情况下,扫描的行和返回的行是相同的,不过实际中这是很难的,特别是做关联查询时。c、扫描的行和访问类型在explain语句中的type列反应了访问类型。从全表扫描到索引扫描,范围扫描,唯一索引查询,常数引用等,速度从慢到快,扫描的行从大到小。一般我们增加一个合适的索引就可以很高效了。
CREATE TABLE `emp5` (`id` int(11) NOT NULL DEFAULT "0",`name` varchar(100) NOT NULL,`job` varchar(100) NOT NULL,`num1` int(10) DEFAULT NULL,`num2` int(10) DEFAULT NULL,`num3` int(10) DEFAULT NULL,`job_num` int(10) DEFAULT NULL,`d` date DEFAULT NULL,PRIMARY KEY (`id`),KEY `job_num` (`job_num`)) ENGINE=MyISAM DEFAULT CHARSET=utf8;