性能分析

PostgreSQL 提供了 EXPLAIN 语句,它可以用来分析 SQL 的执行情况。本章将对其进行讨论。

简介

explain 语句返回 PostgreSQL 规划器为给定 SQL 语句生成的执行计划。它显示了一条语句涉及的表将通过索引扫描或顺序扫描等方式进行扫描,以及如果使用多张表,将使用什么样的连接算法。

它的语法如下:

EXPLAIN [ ( 选项 [, ...] ) ] SQL语句;

以下选项的 boolen 是一个开关,通过传递 TRUEFALSE 来打开或关闭某个选项。

  • ANALYZE [ boolean ] :该选项导致先执行SQL语句,然后返回实际运行时的统计信息,包括每个计划节点花费的总运行时间以及实际返回的行数。它真实地执行了 SQL 语句,并丢弃执行结果。如果要分析 INSERT/UPDATA/DELETE等语句,并且不想影响实际数据,应该将 explain 放在事务中,并进行回滚。
  • VERBOSE [ boolean ] :显示有关计划的附加信息
  • COSTS [ boolean ] :包括每个计划节点的估计成功和总成本。以及查询计划中的估计行数和每行的估计宽度。
  • BUFFERS [ boolean ] :向缓冲区添加信息,仅在 ANALYZE 启用是才能使用。
  • TIMING [ boolean ] :输出实际启动时间和每个节点花费的时间。仅在启用 ANALYZE 时才能使用。
  • SUMMARY [ boolean ] :在查询计划后添加摘要信息,比如总计时。
  • FORMAT { TEXT | XML | JSON | YAML }:指定查询计划的输出格式,默认为 TEXT

示例

EXPLAIN SELECT * FROM film;

/*结果
                        QUERY PLAN
----------------------------------------------------------
 Seq Scan on film  (cost=0.00..64.00 rows=1000 width=384)
 */

按指定 film_id 返回电影的 EXPLAIN

EXPLAIN SELECT * FROM film WHERE film_id = 100;

/*结果
                               QUERY PLAN
------------------------------------------------------------------------
 Index Scan using film_pkey on film  (cost=0.28..8.29 rows=1 width=384)
   Index Cond: (film_id = 100)
*/   

由于 film_id 已建立索引,所以它使用的是按索引扫描,而不是顺序扫描。

要抑制成本,可以使用 COSTS 选项:

 EXPLAIN (COSTS FALSE) SELECT * FROM film WHERE film_id = 100;
 /*结果
             QUERY PLAN
------------------------------------
 Index Scan using film_pkey on film
   Index Cond: (film_id = 100)
*/   

使用聚合函数:

EXPLAIN SELECT COUNT(*) FROM film;
/* 结果
                          QUERY PLAN
--------------------------------------------------------------
 Aggregate  (cost=66.50..66.51 rows=1 width=8)
   ->  Seq Scan on film  (cost=0.00..64.00 rows=1000 width=0)
*/

使用多表连接:

添加 ANALYZE ,将实际运行时统计信息添加到输出中:

要查看完整内容,请先登录