为什么PostgreSQL对索引列执行顺序扫描?

非常简单的例子 – 一个表,一个索引,一个查询:

CREATE TABLE book ( id bigserial NOT NULL, "year" integer, -- other columns... ); CREATE INDEX book_year_idx ON book (year) EXPLAIN SELECT * FROM book b WHERE b.year > 2009 

给我:

 Seq Scan on book b (cost=0.00..25663.80 rows=105425 width=622) Filter: (year > 2009) 

为什么它不执行索引扫描呢? 我错过了什么?

如果SELECT返回表中所有行的大约5-10%,则顺序扫描比索引扫描快得多。

这是因为索引扫描每行需要几个 IO操作(查找索引中的行,然后从堆中检索行)。 而顺序扫描只需要每行有一个IO,甚至更less,因为磁盘上的块(页)包含多个行,因此可以使用单个IO操作获取多个行。

顺便说一句:这也适用于其他DBMS – 一些优化作为“仅索引扫描”被拿走(但对于一个SELECT *这是非常不可能的这样一个DBMS会去“索引只扫描”)

你分析了表/数据库吗? 那么统计数据呢? 当“年份> 2009”中有多条logging时,顺序扫描可能比索引扫描更快。