CREATE STATISTICS — 定义扩展统计
CREATE STATISTICS [ IF NOT EXISTS ]statistics_name[ (statistics_kind[, ... ] ) ] ONcolumn_name,column_name[, ...] FROMtable_name
CREATE STATISTICS将创建一个新的扩展统计对象,
追踪指定表、外部表或物化视图的数据。该统计对象将在当前数据库中创建,
被发出该命令的用户所有。
如果给定了模式名(比如,CREATE STATISTICS myschema.mystat ...),
那么在给定的模式中创建统计对象。否则在当前模式中创建。
统计对象的名称必须与相同模式中的任何其他统计对象不同。
IF NOT EXISTS如果具有相同名称的统计对象已经存在,不会抛出一个错误,只会发出一个提示。 请注意,这里只考虑统计对象的名称,不考虑其定义细节。
statistics_name要创建的统计对象的名称(可以有模式限定)。
statistics_kind 在此统计对象中计算的统计种类。目前支持的种类是启用n-distinct统计的
ndistinct,以及启用功能依赖性统计的dependencies。
如果省略该子句,则统计对象中将包含所有支持的统计类型。
有关更多信息,请参阅第 14.2.2 节和
第 68.2 节。
column_name被计算的统计信息包含的表格列的名称。至少必须给出两个列名。
table_name包含计算统计信息的列的表的名称(可以是模式限定的)。
你必须是表的所有者才能创建读取它的统计对象。不过,一旦创建, 统计对象的所有权与基础表无关。
用两个功能相关的列创建表t1,
即第一列中的值的信息足以确定另一列中的值。然后,
在这些列上构建函数依赖关系统计信息:
CREATE TABLE t1 (
a int,
b int
);
INSERT INTO t1 SELECT i/100, i/500
FROM generate_series(1,1000000) s(i);
ANALYZE t1;
-- 匹配行的数量将被大大低估:
EXPLAIN ANALYZE SELECT * FROM t1 WHERE (a = 1) AND (b = 0);
CREATE STATISTICS s1 (dependencies) ON a, b FROM t1;
ANALYZE t1;
-- 现在行计数估计会更准确:
EXPLAIN ANALYZE SELECT * FROM t1 WHERE (a = 1) AND (b = 0);
如果没有函数依赖性统计,规划器会认为两个WHERE条件是独立的,
并且会将它们的选择性乘以一起,以致得到太小的行数估计。
通过这样的统计,规划器认识到WHERE条件是多余的,并且不会低估行数。
SQL标准中没有CREATE STATISTICS命令。