PostgreSQL: промышленная разработка баз данных. Лекция 5

PostgreSQL: промышленная
разработка баз данных
Лекция 5
Механизм выполнения запроса. План запроса, виды операций.
Оптимизация запросов. Оператор EXPLAIN. Типы индексов.
Устройство PostgreSQL
PostgreSQL: промышленная разработка баз данных. Лекция 5
Обработка запроса в PostgreSQL
 Parser (синтаксический анализатор)
 Planner (выбор оптимального пути)
 Executor (непосредственное выполнение)
SQL – декларативный язык. СУБД решает, как
именно будет выполняться запрос.
EXPLAIN
 План запроса – дерево
 Узлы – действия
− соединения (join)
− сортировка
− просмотр таблицы
 Выполнение происходит от листьев к корню
 Оценка «ширины» данных, количества строк и
стоимости
 Это только оценка, реальную стоимость покажет
EXPLAIN ANALYZE
Пример EXPLAIN
test=# explain select * from pg_proc order by proname;
QUERY PLAN

Sort (cost=190.00..195.35 rows=2143 width=339)
Sort Key: proname
> Seq Scan on pg_proc (cost=0.00..71.43 rows=2143
width=339)
(3 rows)
EXPLAIN: width
QUERY PLAN

Sort Key: proname
> Seq Scan on pg_proc (cost=0.00..71.66 rows=2166 width=299)
(3 rows)
Показывает примерное среднее «Ширины» типов данных

количество байт в одной int2 2
строке результата int4 4
int8 8
boolean 1
varchar(n) / char(n) n + 4
timestamp / timestamptz 8
EXPLAIN: rows
QUERY PLAN

Sort Key: proname
(3 rows)

Показывает примерное количество строк результата (в т.ч.,
промежуточного)

Большое отклонение от реальности => необходим VACUUM &
ANALYZE!

Можно использовать для вывода примерного количества строк
результата конечному пользователю
EXPLAIN: cost
QUERY PLAN

Sort Key: proname
(3 rows)

Абстрактная величина (вводавывода, CPU)

Именно это даёт возможность планнеру выбрать один план из
нескольких

2 значения: startup & total

Это всего лишь оценка!
EXPLAIN ANALYZE
test=# explain analyze select * from pg_proc order by proname;
QUERY PLAN

Sort (cost=190.00..195.35 rows=2143 width=339) (actual
time=423.508..426.069 rows=2143 loops=1)
Sort Key: proname
Sort Method: quicksort Memory: 626kB
(actual time=0.015..418.299 rows=2143 loops=1)
Total runtime: 428.757 ms
(5 rows)

Фактическая информация

Время в миллисекундах

Добавляется общее время запроса

loops – количество «проходов» (необходимо умножить время
на loops, чтобы получить общее время)
Виды операций

Способы просмотра таблицы
− Seq Scan
− Index Scan

Способы подготовки данных
− Sort
− Hash

Способы соединения (join)
− Nested Loop
− Merge Join
− Hash Join
Управление планировщиком

enable_seqscan

enable_indexscan

enable_sort

enable_nestloop

enable_hashjoin

enable_mergejoin

enable_hashagg
Как правило, помогает при разработке, но вредит на
«боевых» серверах (другие объёмы данных => другая
статистика)
Индексы в PostgreSQL

Btree

Hash

Rtree – теперь тоже GiST

GiST (обобщенное поисковое дерево)

GIN (обратный индекс)
Индексы в PostgreSQL

Btree

Hash

Rtree – теперь тоже GiST

GiST (обобщенное поисковое дерево)

GIN (обратный индекс)
Фёдор Сигаев, Олег Бартунов
Cоздание индекса
test=# \h CREATE INDEX
Command: CREATE INDEX
Description: define a new index
Syntax:
CREATE [ UNIQUE ] INDEX [ CONCURRENTLY ] name ON table [ USING method ]
( { column | ( expression ) } [ opclass ] [ ASC | DESC ] [ NULLS
{ FIRST | LAST } ] [, ...] )
[ WITH ( storage_parameter = value [, ... ] ) ]
[ TABLESPACE tablespace ]
[ WHERE predicate ]
Общие возможности использования
индексов в PostgreSQL

Частичные индексы
CREATE INDEX ... WHERE ...

Функциональные индексы
CREATE INDEX ... USING btree(myfunc(a))
− уникальные функциональные индексы
− индексирование данных “экзотических” типов (XML, array, ...)

Многоколоночные индексы
− следим за правильным порядком столбцов
− избегаем ненужных одноколоночных индексов

GINиндексы для массивов

CLUSTER table USING indexname
Общие возможности использования
индексов в PostgreSQL
●
CREATE INDEX CONCURRENTLY ...
●
CREATE INDEX ... WITH (fillfactor = ...)
●
Необходимость в перестроении индексов (read/fetch ratio):
select
indexrelname,
idx_tup_read,
idx_tup_fetch,
case
when idx_tup_fetch = 0 then 100
else idx_tup_read / idx_tup_fetch
end as ratio
from pg_stat_user_indexes
order by ratio desc;
Оптимизация: общие рекомендации

Сбор статистики, мониторинг, анализ логов (pgFouine)

Итерационное выявление медленных запросов

Иногда лучше перестроить запрос, а не создать N новых
индексов

Следить за кардинальностью и селективностью
промежуточных результатов (SELECT * FROM a, b)

Потенциальные источники проблем: LEFT JOIN, count(),
UNION вместо UNION ALL, DISTINCT, WHERE ... IN
(...), соединение 100 таблиц, неожиданное «выпрямление»
запросов с подзапросами, «вязанка» индексов вместо одного
двух

Не забывать об ANALYZE после массивных изменений!
Оптимизация: общие рекомендации

При решении проблемы убедитесь в том, что вам не
нужны VACUUM & ANALYZE

Запускайте EXPLAIN ANALYZE не менее двух раз (не
забываем про кэш)

Читайте план снизу вверх, ищите, где начинаются
замедления и/или ошибки планировщика

При возможности, используйте реальные данные в
тестировании (Slony?) и оборудование, приближенное к
production

Обращайтесь за помощью: pgsqlperformance, IRC, sql.ru,
коммерческая поддержка
Литература:
рекомендации для данной лекции
● PostgreSQL Reference Manual
● 11. Indexes
● 14. Performance Tips
● 43.5. Planner/Optimizer
● 55. How the Planner Uses Statistics
● Bruce Momjian, PostgreSQL Hardware Performance Tuning
http://www.postgresql.org/files/documentation/books/aw_pgsql/hw_performance/
● Дейт, К.. Введение в системы баз данных — Глава 17.
● Кузнецов, С. Д. Основы современных баз данных — 9.2. Индексы
http://citforum.ru/database/osbd/glava_39.shtml#_4_1_2
● ГарсиаМолина, Г., Ульман, Дж., Уидом, Дж. Системы баз данных. Полный
курс. — Главы 1316
Контакты
● nikolay@samokhvalov.com
● Blog: http://nikolay.samokhvalov.com
● XMPP/GTalk: samokhvalov@gmail.com
● Skype: samokhvalov & postgresmen
● +7 905 783 9804

PostgreSQL: промышленная разработка баз данных. Лекция 5

Загружено:

Сведения о документе

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

PostgreSQL: промышленная разработка баз данных. Лекция 5

Загружено:

Авторское право:

Доступные форматы

PostgreSQL: промышленная

Показывает примерное среднее «Ширины» типов данных

Вам также может понравиться