Производительность: истории из жизни, советы, новости, юмор и картинки — Горячее, страница 10

0 просмотренных постов скрыто

kznalp

6 месяцев назад

Лига Новых Технологий

Серия СУБД PostgreSQL

Производительность PostgreSQL для разных ОС - часть 1⁠⁠

Взято с основного технического канала Postgres DBA

Продолжение цикла статей о статистическом анализе результатов нагрузочного тестирования СУБД PostgreSQL :

Часть 1 - сценарий нагрузочного тестирования "Select only"

Производительность PostgreSQL для разных ОС - часть 1 Postgresql, Субд, Производительность, Мониторинг, Тестирование, Длиннопост

Какой Linux выбрать ?

Задача эксперимента

Необходимо провести количественный анализ влияния версии Linux на производительность СУБД для разных дистрибутивов Linux : OS-1 и OS-2 .

СУБД расположены на разных виртуальных машинах. Гипервизор - один. Конфигурация файловых систем - одинаковая. Ресурсы хоста - одинаковые.

Сценарий "Select only"

Тестовые запрос состоит только из выражения SELECT.

Все блоки использующиеся в запросе - находятся в распределенной области.

Для создания нагрузки используется pgbench.

Количество сессий к СУБД растет экспоненциально для каждого прохода теста.

Производительность СУБД

Разница производительности от 10 до 13%

Относительная разница производительности OS-1 и OS-2

Время выполнения тестового запроса

Разница времени выполнения тестового запроса до 7%

Относительная разница времени выполнения тестового запроса

Итог

Для сценария "Select only", при нагрузке до 111 сессий - производительность СУБД развернутой на ОС Linux версии OS-1 превосходит производительность СУБД развернутой на ОС Linux версии OS-2 не менее чем на 10% .

Показать полностью 5

kznalp

6 месяцев назад

Лига Новых Технологий

Серия СУБД PostgreSQL

Сравнение производительности PostgreSQL⁠⁠

Взято с основного технического канала Postgres DBA

Обе хороши, но различия все таки есть

Предисловие

Статья не о сравнении ОС, задача статьи - тестирование методологии сравнения производительности СУБД.

Задача

Имеется 2 виртуальных машины с развернутой СУБД PostgreSQL.

Версия СУБД - одинаковая.

ОС - одинаковая. Гипервизор - один.

Различие - системный диск HDD vs. SSD.

Необходимо количественно определить влияние расположения файлов ОС на производительность СУБД. Т.е. определить разницу в накладных расходах для создания серверного процесса для нового соединения .

Реализация эксперимента - сценарии нагрузки

Для оценки производительности и среднего времени выполнения тестового запроса используются 3 сценария нагрузки:

Select only (условный сценарий WEB): нагрузка в виде запроса .
TPC-B (условный сценарий OLTP): Нагрузка в виде транзакции состоящей из UPDATE-SELECT
Heavyweight (условный сценарий DSS): Нагрузка в виде тяжелого запроса SELECT..JOIN..ORDER BY + вычислительная нагрузка

Индекс производительности СУБД(CPI) : операционная скорость
Время выполнения тестового запроса: скользящая медиана с периодом 1 час.
Максимальная нагрузка: 100 одновременных запросов.
Рост нагрузки: экспоненциально, с коэффициентом 0.2

Результаты эксперимента

Select only

Производительность СУБД

Разница производительности не превышает 1%

Время выполнения тестового запроса

Разница времени выполнения не превышает 3.5%

Итог по сценарию Select only :

Производительность СУБД - практически не отличается.

TPC-B

Производительность СУБД

Разница производительности не превышает 1.5%

Время выполнения тестового запроса

Разница времени выполнения не превышает 2.5%

Итог по сценарию TPC-B

Производительность СУБД - практически не отличается.

Heavyweight

Производительность СУБД

Проявляется разница в производительности

До 54 соединений: разница производительности не превышает 3%
65 - 93: Производительность ВМ2 выше до 17%
111 соединений: резкая деградация производительности . Производительность ВМ2 на 21%

Время выполнения тестового запроса

Заметна разница времени выполнения тестового запроса

До 45 соединений: разница времени выполнения не превышает 2%
с 54-111 соединений: Время выполнения тестового на ВМ2 увеличивается до 9%
111 соединений: резкое увеличение времени выполнения тестового запроса. Время выполнения тестового на ВМ2 больше на 22%

Итог по сценарию Heavyweight

При сравнительно небольших нагрузках (до 45-54 соединений) производительность ВМ1 и ВМ2 не отличается.

При высоких нагрузках (54 и более) производительность ВМ2 выше. Однако и время выполнения тестового запросы тоже выше.

Общий итог

1.Только при использовании разных сценариев нагрузки можно получить полную картину производительности СУБД .

2. Для ОС использованной в тесте , при невысокой нагрузке на СУБД, расположение системного диска на HDD или SSD - несущественно .

Показать полностью 6

[моё] Postgresql Субд Производительность Мониторинг Тестирование Длиннопост

kznalp

6 месяцев назад

Лига математиков

Серия СУБД PostgreSQL

О проблеме использования mean_exec_time при анализе производительности PostgreSQL⁠⁠

Взято с основного технического канала Postgres DBA

В реальной эксплуатации - применимо с существенными ограничениями.

Проблема

Имеется 2 виртуальные машины в облачном хранилище - версия СУБД одинаковая, гипервизор один , других ВМ в гипервизоре - нет.

Производительность СУБД

Разница в производительности СУБД не превышает 2.5%

Среднее время выполнения тестового запроса

Разница непрерывно растет и достигает 80%

В результате - производительность СУБД практически не отличается , а среднее время выполнения тестового запроса отличается кардинально. Как такое возможно ?

Причина

Использование при расчета значение mean_exec_time среднего арифметического .

Среднее арифметическое не всегда является идеальным показателем. Например, если ваши данные содержат очень высокие или низкие значения, они могут сильно исказить среднее. В таких случаях рассмотрите использование других статистических мер.

Как найти среднее арифметическое

Для иллюстрации проблемы был проведен простой эксперимент

Серия запусков тестового запроса с фиксацией времени выполнения и искусственным выбросом(замедление выполнения) .

Результаты

Всего 1(один) выброс

id duration
37 4602
38 14581
39 4610
40 4569
41 4685
42 4666
43 4680
44 4621
45 4637

mean_exec_time = 5651.6708999

Достаточно всего одного выброса , что бы значение метрики весьма существенно изменилось .

Решение проблемы

Использование в качестве среднего значение - медианы

Медиана — это значение, которое делит упорядоченный набор данных на две равные части. Другими словами, половина значений в наборе данных меньше медианы, а другая половина — больше. Медиана является центральным значением в наборе данных.

Медиана в статистике: как найти центральное значение | Хакнем Школа | Дзен

В данном эксперименте медиана = 4637 . Данное значение вполне соответствует значению подсказываемому здравым смыслом при анализе результатов наблюдений.

Единичный выброс не влияет на значение медианы

Итог

Разница между значением длительности выполнения тестового запроса и mean_exec_time для штатной работы СУБД составляет от 17 до 19%.

Разница между значением длительности выполнения тестового запроса и медианой для штатной работы СУБД составляет от -1.5 до 1%.

Какое значение использовать для усреднения показателей - очевидно.

В дальнейшем, при анализе производительности, метрика mean_exec_time ( представления типа pg_stat_statments/pgpro_stats) исключается из показателей производительности СУБД.

При проведении анализа производительности СУБД нет задачи оценить стабильность работы( облачная инфраструктура в принципе нестабильна и подвержена существенным влияниям внешних факторов), есть задача оценить производительность СУБД.

Показать полностью 5

[моё] Postgresql Субд Математика Мониторинг Производительность Длиннопост

kznalp

6 месяцев назад

Лига Новых Технологий

Серия СУБД PostgreSQL

Оценка производительности PostgreSQL - одного сценария НЕДОСТАТОЧНО⁠⁠

Взято с основного технического канала Postgres DBA

До финиша дойдут не все...

Проблема

ВМ с гораздо большими вычислительными ресурсами показывает скорость ниже , чем более скромная ВМ .

Причина

По умолчанию pgbench тестирует сценарий, примерно соответствующий TPC-B, который состоит из пяти команд SELECT, UPDATE и INSERT в одной транзакции.

Postgres Pro Enterprise : Документация: 16: pgbench : Компания Postgres Professional

Для тестирования использовался именно этот сценарий .

Конфигурация виртуальных машин

ВМ-1

Postgres Pro (enterprise certified) 15.8.1 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 11.4.1 20230605 (Red Soft 11.4.0-1), 64-bit

CPU = 8

RAM = 15

OC = RED 7.3

ВМ-2

Postgres Pro (enterprise certified) 14.11.3 on x86_64-pc-linux-gnu, compiled by gcc (Debian 6.3.0-18+deb9u1) 6.3.0 20170516, 64-bit

CPU = 24

RAM = 189

ОС = Astra Linux (Smolensk) 1.6

Итоги теста по сценарию TPC-B

Производительность ВМ-1 существенно выше ВМ-2

Т.е. по итогам данного теста получается - СУБД развёрнутая по шаблону ВМ-1 будет существенно производительнее ?

Что будет , если архитектор примет решение о выборе версии СУБД и запланирует ресурсы инфраструктуры на основании только данного теста ?

Решение проблемы

Одного теста для анализа производительности СУБД и ВМ - недостаточно.

Как было указано в документации:

Однако вы можете легко протестировать и другие сценарии, написав собственные скрипты транзакций.

Что и было сделано.

Для продолжения тестов, был подготовлен сценарий требующий серьезных вычислительных ресурсов - SELECT ... JOIN

Результат тестирования тяжелого запроса

ВМ-2 СУЩЕСТВЕННО производительнее чем ВМ-1

Все встало на свои места.

ВМ-1 даже не хватило ресурсов при количестве одновременных запросов свыше 160. При этом производительности ВМ-2 существенно выше производительности ВМ-1.

Итог

Нельзя принимать архитектурных решений на основании результатов одного только сценария нагрузочного тестирования

2. Для оценки производительности архитектурного решения по конкретной СУБД необходим комплекс разных сценариев нагрузочного тестирования.

Как минимум:

-Select only: оценка скорости чтения данных из СУБД

-Standard: оценка производительности СУБД в условиях конкуренции за блокировки.

-Heavyweight: оценка производительности СУБД при выполнении тяжелых вычислительных и ресурсоемких операций.

Показать полностью 2

[моё] Postgresql Субд Мониторинг Производительность Тестирование Тест Длиннопост

kznalp

6 месяцев назад

Лига Новых Технологий

Серия СУБД PostgreSQL

CPU Utilization = 100%. Это проблема СУБД?⁠⁠

Взято с основного технического канала Postgres DBA

Продолжение материала CPU Utilization = 100%. Это проблема СУБД?

CPU Utilization = 100%. Это проблема СУБД? Postgresql, Субд, Мониторинг, Производительность

Ресурс должен работать !

Просто цифры полученные по ходу стресс тестирования СУБД

ВМ-1

CPU Utilization

ВМ-1 : Максимальная утилизация CPU = 99% . Средняя = 81%

Commited transactions

ВМ-1 : Максимальное значение 18 550 . Среднее значение = 12 810

ВМ-2

CPU Utilization

ВМ-2 : Максимальная утилизация CPU = 28%. Средняя = 14%

Commited transactions

ВМ-2 : Максимальное значение = 4 470 . Среднее значение = 3 320

Итог

При данной нагрузке и данном сценарии тестирования - мониторить утилизацию CPU не имеет никакого смысла.

ВМ-1 утилизация близка к предельной, но при этом количество зафиксированных транзакций в среднем в 4 раза выше.

Что подтверждает ранее сделанные выводы

Выводы

Мониторить утилизацию CPU отдельно — не имеет смысла. Мониторить надо производительность СУБД, в первую очередь.

Рост утилизации CPU — не инцидент. Снижение производительности СУБД и рост утилизации CPU — инцидент.

Высокая утилизация CPU и рост производительности СУБД — показывает эффективное использование предоставленных ресурсов. Низкая утилизация CPU и низкая производительность СУБД в рабочее время — зря потраченные средства.

Показать полностью 4

[моё] Postgresql Субд Мониторинг Производительность

kznalp

6 месяцев назад

Лига Новых Технологий

Серия СУБД PostgreSQL

CPU Utilization = 100%. Это проблема СУБД?⁠⁠

Взято с основного технического канала Postgres DBA

Утилизация CPU = 100%

Обычные последствия после получения оповещения мониторинга «CPU Utilization High» — все в панике, лихорадочные поиски причин, аварийная ситуация, конфколлы и т. д. и т. п. Всё, как положено для ИБД.

Однако, если посмотреть на ситуацию чуть подробнее, то выясняется, что всё не так печально, а даже совсем наоборот и причин для паники — никаких.

Что же происходит с СУБД в данный момент ?

А с СУБД, всё хорошо, достаточно посмотреть на метрики мониторинга.

Самое главное: производительность СУБД — не снижается

Производительность СУБД даже растёт

Уже этой информации достаточно, что бы прекратить панику и не тратить рабочее время на поиски черной кошки в темной комнате.

Почему, производительность СУБД не снижается, ведь CPU в полку?

Причина 1: Количество запросов в секунду — не снижается

Количество запросов в секунду не снижается с ростом утилизации СУБД

Причина 2: Количество транзакций в секунду — не снижается

Количество транзакций в секунду - не снижается с ростом утилизации CPU

Т.е. можно сделать простой вывод‑ работоспособность СУБД не уменьшилась, а скорее наоборот — увеличилась и рост утилизации CPU это лишь следствие. Или другими словами — в данной, конкретной ситуации СУБД максимально эффективно использует предоставленные ресурсы.

Данный тезис подтверждается метриками, показывающими количество обрабатываемой СУБД информации за единицу времени (что собственно говоря, с известными сейчас допущениями, и определяет в некотором смысле производительность СУБД).

Количество страниц разделяемой области - прочитанных в секунду

Количество страниц разделяемой области - записанных в секунду

Количество страниц разделяемой области - измененных в секунду

Выводы

Мониторить утилизацию CPU отдельно — не имеет смысла. Мониторить надо производительность СУБД, в первую очередь.
Рост утилизации CPU — не инцидент. Снижение производительности СУБД и рост утилизации CPU — инцидент.
Высокая утилизация CPU и рост производительности СУБД — показывает эффективное использование предоставленных ресурсов. Низкая утилизация CPU и низкая производительность СУБД в рабочее время — зря потраченные средства.

Показать полностью 7

[моё] Postgresql Субд Производительность Мониторинг Длиннопост

kznalp

6 месяцев назад

Серия СУБД PostgreSQL

Первый пост⁠⁠

Взято с основного технического канала Postgres DBA

Скоро год , как впервые возникла мысль - "надо рассчитывать производительность СУБД".

Столько прошло с тех пор - несколько вариантов расчета , решение аномалий , погружение в мат.статистику , бан на хабре, непонимание и неприятие коллег и сообщества ...

И вот , похоже первый вариант реально работающей методики - готов . Ну почти готов.

Главное - четкая , понятная и стройная непротиворечивая идея. Хотя конечно, еще очень рано говорить об окончательном решении , но , некоторые моменты внушают осторожный, но твердый оптимизм:
-Расчёты очень простые. Никакой хитрой математики, фокусов и магии. Пара таблиц, несколько хранимых функций .
-Результаты хорошо согласуются с наблюдениями. Чем выше нагрузка и медленнее СУБД - тем ниже значение метрики.

Что можно будет получить в итоге:
-Расчет и анализ производительности отдельного SQL-запроса.
-Расчет и анализ производительности отдельной БД.
-Расчёт и анализ производительности всей СУБД в целом.
-График зависимости производительности тестового запроса( и самое главное - тестовых запросов ) от нагрузки на СУБД. Или другими словами - можно построить график зависимости бизнес функции от нагрузки .
-Адаптивная оптимизация производительности СУБД методом покоординатного спуска . Настройка конфигурационных параметров для конкретной инфраструктуры и характера нагрузки.

Единственно, что пока не понятно - идея лежала на поверхности . Почему никто этим не занимался ?

Товарищ - нервы собери в узду!
Взялся за дело - не охай.
Есть результат - посылай всех в п$зду .
Нет результата - пох$й.

Зачем это все нужно или о необходимости расчета производительности СУБД.

Первый пост Postgresql, Субд, Производительность

Если, что-то неизмеримо в цифрах, этим нельзя управлять и оптимизировать.

Если вы можете измерить то, о чем говорите, и выразить это в цифрах – значит, вы что-то об этом предмете знаете. Но если вы не можете выразить это количественно, ваши знания крайне ограничены и неудовлетворительны. Может это начальный этап, но это не уровень подлинного научного знания.

У. Томсон (лорд Кельвин) шотландский ученый-физик.

Показать полностью 1

[моё] Postgresql Субд Производительность

Radrigosen

6 месяцев назад

Суперкомпьютер и зоны роста: Великобритания отдает экономику под управление ИИ⁠⁠

Британия совершает технологический прыжок от чайных церемоний к алгоритмам.

Правительство Великобритании объявило о масштабном плане внедрения искусственного интеллекта, который станет основой для национального обновления в ближайшие 10 лет. В рамках нового плана правительство намерено ускорить развитие ИИ, чтобы повысить производительность труда, улучшить качество жизни граждан и укрепить позиции Великобритании как глобального лидера в данной области.

Премьер-министр поддержал реализацию всех 50 рекомендаций, предложенных в «Плане действий по использованию возможностей ИИ». Документ направлен на устранение барьеров для развития ИИ и создание благоприятной среды для технологических компаний. План предусматривает значительные изменения, включая запуск зон роста ИИ, ускорение процесса получения разрешений на строительство инфраструктуры и увеличение вычислительных мощностей страны.

ИИ уже активно используется в Великобритании для повышения эффективности государственных услуг. В медицинской сфере технологии помогают диагностировать заболевания, ускорять выписку пациентов и обеспечивать более точный уход. Например, системы ИИ анализируют боль у пациентов, неспособных говорить, и выявляют рак на ранних стадиях.

План также предусматривает использование ИИ для решения повседневных задач. Технологии помогут учителям сократить время на выполнение административных задач и сосредоточиться на обучении детей. Также ИИ будет внедрен в дорожную инфраструктуру: камеры с ИИ смогут автоматически выявлять дорожные дефекты и ускорять их ремонт.

По оценкам МВФ, если ИИ будет полностью интегрирован в экономику Великобритании, производительность труда может увеличиться до 1,5% в год. Показатели могут принести стране до 47 миллиардов фунтов ежегодно в течение следующего десятилетия.

Крупные компании уже поддержали инициативу. Три ведущих технологических гиганта — Vantage Data Centres, Nscale и Kyndryl — объявили об инвестициях на сумму 14 миллиардов фунтов. Вложения создадут новые дата-центры и более 13 000 рабочих мест по всей стране.

Для ускорения развития инфраструктуры ИИ правительство создаст специальные зоны роста. Первая такая зона будет открыта в Оксфордшире, в Кулхэме, где находится Британское управление атомной энергии. Здесь будут проводиться исследования в области устойчивой энергетики, включая использование ядерного синтеза для поддержки технологий ИИ. В дальнейшем зоны роста появятся в других регионах, особенно в промышленных районах с доступом к энергетическим ресурсам.

Дополнительные меры включают:

Увеличение вычислительных мощностей страны в 20 раз к 2030 году, что начнется с строительства нового суперкомпьютера;

Создание национальной библиотеки данных для безопасного и эффективного использования данных в разработке ИИ;

Запуск Совета по энергетике ИИ для координации между правительством и энергетическими компаниями, чтобы обеспечить энергоснабжение для нужд технологий.

Представленный план действий станет основой для промышленной стратегии Великобритании и первым шагом в реализации масштабной программы развития цифровых технологий.

Источник.

Показать полностью

Суперкомпьютеры Великобритания Искусственный интеллект Технологии Экономика Политика Планы на будущее Производительность Интеграция Цифровые технологии

Посты не найдены