Учебный курс «Работа с Greenplum»
Краткое содержание: архитектура Greenplum, отличия от Postgres и Clickhouse, сегменты и развертывание, проектирование и создание объектов баз данных Greenplum, загрузка данных: gpload, PXF, ETL: Airflow и NiFi, CDC — Debezium, оптимизация производительности: шардинг и сегменты, партиционирование, вакуумирование
Общие данные:
Greenplum — система управления базами данных на основе Postgres, которая специально предназначена для работы с большими объемами данных, организации хранилищ данных и работы со сложными запросами. Работа с этой системой не всегда очевидна. Чтобы не ошибиться при развертывании и администрировании Greenplum, очень рекомендуется посетить этот курс. Преподаватель с 25-летним стажем работы с базами данных не только поделится своими знаниями, но и расскажет про опыт эксплуатации Greenplum на крупнейших предприятиях в России, проблемах и путях их решения. Заказывайте обучение!
Продолжительность: 4 дня (32 учебных часа).
В курсе 12 модулей, 10 лабораторных работ (на лабораторные работы, выполняемые под руководством преподавателя, отводится 50 % времени учебного курса).
Для кого предназначен: администраторы и другие специалисты, которым необходимо работать с системой управления базами данных Greenplum
План курса:
- Архитектура и особенности Greenplum. Виды нагрузки, под которую подходит Greenplum. Отличия от Postgres, Clickhouse и других баз данных
- Развертывание
- Варианты развертывания и применение сегментов
- Тестовое развертывание на одном компьютере: Ubuntu
- Производственное развертывание на группе серверов: CentOS
- Применение контейнеров: Docker и Kubernetes
- Структура каталогов и файлов конфигурации Greenplum. Отличия от Postgres
- Программы для работы с Greenplum. В чем писать запросы и средства администрирования Greenplum
- Проектирование БД и объектов в ней . Отличия системы объектов Greenplum от системы объектов Postgres. Схемы start, snowflake, data vault
- Дополнительные возможности SQL-запросов Greenplum. Расширения и отличия от Postgres
- Создание программных объектов в Greenplum. Создание функций SQL, PLPGSQL, PLPython
- Аутентификация, настройка разрешений и защита информации в Greenplum
- Аутентификация и отличия от Postgres
- Учетные записи и разрешения Greenplum
- Аудит и дополнительные возможности защиты информации. Применение SSL и RLS
- Резервное копирование и восстановление. Специальные ситуации восстановления
- Загрузка данных в Greenplum из оперативной системы
- Работа с PXF (Platform Extension Framework) и обращение к внешним источникам данных
- Применение GPLOAD и других встроенных утилит загрузки данных
- Применение ETL/ELT систем. Работа с Apache Airflow и NiFi
- Применение подхода CDC и работа с Debezium
- Мониторинг и оптимизация производительности
- Особенности мониторинга и оптимизации производительности Greenplum по сравнению с Postgres
- Параметры мониторинга операционной системы
- Пороговые значения по системным таблицам/представлениям Greenplum
- Проектирование архитектуры решения Greenplum с точки зрения производительности
- Применение шардинга и партиционирования. Виды секционирования и сжатие партиций. Изменение структуры сегментов Greenplum
- Оптимизация подключений к Greenplum. Особенности подключений и применение пулов подключений
- Особенности вакуумирования, переиндексации и пересчета статистики в Greenplum
- Оптимизация системы индексов. Специальные типы индексов в Greenplum
- Распределение ресурсов между пользователями в Greenplum. Применение ресурсных групп.
- Оптимизация запросов в Greenplum. Особенности выполнения запросов в Greenplum по сравнению с Postgres. Анализ планов выполнения запросов и влияние на планы выполнения запросов. Выбор типа оптимизатора запросов в Greenplum
- Организация мониторинга и протоколирования работы Greenplum. Диагностика и решение проблем