Учебный курс «Apache Impala для IT-специалистов»
Краткое содержание: планирование и развертывание Apache Impala, форматы данных Parquet, Avro, ORC, таблицы Kudu, Hbase, Iceberg, S3, запросы SQL в Impala, производительность Impala, настройка отказоустойчивости в Impala
Общие данные:
Apache Impala — программный продукт, который позволяет организовать доступ к разнородным данным удобным для пользователей образом, через запросы SQL. С точки зрения развертывания, настройки и организации работы в Impala есть много тонкостей, которые лучше осваивать под руководством опытного специалиста. Записывайтесь на обучение!
Продолжительность: 3 дня (24 учебных часа).
В курсе 8 модулей, 7 лабораторных работ (на практические работы, выполняемые под руководством преподавателя, отводится 50 % времени учебного курса).
Для кого предназначен: администраторы, специалисты служб сопровождения и другие IT-специалисты, которым необходимо развертывать и сопровождать системы на основе Apache Impala
План курса:
- Что такое Apache Impala. Архитектура и основные возможности.
- Планирование кластера Impala. Развертывание кластера Impala. Выполнение послеустановочных задач. Настройка балансировки нагрузки.
- Поддерживаемые форматы данных: текстовый, Parquet, ORC, Avro, Hudi, RCFile, SequenceFile. Организация хранения данных. Примеры конвейеров данных.
- Организация работы с таблицами Kudu, Hbase, Iceberg, S3, ADLS. Выбор типа таблиц.
- Основы SQL-запросов в Impala. Особенности диалекта SQL в Impala. Работа с транзакциями.
- Оптимизация производительности Apache Impala. Основные метрики и настройки.
- Настройка безопасности Apache Impala. Учетные записи, разрешения, аудит доступа.
- Резервное копирование и обеспечение отказоустойчивости при работе Impala.