Учебный курс «Apache Impala для IT-специалистов»

Краткое содержание: планирование и развертывание Apache Impala, форматы данных Parquet, Avro, ORC, таблицы Kudu, Hbase, Iceberg, S3,  запросы SQL в Impala, производительность Impala, настройка отказоустойчивости в Impala

Общие данные:

Apache Impala — программный продукт, который позволяет организовать доступ к разнородным данным удобным для пользователей образом, через запросы SQL. С точки зрения развертывания, настройки и организации работы в Impala есть много тонкостей, которые лучше осваивать под руководством опытного специалиста. Записывайтесь на обучение!

Продолжительность: 3 дня (24 учебных часа).

В курсе 8 модулей, 7 лабораторных работ (на практические работы, выполняемые под руководством преподавателя, отводится 50 % времени учебного курса).

Для кого предназначен: администраторы, специалисты служб сопровождения и другие IT-специалисты, которым необходимо развертывать и сопровождать системы на основе Apache Impala

План курса:

  1. Что такое Apache Impala. Архитектура и основные возможности.
  2. Планирование кластера Impala. Развертывание кластера Impala. Выполнение послеустановочных задач. Настройка балансировки нагрузки.
  3. Поддерживаемые форматы данных: текстовый, Parquet, ORC, Avro, Hudi, RCFile, SequenceFile. Организация хранения данных. Примеры конвейеров данных.
  4. Организация работы с таблицами Kudu, Hbase, Iceberg, S3, ADLS. Выбор типа таблиц.
  5. Основы SQL-запросов в Impala. Особенности диалекта SQL в Impala. Работа с транзакциями.
  6. Оптимизация производительности Apache Impala. Основные метрики и настройки.
  7. Настройка безопасности Apache Impala. Учетные записи, разрешения, аудит доступа.
  8. Резервное копирование и обеспечение отказоустойчивости при работе Impala.