Учебный курс «Microsoft SQL Server: OLAP и Data Mining»

Краткое содержание: SQL Server Analysis Services и SQL Server Data Tools, источники данных, схемы звезды (star) и снежники (snowflake), таблицы фактов, измерения (dimensions), кубы и меры (measures), режимы MOLAP/ROLAP/HOLAP, агрегаты в кубах, вычисляемые элементы в OLAP, KPI и actions, запись в куб и настройка writeback, язык MDX, модели данных в Data Mining SSAS,  деревья решений, кластеры, нейронные сети.

Общие данные:

Рано или поздно предприятия приходят к тому, что им нужны не только отчеты по имеющимся данным, но еще и аналитика, которая позволит принимать правильные решения. С точки зрения анализа данных (OLAP) и обнаружения закономерностей в них (Data Mining) Microsoft SQL Server (в виде компонента SQL Server Analysis Services) — одно из самых зрелых и функциональных решений на рынке. Наши специалисты участвовали в развертывании и поддержке систем аналитики SSAS в федеральных сотовых операторах, пивоваренных компаниях, федеральных торговых сетях и накопили большой опыт, которым поделятся с вами на обучении.  Про заказ обучения —  здесь!

Продолжительность: 5 дней (40 учебных часов).

В курсе 11 модулей, 15 лабораторных работ (на лабораторные работы, выполняемые под руководством преподавателя, отводится 50 % времени учебного курса).

Для кого предназначен: специалисты на предприятиях, которым нужно развертывать, настраивать и сопровождать аналитические системы OLAP/Data Mining на основе SQL Server Analysis Services.

План курса:

  1. Введение в OLAP и Data Mining. Зачем нужны кубы и модели анализа данных. Роль OLAP и систем Data Mining в информационной системе предприятия. Основные термины и концепции.
  2. Развертывание SQL Server Analysis Services. Многомерный и табличный режим развертывания, режим PowerPivot, различия между режимами. Выбор учетных записей для работы служб OLAP и послеустановочные задачи. Работа с несколькими экземплярами SSAS в тестовой среде.
  3. Начало работы с базами данных SSAS. Возможности SQL Server Data Tools, настройка проекта многомерных баз данных, работа с источниками данных (Data Source) и представлениями источника данных (Data Source View).
  4. Создание и настройка измерений (dimensions). Схема снежинки (snowflake) для анализа потенциальных измерений, выбор ключей и атрибутов. Создание иерархий и отношений между атрибутами. Процессинг и просмотр измерений.
  5. Создание кубов. Таблицы фактов и выбор мер (measures). Группы мер. Добавление измерений. Свойства кубов и мер, альтернативные агрегатные функции для мер (custom rollups). Развертывание кубов на сервере, процессинг и просмотр данных куба.
  6. Оптимизация куба. Секции куба (cube partitions), режимы хранения данных в секциях (MOLAP/ROLAP/HOLAP), настройка уровня агрегатов. Особенности работы с кубами, обновляющимися в реальном времени (Real-Time OLAP).
  7. Дополнительные функциональные возможности кубов OLAP: вычисления (вычисляемые члены (calculated members), именованные наборы (named sets), скрипты (script command)). Работа с KPI и действиями (actions). Применение названий объектов в кубе на разных языках (translations). Настройка поправочных таблиц (writeback).
  8. Язык MDX для запросов к кубам. Отличия от языка SQL. Выбор осей, фильтрация, сортировка, джойны, условные выражения. Навигация по иерархиям. Применение встроенных и пользовательских функций MDX.
  9. Работа с моделями анализа данных (data mining models). Технологии добычи данных в SSAS: деревья решений (decision trees), кластеризация, нейросети. Создание модели добычи данных, развертывание и процессинг. Просмотр информации модели и язык запросов DMX.
  10. Предоставление прав пользователям в многомерных базах данных и моделях данных. Роли для кубов и моделей, перспективы кубов. Аудит доступа к кубам и моделям данных.
  11. Обслуживание баз данных SSAS. Настройка автоматического процессинга. Резервное копирование и восстановление баз данных SSAS. Мониторинг и оптимизация производительности.