Учебный курс «Microsoft SQL Server: OLAP и Data Mining»
Краткое содержание: SQL Server Analysis Services и SQL Server Data Tools, источники данных, схемы звезды (star) и снежники (snowflake), таблицы фактов, измерения (dimensions), кубы и меры (measures), режимы MOLAP/ROLAP/HOLAP, агрегаты в кубах, вычисляемые элементы в OLAP, KPI и actions, запись в куб и настройка writeback, язык MDX, модели данных в Data Mining SSAS, деревья решений, кластеры, нейронные сети.
Общие данные:
Рано или поздно предприятия приходят к тому, что им нужны не только отчеты по имеющимся данным, но еще и аналитика, которая позволит принимать правильные решения. С точки зрения анализа данных (OLAP) и обнаружения закономерностей в них (Data Mining) Microsoft SQL Server (в виде компонента SQL Server Analysis Services) — одно из самых зрелых и функциональных решений на рынке. Наши специалисты участвовали в развертывании и поддержке систем аналитики SSAS в федеральных сотовых операторах, пивоваренных компаниях, федеральных торговых сетях и накопили большой опыт, которым поделятся с вами на обучении. Про заказ обучения — здесь!
Продолжительность: 5 дней (40 учебных часов).
В курсе 11 модулей, 15 лабораторных работ (на лабораторные работы, выполняемые под руководством преподавателя, отводится 50 % времени учебного курса).
Для кого предназначен: специалисты на предприятиях, которым нужно развертывать, настраивать и сопровождать аналитические системы OLAP/Data Mining на основе SQL Server Analysis Services.
План курса:
- Введение в OLAP и Data Mining. Зачем нужны кубы и модели анализа данных. Роль OLAP и систем Data Mining в информационной системе предприятия. Основные термины и концепции.
- Развертывание SQL Server Analysis Services. Многомерный и табличный режим развертывания, режим PowerPivot, различия между режимами. Выбор учетных записей для работы служб OLAP и послеустановочные задачи. Работа с несколькими экземплярами SSAS в тестовой среде.
- Начало работы с базами данных SSAS. Возможности SQL Server Data Tools, настройка проекта многомерных баз данных, работа с источниками данных (Data Source) и представлениями источника данных (Data Source View).
- Создание и настройка измерений (dimensions). Схема снежинки (snowflake) для анализа потенциальных измерений, выбор ключей и атрибутов. Создание иерархий и отношений между атрибутами. Процессинг и просмотр измерений.
- Создание кубов. Таблицы фактов и выбор мер (measures). Группы мер. Добавление измерений. Свойства кубов и мер, альтернативные агрегатные функции для мер (custom rollups). Развертывание кубов на сервере, процессинг и просмотр данных куба.
- Оптимизация куба. Секции куба (cube partitions), режимы хранения данных в секциях (MOLAP/ROLAP/HOLAP), настройка уровня агрегатов. Особенности работы с кубами, обновляющимися в реальном времени (Real-Time OLAP).
- Дополнительные функциональные возможности кубов OLAP: вычисления (вычисляемые члены (calculated members), именованные наборы (named sets), скрипты (script command)). Работа с KPI и действиями (actions). Применение названий объектов в кубе на разных языках (translations). Настройка поправочных таблиц (writeback).
- Язык MDX для запросов к кубам. Отличия от языка SQL. Выбор осей, фильтрация, сортировка, джойны, условные выражения. Навигация по иерархиям. Применение встроенных и пользовательских функций MDX.
- Работа с моделями анализа данных (data mining models). Технологии добычи данных в SSAS: деревья решений (decision trees), кластеризация, нейросети. Создание модели добычи данных, развертывание и процессинг. Просмотр информации модели и язык запросов DMX.
- Предоставление прав пользователям в многомерных базах данных и моделях данных. Роли для кубов и моделей, перспективы кубов. Аудит доступа к кубам и моделям данных.
- Обслуживание баз данных SSAS. Настройка автоматического процессинга. Резервное копирование и восстановление баз данных SSAS. Мониторинг и оптимизация производительности.