Ваши пайплайны ненадежны? Погрузитесь в полный цикл работы с данными: от масштабируемой обработки (Spark) до тотального контроля качества (Data Quality).  Интенсив по SQL, Apache Spark и Data Governance для инженеров и аналитиков. 
Научитесь строить высоконагруженные пайплайны на Spark и внедрять в них автоматические проверки качества (Data Quality), чтобы ваши данные всегда были чистыми.
Приходите на бесплатные вебинары, чтобы оценить формат обучения в Otus:
Бесплатные интенсивы по SQL, Apache Spark и Data Governance для инженеров и аналитиков
Станьте архитектором надежных данных
Время: 20:00 Мск
Дата: 23 апреля
Что нового в Spark 4.0
Время: 20:00 Мск
Дата: 21 апреля
Функции в SQL: вычисления и переиспользование кода
Время: 20:00 Мск
Дата: 20 апреля
Качество данных (data quality) на практике:
от технических метрик до внедрения в команде
Для кого полезны?
Backend разработчики:
SQL, чтобы научиться управлять данными и работать с аналитическими функциями
Дата-инженеры:
Хотите прокачать скиллы до уровня Senior и внедрять лучшие практики DQ в процессы разработки.
Аналитики:
Мечтаете перейти в инженерию данных или стать аналитиком, которому верят? Освойте SQL, чтобы эффективно обрабатывать большие объемы данных, Spark для больших данных и DQ для проверки гипотез.
ML-инженеры:
Обеспечьте качество данных для обучения моделей и их стабильной работы в продакшене.
В результате вебинаров вы
Перестанете тратить время на разбор инцидентов с "грязными" данными. Станете экспертом, который гарантирует надежность аналитики.
Повысите доверие к данным:
Познакомитесь с единым технологическим пайплайном
Научитесь собирать данные (SQL), обрабатывать терабайты информации (Spark), оркестрировать процессы (Airflow) и проверять качество на каждом этапе (Soda, OpenMetadata).
Вебинары проходят в рамках курсов OTUS
SQL для разработчиков и аналитиков
Для разработчиков, которым нужно лучше понимать структуру данных и взаимодействовать с аналитиками; для аналитиков, желающих ускорить обработку данных и автоматизировать отчёты.
Старт курса:
28 апреля
Результат:
Сможете писать эффективные запросы, уверенно работать с базами данных и превращать данные в бизнес-инструмент.
Программа:
Три ведущие СУБД: PostgreSQL, MySQL, SQL Server
Оптимизация запросов (индексы, планы выполнения)
Работа с большими объёмами данных
Качество данных / Data Quality
Для аналитиков, инженеров данных, специалистов по управлению данными, руководителей цифровых проектов, желающих внедрить системный контроль качества данных.
Старт курса:
29 апреля
Результат:
Научитесь выстраивать систему контроля качества, автоматизировать проверки и гарантировать надёжность данных.
Программа:
Метрики качества данных и автоматическая проверка
Инструменты OpenMetadata, Soda, Airflow
Мониторинг и управление метаданными
Внедрение процессов Data Quality в компании
Spark-разработчик
Для инженеров данных, разработчиков, аналитиков, желающих освоить современные технологии обработки больших данных.
Старт курса:
29 апреля
Результат:
Станете востребованным специалистом в области Data Engineering и Data Science.
Программа:
Работа со Spark в реальном времени
Оптимизация ETL-процессов
Разработка ML-моделей на больших данных
Кластерные вычисления и настройка производительности