Ваши пайплайны ненадежны? Погрузитесь в полный цикл работы с данными: от масштабируемой обработки (Spark) до тотального контроля качества (Data Quality).  Интенсив по SQL, Apache Spark и Data Governance для инженеров и аналитиков. 
Научитесь строить высоконагруженные пайплайны на Spark и внедрять в них автоматические проверки качества (Data Quality), чтобы ваши данные всегда были чистыми.

Приходите на бесплатные вебинары, чтобы оценить формат обучения в Otus:
Бесплатные интенсивы по SQL, Apache Spark и Data Governance для инженеров и аналитиков
Станьте архитектором надежных данных
Время: 20:00 Мск
Дата: 23 апреля
Что нового в Spark 4.0: ключевые нововведения и их практическое применение
Время: 20:00 Мск
Дата: 21 апреля
Функции в SQL: вычисления и переиспользование кода
Время: 20:00 Мск
Дата: 20 апреля
Качество данных (data quality) на практике:
от технических метрик до внедрения в команде
Для кого полезны?
Бэкэнд-разработчики:
хотите научиться уверенно работать с данными — использовать SQL для управления, анализа и построения сложной логики
Инженеры данных:
хотите вырасти до продвинутого (senior) уровня — прокачать SQL, внедрять практики качества данных (data quality) и выстраивать надежные процессы
Аналитики:
хотите перейти в инженерию данных или усилить экспертизу — освоить SQL, Spark и подходы к проверке данных для работы с большими объемами
Инженеры машинного обучения:
хотите повысить качество моделей — выстроить процессы контроля данных и обеспечить стабильную работу моделей в продакшене
В результате вебинаров вы
Перестанете тратить время на разбор инцидентов с "грязными" данными. Станете экспертом, который гарантирует надежность аналитики.
Повысите доверие к данным:
Познакомитесь с единым технологическим пайплайном:
Научитесь собирать данные (SQL), обрабатывать терабайты информации (Spark), оркестрировать процессы (Airflow) и проверять качество на каждом этапе (Soda, OpenMetadata).
Вебинары проходят в рамках курсов OTUS
SQL для разработчиков и аналитиков
Для разработчиков, которым нужно лучше понимать структуру данных и взаимодействовать с аналитиками; для аналитиков, желающих ускорить обработку данных и автоматизировать отчёты
Старт курса:
28 апреля
Результат:
Сможете писать эффективные запросы, уверенно работать с базами данных и превращать данные в бизнес-инструмент
Программа:
Три ведущие СУБД: PostgreSQL, MySQL, SQL Server
Оптимизация запросов (индексы, планы выполнения)
Работа с большими объёмами данных
Качество данных / Data Quality
Для аналитиков, инженеров данных, специалистов по управлению данными, руководителей цифровых проектов, желающих внедрить системный контроль качества данных
Старт курса:
29 апреля
Результат:
Научитесь выстраивать систему контроля качества, автоматизировать проверки и гарантировать надёжность данных
Программа:
Метрики качества данных и автоматическая проверка
Инструменты OpenMetadata, Soda, Airflow
Мониторинг и управление метаданными
Внедрение процессов Data Quality в компании
Spark-разработчик
Для инженеров данных, разработчиков, аналитиков, желающих освоить современные технологии обработки больших данных
Старт курса:
29 апреля
Результат:
Станете востребованным специалистом в области Data Engineering и Data Science
Программа:
Работа со Spark в реальном времени
Оптимизация ETL-процессов
Разработка ML-моделей на больших данных
Кластерные вычисления и настройка производительности