Модуль | Компьютерное зрение | Компьютерное зрение Advanced | Выводы | |
---|---|---|---|---|
Модуль 1: Вводная часть и настройка | Вводная лекция, настройка окружения, базовый обзор ML-библиотек | Вводная лекция, настройка окружения, углубленный обзор PyTorch и доп. библиотек | Базовый курс уделяет больше внимания знакомству с библиотеками и инструментами CV, тогда как продвинутый делает упор на более глубокое изучение функционала этих библиотек. | |
Модуль 2: Нейронные сети и обучение | Основы нейронных сетей, градиентный спуск, PyTorch, регуляризация | Эволюция сверточных сетей, Self-Supervised Learning, адаптивные методы | В базовом курсе рассматриваются основы нейросетей, а в продвинутом - самые современные архитектуры и продвинутые методы обучения, такие как Self-Supervised. | |
Модуль 3: Стандартные задачи CV | Детектирование объектов, сегментация, распознавание лиц, оценка позы | Расширенные методы детектирования, 3D сегментация, трекинг, ReID | Продвинутый курс охватывает 3D сегментацию, трекинг и ре-идентификацию объектов, также более детально изучаются стандартные задачи такие как детекция объектов и Pose Estimation | |
Модуль 4: Генеративные модели | VAE, GAN, диффузионные модели, стиль изображений | VAE, GAN, диффузионные модели, генеративные видеомодели, мультимодальные нейросети | Продвинутый курс добавляет видеомодели и мультимодальные нейросети | |
Модуль 5: Продвинутые методы CV | Геометрические методы в CV | SAM, стереозрение, 3D реконструкция, SLAM, модели для автономных ТС, детекция действий | Продвинутый курс включает больше продвинутых тем, таких как SLAM и 3D реконструкция | |
Модуль 6: Оптимизация инференса | Отсутствует | Инференс на сервере, аннотация данных в CVAT | Только в продвинутом курсе есть модуль по оптимизации инференса и аннотации данных | |
Модуль 7: Проектная работа | Консультации по проектам, защита проектов | Консультации по проектам, защита проектов | Оба курса завершаются проектной работой |
Модуль | Компьютерное зрение (CV) | Компьютерное зрение Advanced (CV Advanced) | |
---|---|---|---|
Детектирование объектов | Что смогут делать: Разработка систем для распознавания объектов на изображениях Примеры прикладных задач: Система контроля качества на производстве | Что смогут делать: Разработка и оптимизация новейших моделей для детектирования объектов с высокой точностью и эффективностью. Примеры прикладных задач: Высокоточное детектирование объектов для автономного вождения | |
Сегментация изображений | Что смогут делать: Разработка приложений для выделения и классификации различных структур на медицинских снимках Примеры прикладных задач: Медицинская диагностика | Что смогут делать: Применение методов самосовершенствования для создания более устойчивых и точных моделей без необходимости большого количества размеченных данных. Примеры прикладных задач: Создание моделей для медицинской диагностики | |
Распознавание объектов | Что смогут делать: Создание систем безопасности для идентификации лиц на основе фото или видео. Примеры прикладных задач: Системы безопасности | Что смогут делать: Создание систем для автономных транспортных средств и роботов, способных ориентироваться и строить карты окружающей среды. Примеры прикладных задач: Автономные транспортные средства и роботы | |
Оценка позы | Что смогут делать: Разработка приложений для анализа движений и поз человека. Примеры прикладных задач: Приложения в спорте или реабилитации | Что смогут делать: Разработка приложений для создания 3D моделей объектов и сцен. Примеры прикладных задач: Применение в медицине, архитектуре и робототехнике. | |
Генеративные модели | Что смогут делать: Введение в генеративные модели, генерация изображений Примеры прикладных задач: Генерация изображений для маркетинга и рекламы | Что смогут делать: Генерация изображений и видео, мультимодальные модели text-to-image и image-to-text. Примеры прикладных задач: Киноиндустрия и видеоигры. | |
Интеграция данных | Что смогут делать: Обработка изображений и видеоданных для дальнейшего анализа. Примеры прикладных задач: Анализ видеозаписей для мониторинга безопасности | Что смогут делать: Создание систем, способных быстро и эффективно обрабатывать и интегрировать различные типы данных (текст, изображения, видео). Примеры прикладных задач: Визуальный QA, генерация изображений по текстовым описаниям. |