Различия курсов «Компьютерное зрение» и «Компьютерное зрение Advanced» в OTUS
Уважаемые студенты, чтобы вам было проще выбрать, специально для вас мы подготовили материал, в котором наглядно показана разница между курсами «Компьютерное зрение» и «Компьютерное зрение Advanced».
Уровень глубины изучаемых тем:
  • Компьютерное зрение: Базовый курс, фокусируется на введении в основы компьютерного зрения, глубокого обучения и нейросетей.
  • Компьютерное зрение Advanced: Продвинутый курс, вместо основ делается упор на более глубокое изучение тем и современных подходов.
Используемые библиотеки:
  • Компьютерное зрение: Рассматривается базовый функционал основных библиотек компьютерного зрения и глубокого обучения (opencv, pytorch).
  • Компьютерное зрение Advanced: Рассматривается более продвинутый функционал основных библиотек (pytorch 2.x, torchvision), а также изучаются дополнительные библиотеки (HuggingFace, Kornia и др.).
Введение в Deep Learning:
  • Компьютерное зрение: Рассматриваются базовые темы по глубокому обучению - начиная от модели искусственного нейрона и методу градиентного спуска, заканчивая проблемами переобучения нейросетей и взрывом/затуханием градиента. Рекомендуется для тех, кто не знаком с Deep Learning и нейронными сетями.
  • Компьютерное зрение Advanced: Базовые темы Deep Learning НЕ рассматриваются! Для обучения на продвинутом курсе необходимо обладать этими знаниями.
Дополнительные продвинутые темы:
  • Компьютерное зрение Advanced: Содержит продвинутые темы, такие как: калибровка камер, 3D реконструкция, SLAM, self-driving и автономные транспортные средства, распознавание и детекция действий на видео, трекинг и ре-идентификация объектов.
Генеративный AI:
  • Компьютерное зрение: Содержит базовые темы по генеративным моделям.
  • Компьютерное зрение Advanced: Генеративные модели изучаются более детально, упор делается на самые современные модели типа stable diffusion. Вдобавок, рассматриваются такие задачи как генерация изображений/видео из текста, и обратная задача - генерация текста по изображению/видео.
Оптимизация и продакшен:
  • Компьютерное зрение Advanced: Включает модуль по оптимизации моделей для инференса, а также то, как подготовить модель к продакшену, что не рассматривается в базовом курсе.
Сравнительная таблица по модулям курсов «Компьютерное зрение» и «Компьютерное зрение Advanced»
МодульКомпьютерное зрениеКомпьютерное зрение AdvancedВыводы
Модуль 1: Вводная часть и настройка Вводная лекция, настройка окружения, базовый обзор ML-библиотек Вводная лекция, настройка окружения, углубленный обзор PyTorch и доп. библиотек Базовый курс уделяет больше внимания знакомству с библиотеками и инструментами CV, тогда как продвинутый делает упор на более глубокое изучение функционала этих библиотек.
Модуль 2: Нейронные сети и обучение Основы нейронных сетей, градиентный спуск, PyTorch, регуляризация Эволюция сверточных сетей, Self-Supervised Learning, адаптивные методы В базовом курсе рассматриваются основы нейросетей, а в продвинутом - самые современные архитектуры и продвинутые методы обучения, такие как Self-Supervised.
Модуль 3: Стандартные задачи CV Детектирование объектов, сегментация, распознавание лиц, оценка позы Расширенные методы детектирования, 3D сегментация, трекинг, ReID Продвинутый курс охватывает 3D сегментацию, трекинг и ре-идентификацию объектов, также более детально изучаются стандартные задачи такие как детекция объектов и Pose Estimation
Модуль 4: Генеративные модели VAE, GAN, диффузионные модели, стиль изображений VAE, GAN, диффузионные модели, генеративные видеомодели, мультимодальные нейросети Продвинутый курс добавляет видеомодели и мультимодальные нейросети
Модуль 5: Продвинутые методы CV Геометрические методы в CV SAM, стереозрение, 3D реконструкция, SLAM, модели для автономных ТС, детекция действий Продвинутый курс включает больше продвинутых тем, таких как SLAM и 3D реконструкция
Модуль 6: Оптимизация инференса Отсутствует Инференс на сервере, аннотация данных в CVAT Только в продвинутом курсе есть модуль по оптимизации инференса и аннотации данных
Модуль 7: Проектная работа Консультации по проектам, защита проектов Консультации по проектам, защита проектов Оба курса завершаются проектной работой
Сравнительная таблица возможностей и прикладных задач для выпускников курсов «Компьютерное зрение» и «Компьютерное зрение. Advanced»
Модуль Компьютерное зрение (CV) Компьютерное зрение Advanced (CV Advanced)
Детектирование объектов Что смогут делать: Разработка систем для распознавания объектов на изображениях Примеры прикладных задач: Система контроля качества на производстве Что смогут делать: Разработка и оптимизация новейших моделей для детектирования объектов с высокой точностью и эффективностью. Примеры прикладных задач: Высокоточное детектирование объектов для автономного вождения
Сегментация изображений Что смогут делать: Разработка приложений для выделения и классификации различных структур на медицинских снимках Примеры прикладных задач: Медицинская диагностика Что смогут делать: Применение методов самосовершенствования для создания более устойчивых и точных моделей без необходимости большого количества размеченных данных. Примеры прикладных задач: Создание моделей для медицинской диагностики
Распознавание объектов Что смогут делать: Создание систем безопасности для идентификации лиц на основе фото или видео. Примеры прикладных задач: Системы безопасности Что смогут делать: Создание систем для автономных транспортных средств и роботов, способных ориентироваться и строить карты окружающей среды. Примеры прикладных задач: Автономные транспортные средства и роботы
Оценка позы Что смогут делать: Разработка приложений для анализа движений и поз человека. Примеры прикладных задач: Приложения в спорте или реабилитации Что смогут делать: Разработка приложений для создания 3D моделей объектов и сцен. Примеры прикладных задач: Применение в медицине, архитектуре и робототехнике.
Генеративные модели Что смогут делать: Введение в генеративные модели, генерация изображений Примеры прикладных задач: Генерация изображений для маркетинга и рекламы Что смогут делать: Генерация изображений и видео, мультимодальные модели text-to-image и image-to-text. Примеры прикладных задач: Киноиндустрия и видеоигры.
Интеграция данных Что смогут делать: Обработка изображений и видеоданных для дальнейшего анализа. Примеры прикладных задач: Анализ видеозаписей для мониторинга безопасности Что смогут делать: Создание систем, способных быстро и эффективно обрабатывать и интегрировать различные типы данных (текст, изображения, видео). Примеры прикладных задач: Визуальный QA, генерация изображений по текстовым описаниям.
Остались вопросы? Наши специалисты с радостью на них ответят. Просто заполните форму и Вам перезвонят!
+7
Заполняя эту форму вы соглашаетесь с пользовательским соглашением и политикой конфиденциальности.