Обучение длится 22 модуля
Авторы: Группа авторов
Уровень подготовки: начальный
Машинное обучение: из грязи в Kaggle-князи

Описание
Большой практический курс по всем аспектам машинного обучения на Python в решении задач соревнования Kaggle. Курс состоит из 3 больших частей:

Регрессия и предсказание данных
Рассмотрим все практические аспекты применения линейной регрессии для предсказания числовых показателей энергопотребления ASHRAE.

  • Особенности процесса анализа данных (ETL): загрузка, очистка, объединение наборов данных с pandas.
     
  • Проведение исследовательского анализа данных для поиска зависимостей: EDA.
     
  • Использование sklearn для линейной регрессии.
     
  • Интерполяция и экстраполяция данных.
     
  • Расчет метрики качества RMSLE для моделей линейной регрессии.
     
  • Оптимизация линейной регрессии: выбор наилучших параметров и гиперпараметров.
     
  • Оптимизация потребления памяти при работе с большими данными.
     
  • Запасные модели линейной регрессии.
     
  • Ансамбли линейной регрессии для уточнения предсказания.
     
  • Экспорт и импорт данных, включая промежуточные.

Кластеризация и классификация
Отработаем прикладные подходы к кластеризации и классификации данных с помощью машинного обучения для страхового скоринга Prudential.

  • Метрики классификации: точность, полнота, F1, квадратичная каппа и матрица неточностей.
     
  • Очистка данных и оптимизация потребления памяти.
     
  • Кластеризация данных и метод ближайших соседей.
     
  • Простая и иерархическая логистическая регрессия.
     
  • Метод ближайших соседей и поиск оптимальной модели.
     
  • Метод опорных векторов: SVM.
     
  • Дерево принятия решения и случайный лес (бэггинг).
     
  • XGBosot и градиентный бустинг.
     
  • LightGBM и CatBoost
     
  • Ансамбль стекинга для голосования и выбора лучшего результата.

Нейросети и глубокое обучение
Разберем сегментацию и классификацию изображений облаков с помощью сверточных, пирамидальных, остаточных и полносвязных нейронных сетей.

  • Метрики точности: оценка F1 и коэффициент Дайса.
     
  • Очистка данных и обработка изображений.
     
  • Загрузка и сохранение моделей и данных в HDF5.
     
  • Двухслойный и многослойный перцептрон.
     
  • Нейросети со сверточными слоями и слоями подвыборки.
     
  • Функции активации, инициализация и оптимизаторы нейросетей.
     
  • Преобразование и дополнение (аугментация) бинарных данных.
     
  • LeNet, AlexNet, GoogLeNet.
     
  • VGG, Inception, ResNet, DenseNet.
     
  • Сегментация изображений с MobileNet, Unet, PSPNet и FPN.
     
  • Ансамбль нейросетей.

Для кого этот курс:

  • Аналитики Python, изучающие машинное обучение
  • Программисты больших данных
  • Исследователи больших данных
Дата последнего обновления: 20 января 2024

Темы

Другие курсы

-43%
Инженер по тестированию
Инженер по тестированию
Авторы: Группа авторов
Подробнее
98 600
173 000
2 883
/мес
Kotlin Multiplatform шаг за шагом
Kotlin Multiplatform шаг за шагом
Автор: Максим Казанцев
Подробнее
9 500
Тестирование GraphQL API
Тестирование GraphQL API
Автор: Ольга Назина
Подробнее
7 000
Charles Proxy как инструмент тестировщика
Charles Proxy как инструмент тестировщика
Автор: Ольга Назина
Подробнее
5 500
Python. Микросервисы. Backend на FastAPI
Python. Микросервисы. Backend на FastAPI
Автор: Саид Магомедов
Подробнее
5 890
1 473
/мес
JavaScript: от теории к практике
JavaScript: от теории к практике
Автор: Мария Ажгихина
Подробнее
3 200
Web-технологии: практический курс CSS
Web-технологии: практический курс CSS
Автор: Мария Ажгихина
Подробнее
1 699
Фронтенд-разработчик
Фронтенд-разработчик
Авторы: Группа авторов
Аналитик 1С. Основные инструменты и ввод в профессию
Аналитик 1С. Основные инструменты и ввод в профессию
Автор: Василий Еремин
Подробнее
1 490
Назад
Смотреть дальше