Для кого этот курс:
Для тех, кто хочет разбираться в Data Science, кто хочет научиться корректно подготавливать данных, кто хочет решать задачи классификации, регрессии и кластеризации, кто хочет получить навык написания кода на Numpy, Pandas, Sklearn, Matplotlib, Seaborn
Начальные требования:
- Основы Python
- Основы статистики
Почему стоит выбрать именно этот курс:
- В этом курсе 8 лекций с практическими упражнениями, которые покрывают основы Data Science.
- Каждому нюансу уделяется особое внимание, информация разжевывается до мелочей и подается вам.
Цели курса:
- Разобраться в этапах проекта в Data Science
- Научиться решать задачи классификации, кластеризации, регрессии
- Усвоить тонкости работы с табличными данными через Pandas
- Освоить обучение моделей через Sklearn
- Познакомиться с подготовкой данных для моделей: очистка, кодирование признаков, генерация новых признаков, выбор признаков.
Чему вы научитесь:
- Решать задачи классификации, кластеризации и регрессии
- Проводить чистку данных от пропусков и выбросов
- Корректно готовить данные для модели
- Оценивать работу моделей
- Улучшать качество предсказаний
- Работа с Numpy, Pandas, Sklearn, Matplotlib, Seaborn
Программа курса:
Введение
- Приветствие
- Google Colab
Анализ данных
- Первичный анализ данных
- Практические задания Pandas
- Визуальный анализ данных
- Практические задания Визуализация
Задачи машинного обучения:
- Регрессия
- Практические задания Регрессия
- Классификация
- Практические задания Классификация
Улучшение качества данных и модели
- Улучшение качества данных
- Практические задания Данные
- Улучшение качества модели
- Практические задания Улучшение модели
Проекты
- Обучение без учителя
- Практические задания Unsupervised learning
- "Деревянные" модели
- Проект