Обучение длится 10 недель
Автор: Михаил Королев
35 640
59 400
Курс на Skillfactory
Курс по Data Engineering

Научитесь строить пайплайны данных в реальном времени
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или прогнозные модели.

Data Engineer — это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.

Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.

Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python.

Программа курса:

1. Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?

2. Современные хранилища данных
Разнообразие баз данных и их особенности

3. Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться

4. Источники данных и работа с ними
Файлы как источники данных, JDBC — структурированные данные, SQL для выгрузки данных

5. Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать

6. Hadoop как хранилище данных
Особенности и нюансы hdfs

7. Apache Airflow для оркестрации конвейеров
Настройка data pipelines

8. Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure

Этот курс входит в программу Профессия «Data Scientist»

Дата последнего обновления: 9 марта 2023

Темы

Другие курсы

Практический курс по тестированию бэкенда
Практический курс по тестированию бэкенда
Автор: Надежда Дудник
Подробнее
29 990
-43%
Bitrix-разработчик с нуля
Bitrix-разработчик с нуля
Авторы: Группа авторов
Подробнее
56 700
99 500
2 487
/мес
Временные ряды для прогноза криптовалют
Временные ряды для прогноза криптовалют
Автор: Елена Кантонистова
Математика для семьи: Объединяем поколения через числа
Математика для семьи: Объединяем поколения через числа
Автор: Сергей Камянецкий
Командная строка для разработчиков, тестировщиков и девопсов
Командная строка для разработчиков, тестировщиков и девопсов
Автор: Михаил Трунов
AutoCAD с самого начала
AutoCAD с самого начала
Автор: Наталья Кайгородцева
Подробнее
1 500
Платформа nanoCAD: лёгкий старт
Платформа nanoCAD: лёгкий старт
Автор: Наталья Кайгородцева
Подробнее
1 000
Kotlin JVM - курс для продвинутых
Kotlin JVM - курс для продвинутых
Автор: Алексей Охотниченко
Подробнее
2 890
723
/мес
Android Theory - курс для начинающих
Android Theory - курс для начинающих
Автор: Алексей Охотниченко
Подробнее
4 990
1 248
/мес
Назад
Смотреть дальше