Обучение длится 10 недель
Автор: Михаил Королев
Курс по Data Engineering

Научитесь строить пайплайны данных в реальном времени
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или прогнозные модели.

Data Engineer — это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.

Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.

Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python.

Программа курса:

1. Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?

2. Современные хранилища данных
Разнообразие баз данных и их особенности

3. Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться

4. Источники данных и работа с ними
Файлы как источники данных, JDBC — структурированные данные, SQL для выгрузки данных

5. Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать

6. Hadoop как хранилище данных
Особенности и нюансы hdfs

7. Apache Airflow для оркестрации конвейеров
Настройка data pipelines

8. Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure

Этот курс входит в программу Профессия «Data Scientist»

Дата последнего обновления: 9 марта 2023

Темы

Другие курсы

-40%
Основы Go
Основы Go
Изучаем CSS: cоздание визуально привлекательных сайтов
Изучаем CSS: cоздание визуально привлекательных сайтов
Автор: Руслан Брантов
Подробнее
935
238
/мес
-20%
Курс по WordPress с нуля до результата. Создание сайтов без кода
Курс по WordPress с нуля до результата. Создание сайтов без кода
Подробнее
1 990
2 490
498
/мес
-20%
PRO Логические задачи
PRO Логические задачи
Авторы: Александр Павлович, Иосиф Дзеранов
Подробнее
3 992
4 990
998
/мес
Тестирование ПО: Автоматизация и Программирование. Python. Selenium
Тестирование ПО: Автоматизация и Программирование. Python. Selenium
Автор: Алекс Смит
Тестирование ПО с Нуля до Специалиста
Тестирование ПО с Нуля до Специалиста
Автор: Алекс Смит
Git для всех
Git для всех
Автор: Татьяна Овчинникова
-82%
Специалист по информационной безопасности: веб-пентест
Специалист по информационной безопасности: веб-пентест
Авторы: Группа авторов
Подробнее
23 500
135 000
-20%
Продвинутый курс по Javascript
Продвинутый курс по Javascript
Автор: Кирилл Поздняков
Подробнее
3 970
4 980
Назад
Смотреть дальше