Курс «Курс по Data Engineering»: обучение по онлайн-тренингу — Вебинарум
Обучение длится 10 недель
Автор: Михаил Королев
35 640
59 400
Курс на Skillfactory
Курс по Data Engineering

Научитесь строить пайплайны данных в реальном времени
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или прогнозные модели.

Data Engineer — это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений.

Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа.

Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python.

Программа курса:

1. Введение, практический linux
Кто такой Data Engineer и зачем ему Linux?

2. Современные хранилища данных
Разнообразие баз данных и их особенности

3. Экосистема Hadoop
Что такое Hadoop, что он умеет и как им пользоваться

4. Источники данных и работа с ними
Файлы как источники данных, JDBC — структурированные данные, SQL для выгрузки данных

5. Apache Spark и обработка данных
Зачем нужен Apache Spark и как с ним работать

6. Hadoop как хранилище данных
Особенности и нюансы hdfs

7. Apache Airflow для оркестрации конвейеров
Настройка data pipelines

8. Обзор облачных хранилищ
Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure

Этот курс входит в программу Профессия «Data Scientist»

Дата последнего обновления: 9 марта 2023

Темы

Другие курсы

Управление дронами с использованием компьютерного зрения
Управление дронами с использованием компьютерного зрения
Авторы: Группа авторов
Подробнее
12 000
1 000
/мес
Автоматизация тестирования c Playwright на JS/TS: полный курс
Автоматизация тестирования c Playwright на JS/TS: полный курс
Автор: Степан Осадший
Подробнее
2 990
Тестирование ПО с нуля: полный курс для будущих QA
Тестирование ПО с нуля: полный курс для будущих QA
Автор: Степан Осадший
Подробнее
2 890
-43%
НТМL и CSS - полный курс по вёрстке с нуля [2025]
НТМL и CSS - полный курс по вёрстке с нуля [2025]
Подробнее
3 999
6 990
SQL: оконные функции
SQL: оконные функции
Автор: Алексей Андросов
Подробнее
1 250
Metabase: визуализация данных
Metabase: визуализация данных
Автор: Алексей Андросов
Подробнее
1 500
FARM:Функциональная, асинхронная, реактивная, многопоточная Java
FARM:Функциональная, асинхронная, реактивная, многопоточная Java
Автор: Игорь Судакевич
Подробнее
15 000
Оптимизация SQL запросов на примере ClickHouse
Оптимизация SQL запросов на примере ClickHouse
Автор: Трофим Воробьев
Инди курс по Pygame - учимся создавать свои игры
Инди курс по Pygame - учимся создавать свои игры
Автор: Артем Егоров
Назад
Смотреть дальше