Data Engineer — это специалист, который собирает данные из разных источников, очищает их и передает в удобном виде аналитикам для принятия бизнес-решений. Аналитикам данных нужно знать, как работает хранилище данных, в каком виде там хранятся данные, как они обрабатываются и как их можно получить для анализа. Курс ориентирован на практику и основные инструменты, подходит для тех, кто имеет базовые знания языка Python.
МОДУЛИ
1 Введение, практический linux Кто такой Data Engineer и зачем ему Linux?
2 Современные хранилища данных Разнообразие баз данных и их особенности
3 Экосистема Hadoop Что такое Hadoop, что он умеет и как им пользоваться
4 Источники данных и работа с ними Файлы как источники данных, JDBC — структурированные данные, SQL для выгрузки данных
5 Apache Spark и обработка данных Зачем нужен Apache Spark и как с ним работать
6 Hadoop как хранилище данных Особенности и нюансы hdfs
7 Apache Airflow для оркестрации конвейеров Настройка data pipelines
8 Обзор облачных хранилищ Особенности и нюансы работы с облачными хранилищами: Google, Amazon, Azure
Информация о видео Название: Data Engineering Автор: Михаил Королев Год выхода: 2023 Жанр: Видеокурс Язык: Русский Выпущено: Россия Продолжительность: 09:41:17
Похожие материалы скачать бесплатно и без регистрации
К "Михаил Королев - Data Engineering (2023) PCRec" пока нет комментариев, но Вы можете стать первым, кто его оставит!
Всего мнений: 0
Ищу на сайте
Случайный анекдот
Окружили ковбоя индейцы. Кричат: Сдавайся! А у того только один патрон остался. Все, думает, пи**ец. Тут ему внутренний голос говорит: - Еще не пи**ец, стреляй в вождя! Hу, тот, понятное дело, выстрелил. Вождь грохнулся. Внутренний голос: - Hу, вот теперь пи**ец!