Вы будете работать с реальными базами данных MySQL и ClickHouse, настраивать работу аналитических пайплайнов в AirFlow, визуализировать результаты в BI системах.
Кому подойдет эта программа?
Начинающим специалистам Вы уже знакомы с Python, у вас есть базовые знания SQL и вы хотите развиваться в сфере Data Science
Data Science специалистам уровня junior/middle Вы уже работаете в сфере Data Science и хотите прокачать навыки работы с Big Data
Аналитикам и исследователям Вы уже умеете работать с данными и хотите познакомиться с инструментами для работы с Big Data
Специалистам в области Data Engineering Вы уже работаете в сфере Data Engineering и хотите расширить свой кругозор и освоить актуальные технологии
Программа
Первая неделя. Введение в Big Data для Data Science -Зачем DS знать Big Data? -Хранение данных -Обработка данных -Практика и задачи по SQL и ClickHouse -Вводный вебинар первой недели
Вторая неделя. Hadoop -Архитектура Hadoop -HDFS -MapReduce -Hive -Hbase -Практика и задачи -Вебинар второй недели
Третья неделя. Spark -Архитектура spark -Spark Core -Потоковая обработка данных -Практика и задачи по Spark -Вебинар третьей недели
Четвёртая неделя. Workflow -Управление данными ETL/ELT -Архитектура хранилищ Data Warehouse vs Data Lake -Облачные решения -Apache Airflow -Практика и задачи по Airflow -Вебинар четвёртой недели
Пятая неделя. SparkML -Распределенные модели машинного обучения -Spark ML компоненты и модели -Поставка моделей -Практика и задачи по Spark ML -Вебинар пятой недели
Шестая неделя. BI Tools -Работа с данными в Superset -Аналитические агрегаты -Вебинар шестой недели -Дополнительный вебинар про карьеру
Информация о видео Название: Big Data for Data Science Автор: Анатолий Карпов, Александр Савченко, Ольга Силютина Год выхода: 2021 Жанр: Видеокурс Язык: Русский Выпущено: Россия Продолжительность: 13:51:57