Главная » 2021»Февраль»19 » Промышленный Machine Learning на больших данных (2020) PCRec
Промышленный Machine Learning на больших данных (2020) PCRec
12:51
Вы освоите все необходимые навыки машинного обучения для потоковых данных и распределенной среды. В программу включены необходимые знания из областей Data Science и Data Engineering, которые позволят вам обрабатывать большие данные и писать распределенные алгоритмы на Spark.
Для кого этот курс? -Для специалистов по Машинному обучению или Software инженеров, которые хотят научиться работать с большими данными. Обычно такие задачи имеются в крупных IT-компаниях с масштабным цифровым продуктом. -Для Data Scientist, которые хотят усилить свой скиллсет инженерными навыками. Благодаря курсу вы будете уметь обрабатывать данные и самостоятельно выводить результаты ML-решений в продакшн.
Вы научитесь: -Использовать стандартные инструменты ML-конвейеров в распределенной среде; -Разрабатывать собственные блоки для ML-конвейеров; -Адаптировать ML-алгоритмы к распределенной среде и инструментам big data; -Использовать Spark, SparkML, Spark Streaming; -Разрабатывать алгоритмы потоковой подготовки данных для машинного обучения; -Обеспечивать контроль качества на всех этапах движения ML-решений в промышленную эксплуатацию.
Содержание: 01. Градиентный спуск и линейные модели 02. Обзор основных методов и метрик машинного обучения 03. Основы программирования на Scala 04. Распределенные хранилища 05. Эволюция параллельных алгоритмов 06. Менеджеры ресурсов в распределенных системах 07. Основы Apache Spark 08. Эволюция параллельных алгоритмов №2 09. Перенос МЛ-алгоритмов в распределенную среду 10. ML в Apache Spark 11. Разработка собственных блоков для SparkML 12. Сторонние библиотеки для использования со Spark 13. Оптимизация гиперпараметров и AutoML 14. Потоковая обработка данных 15. Spark Streaming 16. Структурный и непрерывный стриминг в Spark 17. Альтернативные потоковые фреймворки 18. Определение цели МЛ-проекта и предварительный анализ 19. Долгосрочные ML-цели на примере задачи уменьшения оттока 20. А-Б тестирование 1 21. А-Б тестирование 2 22. Подходы к выводу ML-решений в продакшн 23. Версионирование, воспроизводимость и мониторинг 24. Онлайн-сервинг моделей 25. Паттерны асинхронного потокового ML и ETL 26. Если надо Python 27. Альтернативные фреймворки с поддержкой Python 28. Production Code на Python. Организация и Packaging кода 29. REST-архитектура - Flask API 30. Docker - Структура, применение, деплой 31. Amazon Sagemaker 32. AWS ML Service 33. Нейросети 34. Распределенное обучение и инференс нейросетей 35. Градиентный бустинг на деревьях
Информация о видео Название: Промышленный Machine Learning на больших данных Автор: Дмитрий Бугайченко и др. Год выхода: 2020 Жанр: Видеокурс Язык: Русский Выпущено: Россия Продолжительность: 61:33:51