В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.
Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.
После прохождения курса студенты будут знать: -Как найти и установить необходимые библиотеки для парсинга данных. -Что такое этичный парсинг, как не нарушить права и закон при парсинге данных. -Для чего нужен файл robots.txt. -Каким образом получать HTML сайта для извлечения необходимой информации. -Как пользоваться xpath для указания точного расположения элементов на странице. -Как переходить по страницам на многостраничном сайте. -Как создавать проект и запускать «пауков» Scrapy. -Как парсить всю информацию о каждом товаре на сайте. -Как осуществлять переход на страницу каждого товара. -Каким образом парсить сайты, использующие JavaScript при загрузке. -Как авторизовываться на сайте, используя фреймворк Selenium. -Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.
Информация о видео Название: Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4 Автор: Анна Кузина Год выхода: 2021 Жанр: Видеокурс Язык: Русский Выпущено: Россия Продолжительность: 02:56:22
К "Анна Кузина - Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec" пока нет комментариев, но Вы можете стать первым, кто его оставит!
Всего мнений: 0
Ищу на сайте
Случайный анекдот
- Вчера я выиграл в лотерее сто тысяч! - А как на это реагировала твоя жена? Она от радости онемела. - Это же надо - столько счастья сразу!