
В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python.
Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных.
После прохождения курса студенты будут знать:
-Как найти и установить необходимые библиотеки для парсинга данных.
-Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.
-Для чего нужен файл robots.txt.
-Каким образом получать HTML сайта для извлечения необходимой информации.
-Как пользоваться xpath для указания точного расположения элементов на странице.
-Как переходить по страницам на многостраничном сайте.
-Как создавать проект и запускать «пауков» Scrapy.
-Как парсить всю информацию о каждом товаре на сайте.
-Как осуществлять переход на страницу каждого товара.
-Каким образом парсить сайты, использующие javascript при загрузке.
-Как авторизовываться на сайте, используя фреймворк Selenium.
-Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.
Информация о видео
Название: Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4
Автор: Анна Кузина
Год выхода: 2021
Жанр: Видеокурс
Язык: Русский
Выпущено: Россия
Продолжительность: 02:56:22
Файл
Формат: MP4
Видео: AVC, 1280x720, ~1062 Kbps
Аудио: AAC, 128 Kbps, 48.0 KHz
Размер файла: 1.36 Gb
Скачать Парсинг сайтов: Scrapy, Splash, Selenium, requests, bs4 (2021) Видеокурс
Для просмотра скрытого текста необходимо зарегистрироваться или войти на сайт.
Для просмотра скрытого текста необходимо зарегистрироваться или войти на сайт.
Для просмотра скрытого текста необходимо зарегистрироваться или войти на сайт.
