Описание: Добро пожаловать на Ultimate Web Scraping With Python Bootcamp, единственный курс, который вам нужен, чтобы пройти путь от полного новичка в python до очень компетентного веб-парсера.
Веб-скрапинг — это процесс программного извлечения данных из Интернета.
Агенты парсинга посещают веб-ресурс, извлекают из него контент, а затем обрабатывают полученные данные, чтобы разобрать какую-то конкретную интересующую информацию.
Парсинг — это навык программирования, который обеспечивает немедленную обратную связь и может использоваться для автоматизации широкого спектра задач по сбору и обработке данных.
Чему вы научитесь:
- Понять основы парсинга веб-страниц в Python с нуля.
- Извлекайте информацию со статических и динамических веб-сайтов и извлекайте ее в различные форматы.
- Перехватывайте и эмулируйте скрытые API, чтобы найти высокоэффективные альтернативы получению ваших данных.
- Освоить библиотеку запросов для работы с HTTP
- Анализируйте и извлекайте содержимое из HTML с помощью BeautifulSoup, Selectolax и Microsoft Playwright.
- Освойте сложные селекторы CSS, включая комбинаторы потомков, дочерних элементов, родственных комбинаторов.
- Понимать, как работает Интернет, включая HTTP, HTML, CSS и JavaScript.
- Создавайте сканеры scrapy и практикуйте элементы, загрузчики элементов и настраиваемые конвейеры.
- Интегрируйте scrapy с playwright для высокопроизводительного и точно настроенного динамического сканирования веб-сайтов.
- Практика обработки и извлечения данных в различные форматы, включая csv, json, xml и SQL.