Друзья, мы тут исследуем проблемы, с которыми сталкиваются пользователи электронных книг. Будем вам благодарны за ваши ответы. Опрос займёт не более 5 минут.
Пройти опрос

Современный скрапинг веб-сайтов с помощью Python. 2 изд

Современный скрапинг веб-сайтов с помощью Python. 2 изд

Современный скрапинг веб-сайтов с помощью Python. 2 изд

Автор: Райан Митчелл
Переводчик: Е. Сандицкая
Дата выхода: 2021
Издательство: Издательский дом «Питер»
Количество страниц: 497
Размер файла: 3,7 МБ
Тип файла: PDF
Добавил: codelibs
 Проверить на вирусы  Дополнительные материалы 

 Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
 В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
 

  • Разбирайте сложные HTML-страницы.
  • Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
  • Изучайте методы хранения данных, полученных с помощью скрапинга.
  • Считывайте и извлекайте данные из документов.
  • Очищайте и нормализуйте плохо отформатированные данные.
  • Читайте и пишите информацию на естественных языках.
  • Освойте поиск по формам и логинам.
  • Изучите скрапинг JavaScript и работу с API.
  • Используйте и пишите программы для преобразования изображений в текст.
  • Учитесь обходить скрапинговые ловушки и блокаторы ботов.
  • Протестируйте собственный сайт с помощью скрапинга.

Похожее:

Список отзывов:

Нет отзывов к книге.