Парсинг с помощью Python. Веб-скрапинг в действии. 3 изд

Парсинг с помощью Python. Веб-скрапинг в действии. 3 изд

Парсинг с помощью Python. Веб-скрапинг в действии. 3 изд
Автор: Митчелл Райан
Переводчик: Киселев А.
Дата выхода: 2025
Издательство: Спринт Бук
Количество страниц: 353
Тип файла: PDF
Добавил: codelibs

Внимание!!!! Книга удалена по требованию правообладателя!!!!

Введение ....12

Часть IРАЗРАБОТКА ВЕБ-СКРАПЕРОВ

Глава 1. Как работает Интернет ....20

Глава 2. Законность и этичность веб-скрапинга ....35

Глава 3. Применение веб-скрапинга ....53

Глава 4. Ваш первый веб-скрапер ....63

Глава S. Углубленный парсинг HTML ....75

Глава 6. Разработка веб-краулеров ....93

Глава 7. Модели веб-краулинга ....109

Глава 8. Scrapy ....126

Глава 9. Хранение данных ....142

ЧАСТЬ IIУГЛУБЛЕННЫЙ ВЕБ-СКРАПИНГ

Глава 10. Чтение документов ....166

Глава 11.Обработка «грязных»данных ....180

Глава 12. Чтение и запись текстов на естественных языках ....195

Глава 13. Краулингформ и авторизация ....217

Глава 14. Веб-скрапинг данных JavaScript ....227

Глава 1 S. Краулинг с помощью API ....244

Глава 16. Обработка изображений и распознавание текста ....259

Глава 17. Как избежать ловушек веб-скрапинга ....284

Глава 18. Тестирование сайтов с помощью веб-скраперов ....299

Глава 19. Параллельный веб-скрапинг ....311

Глава 20. Прокси-сервисы для веб-скрапинга ....327

Об авторе ....349

Иллюстрация на обложке ....350

Если программирование — магия, то веб-скрапинг — настоящее колдовство. Написав простую автоматизированную программу, можно отправлять запросы веб-серверам, получать ответы с данными, а затем анализировать эти данные и извлекать необходимую информацию. Это обновленное третье издание книги не только познакомит вас с веб-скрапингом, но и послужит исчерпывающим руководством по сбору практически любых видов данных в современном Интернете. 

В части I основное внимание уделено механике веб-скрапинга: как с помощью Python отправлять запросы веб-серверам, обрабатывать ответы и автоматизировать взаимодействие с сайтами. 

В части II исследуются более конкретные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга. 

Книга покажет, как: 

  • анализировать сложные HTML-страницы;
  • разрабатывать веб-сканеры с помощью фреймворка Scrapy;
  • хранить данные, полученные с помощью скрапинга;
  • читать и извлекать данные из документов;
  • очищать и нормализовывать плохо отформатированные данные;
  • читать и записывать информацию на естественных языках;
  • выполнять поиск по формам и страницам входа;
  • выполнять скрапинг JavaScript-кода и работать с API;
  • писать и использовать программы для преобразования изображений в текст;
  • обходить противоскрапинговые ловушки и блокаторы ботов;
  • тестировать свои веб-сайты с помощью скрапинга.

Похожее:

Список отзывов:

Нет отзывов к книге.