Расширенная аналитика с PySpark

Расширенная аналитика с PySpark

Расширенная аналитика с PySpark

Автор: Акаш Тандон , Джош Уиллс , Сэнди Райза , Ури Ласерсон , Шон Оуэн
Дата выхода: 2023
Издательство: «БХВ-Петербург»
Количество страниц: 225
Размер файла: 4,4 МБ
Тип файла: DJVU
Добавил: codelibs
 Проверить на вирусы

 Книга посвящена практическим методам анализа больших объёмов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.

 Для специалистов по обработке данных и машинному обучению.


Похожее: