Предисловие....10
Благодарности....12
Об этой книге....13
Об авторе....18
О переводчике....18
Об изображении на обложке....19
Глава 1....20
Объект Series....20
Упражнение 1. Оценки за ежемесячные тесты....25
Упражнение 2. Масштабирование оценок....38
Упражнение 3. Считаем цифры разряда десятков....43
Упражнение 4. Описательная статистика....53
Упражнение 5. Температура по понедельникам....57
Упражнение 6. Пассажиропоток в такси....61
Упражнение 7. Длинные, средние и короткие поездки в такси....64
Заключение....68
Глава 2....69
Объект DataFrame....69
Упражнение 8. Чистый доход....74
Упражнение 9. Налоговое планирование....78
Упражнение 10. Добавление новых товаров....89
Упражнение 11. Лидеры продаж....95
Упражнение 12. Поиск выбросов....98
Упражнение 13. Интерполяция....105
Упражнение 14. Выборочное обновление....109
Заключение....113
Глава 3....114
Импорт и экспорт....114
Упражнение 15. Загадочные поездки на такси....118
Упражнение 16. Такси и пандемия....126
Упражнение 17. Установка типов данных для столбцов....135
Упражнение 18. Файл passwd в датафрейм....139
Упражнение 19. Курсы биткоина....143
Упражнение 20. Большие города....149
Заключение....152
Глава 4....153
Индексы....153
Упражнение 21. Парковочные талоны....155
Упражнение 22. Оценки за вступительные тесты....168
Упражнение 23. Олимпийские игры....173
Упражнение 24. Олимпийские сводные таблицы....186
Заключение....193
Глава 5....194
Очистка данных....194
Упражнение 25. Очистка данных о парковках....198
Упражнение 26. Уход знаменитостей....208
Упражнение 27. Титаник и интерполяция....215
Упражнение 28. Несогласованные данные....221
Заключение....228
Глава 6....229
Группировка, объединение и сортировка....229
Упражнение 29. Самые продолжительные поездки на такси....233
Упражнение 30. Сравним поездки на такси....244
Упражнение 31. Расходы туристов по странам....257
Заключение....267
Глава 7....268
Сложная группировка, объединение и сортировка....268
Упражнение 32. Температура в разных городах....268
Упражнение 33. Оценки за вступительные тесты, часть 2....280
Упражнение 34. Снежные и дождливые города....294
Упражнение 35. Вино и туризм…....303
Заключение....314
Глава 8....315
Промежуточный проект ....315
Задача....316
Заключение....337
Глава 9....338
Строки ....338
Упражнение 36. Анализируем Алису....344
Упражнение 37. Винные слова....351
Упражнение 38. Зарплата программистов....361
Заключение....374
Глава 10....375
Даты и время ....375
Упражнение 39. Короткие, средние и длинные поездки на такси....382
Упражнение 40. Пишем и читаем даты....389
Упражнение 41. Цены на нефть....398
Упражнение 42. Чаевые за поездки на такси....403
Заключение....413
Глава 11....414
Визуализация ....414
Упражнение 43. Города....417
Упражнение 44. Погода в ящиках с усами....431
Упражнение 45. Анализируем стоимость поездок на такси с помощью графиков....440
Упражнение 46. Машины, нефть и мороженое....456
Упражнение 47. Такси и визуализация в Seaborn....475
Заключение....484
Глава 12....485
Оптимизация ....485
Упражнение 48. Категории....491
Упражнение 49. Быстрое чтение, быстрая запись....498
Упражнение 50. query и eval....508
Заключение....516
Глава 13....517
Итоговый проект ....517
Задача....517
Столбцы и их описание....520
Заключение....549
Предметный указатель....550
Библиотека pandas призвана существенно облегчить и ускорить процесс анализа, очистки, исследования и манипулирования данными в Python. А единственным способом освоить pandas, чтобы уверенно применять его в своей работе, является практика, практика и еще раз практика. И даже еще раз. На протяжении всей книги вашим персональным ассистентом будет гуру Python Реувен Лернер, который поможет вам осилить этото непростой путь.Прочитав книгу и самостоятельно выполнив 200 упражнений, вы сможете вывести свой уровень владения pandas на небывалые высоты. В процессе мы будем уделять особое внимание процедуре загрузки данных, их очистки, визуализации и оптимизации. Все задачи основаны на реальных наборах данных, начиная от архивных сведений о поездках людей на такси и заканчивая отзывами о произведенных в разных странах винах. На решение у вас уйдет минут десять, не больше!
Издание адресовано программистам на Python и аналитикам данных.