Data Science. Наука о данных с нуля. 2 изд

Data Science. Наука о данных с нуля. 2 изд

Data Science. Наука о данных с нуля. 2 изд
Автор: Грас Джоэл
Переводчик: Лагунов Андрей
Дата выхода: 2021
Издательство: «БХВ-Петербург»
Количество страниц: 418
Размер файла: 23,3 МБ
Тип файла: PDF
Добавил: codelibs
 Проверить на вирусы  Дополнительные материалы 

Предисловие
Условные обозначения, принятые в книге
Использование примеров кода
Благодарности
Предисловие к первому изданию
Наука о данных
С нуля
Комментарий переводчика
Об авторе
Глава 1. Введение
Воцарение данных
Что такое наука о данных?
Оправдание для выдумки: DataSciencester
Выявление ключевых звеньев
Исследователи данных, которых вы должны знать
Зарплаты и опыт работы
Оплата аккаунтов
Интересующие темы
Поехали!
Глава 2. Интенсивный курс языка Python
Дзен языка Python
Установка языка Python
Виртуальные среды
Пробельное форматирование
Модули
Функции
Строки
Исключения
Списки
Кортежи
Словари
Словарь defaultdict
Счетчики
Множества
Поток управления
Истинность
Сортировка
Включения в список
Автоматическое тестирование и инструкция assert
Объектно-ориентированное программирование
Итерируемые объекты и генераторы
Случайность
Регулярные выражения
Функциональное программирование
Функция zip и распаковка аргументов
Переменные args и kwargs
Аннотации типов
Как писать аннотации типов
Добро пожаловать в DataSciencester!
Для дальнейшего изучения
Глава 3. Визуализация данных
Библиотека matplotlib
Столбчатые графики
Линейные графики
Диаграммы рассеяния
Для дальнейшего изучения
Глава 4. Линейная алгебра
Векторы
Матрицы
Для дальнейшего изучения
Глава 5. Статистика
Описание одиночного набора данных
Центральные тенденции
Вариация
Корреляция
Парадокс Симпсона
Некоторые другие корреляционные ловушки
Корреляция и причинно-следственная связь
Для дальнейшего изучения
Глава 6. Вероятность
Взаимная зависимость и независимость
Условная вероятность
Теорема Байеса
Случайные величины
Непрерывные распределения
Нормальное распределение
Центральная предельная теорема
Для дальнейшего изучения
Глава 7. Гипотеза и вывод
Проверка статистической гипотезы
Пример: бросание монеты
Р-значения
Доверительные интервалы
Взлом р-значения
Пример: проведение А/В-тестирования
Байесов вывод
Для дальнейшего изучения
Глава 8. Градиентный спуск
Идея в основе градиентного спуска
Оценивание градиента
Использование градиента
Выбор правильного размера шага
Применение градиентного спуска для подгонки моделей
Мини-пакетный и стохастический градиентный спуск
Для дальнейшего изучения
Глава 9. Получение данных
Объекты stdin и stdout
Чтение файлов
Основы текстовых файлов
Файлы с разделителями
Выскабливание Всемирной паутины
HTML и его разбор
Пример: слежение за Конгрессом
Использование интерфейсов API
Форматы JSON и XML
Использование неаутентифицированного API
Отыскание API-интерфейсов
Пример: использование API-интерфейсов Twitter
Получение учетных данных
Использование библиотеки Twython
Для дальнейшего изучения
Глава 10. Работа с данными
Разведывательный анализ данных
Разведывание одномерных данных
Двумерные данные
Многочисленные размерности
Применение типизированных именованных кортежей
Классы данных dataclasses
Очистка и конвертирование
Оперирование данными
Шкалирование
Ремарка: библиотека tqdm
Снижение размерности
Для дальнейшего изучения
Глава 11. Машинное обучение
Моделирование
Что такое машинное обучение?
Переподгонка и недоподгонка
Правильность, точность и прецизионность
Компромисс между смещением и дисперсией
Извлечение и отбор признаков
Для дальнейшего изучения
Глава 12. к ближайших соседей
Модель
Пример: набор данных о цветках ириса
Проклятие размерности
Для дальнейшего изучения
Глава 13. Наивный Байес
Реально глупый спам-фильтр
Более изощренный спам-фильтр
Имплементация
Тестирование модели
Применение модели
Для дальнейшего изучения
Глава 14. Простая линейная регрессия
Модель
Применение градиентного спуска
Оценивание максимального правдоподобия
Для дальнейшего изучения
Глава 15. Множественная регрессия
Модель
Расширенные допущения модели наименьших квадратов
Подгонка модели
Интерпретация модели
Качество подгонки
Отступление: размножение выборок
Стандартные ошибки регрессионных коэффициентов
Регуляризация
Для дальнейшего изучения
Глава 16. Логистическая регрессия
Задача
Логистическая функция
Применение модели
Качество подгонки
Машины опорных векторов
Для дальнейшего изучения
Глава 17. Деревья решений
Что такое дерево решений?
Энтропия
Энтропия подразделения
Создание дерева решений
Собираем все вместе
Случайные леса
Для дальнейшего изучения
Глава 18. Нейронные сети
Персептроны
Нейронные сети прямого распространения
Обратное распространение
Пример: задача Fizz Buzz
Для дальнейшего изучения
Глава 19. Глубокое обучение
Тензор
Абстракция слоя
Линейный слой
Нейронные сети как последовательность слоев
Потеря и оптимизация
Пример: сеть XOR еще раз
Другие активационные функции
Пример: задача Fizz Buzz еще раз
Функции softmax и перекрестная энтропия
Слой отсева
Пример: набор данных MN1ST
Сохранение и загрузка моделей
Для дальнейшего изучения
Глава 20. Кластеризация
Идея
Модель
Пример: встречи ИТ-специалистов
Выбор числа к
Пример: кластеризация цвета
Восходящая иерархическая кластеризация
Для дальнейшего изучения
Глава 21. Обработка естественного языка
Облака слов
N-граммные языковые модели
Грамматики
Ремарка: генерирование выборок по Гиббсу
Тематическое моделирование
Векторы слов
Рекуррентные нейронные сети
Пример: использование RNN-сети уровня букв
Для дальнейшего изучения
Глава 22. Сетевой анализ
Центральность по посредничеству
Центральность по собственному вектору
Умножение матриц
Центральность
Ориентированные графы и алгоритм PageRank
Для дальнейшего изучения
Глава 23. Рекомендательные системы
Неавтоматическое кураторство
Рекомендация популярных тем
Коллаборативная фильтрация по схожести пользователей
Коллаборативная фильтрация по схожести предметов
Разложение матрицы
Для дальнейшего изучения
Глава 24. Базы данных и SQL
Инструкции CREATE TABLE и INSERT
Инструкция UPDATE
Инструкция DELETE
Инструкция SELECT
Инструкция GROUP BY
Инструкция ORDER BY
Инструкция JOIN
Подзапросы
Индексы
Оптимизация запросов
Базы данных NoSQL
Для дальнейшего изучения
Глава 25. Алгоритм MapReduce
Пример: подсчет количества появлений слов
Почему алгоритм MapReduce?
Алгоритм MapReduce в более общем плане
Пример: анализ обновлений новостной ленты
Пример: умножение матриц
Ремарка: комбинаторы
Для дальнейшего изучения
Глава 26. Этика данных
Что такое этика данных?
Нет, ну правда, что же такое этика данных?
Должен ли я заботиться об этике данных?
Создание плохих продуктов данных
Компромисс между точностью и справедливостью
Сотрудничество
Интерпретируемость
Рекомендации
Предвзятые данные
Защита данных
Резюме
Для дальнейшего изучения
Глава 27. Идите вперед и займитесь наукой о данных
Программная оболочка IPython
Математика
Не с нуля
Библиотека NumPy
Библиотека pandas
Библиотека scikit-leam
Визуализация
Язык R
Глубокое обучение
Отыщите данные
Займитесь наукой о данных
Новости хакера
Пожарные машины
Футболки
Твиты по всему глобусу
А вы?
Предметный указатель

Книга позволяет освоить науку о данных, начав  «с чистого листа».
Она  написана так, что способствуют погружению в  Data Science аналитика, фактически не обладающего глубокими знаниями   в этой прикладной дисциплине.
При этом вы убедитесь, что описанные в книге программные библиотеки, платформы, модули и пакеты инструментов, предназначенные для работы в области науки о данных, великолепно справляются с задачами анализа данных.
А если у вас есть способности к математике и навыки программирования, то Джоэл Грас поможет вам почувствовать себя комфортно с математическим и статистическим аппаратом, лежащим в основе науки о данных, а также с приемами алгоритмизации, которые потребуются для работы в этой области.
Обновленное второе издание книги, использующее версию Python 3.6 и наполненное новыми материалами по глубокому обучению, статистике и обработке естественного языка, покажет вам, как найти драгоценные камни в сегодняшнем беспорядочном и избыточном потоке данных.

Вместе с Джоэлом Грасом и его книгой

  • Пройдите интенсивный курс языка Python
  • Изучите элементы линейной алгебры, математической статистики, теории вероятностей и их применение в науке о данных
  • Займитесь сбором, очисткой, нормализацией и управлением данными
  • Окунитесь в основы машинного обучения
  • Познакомьтесь с различными математическими моделями и их реализацией по методу k-ближайших соседей, наивной байесовской классификации, линейной и логистической регрессии, а также моделями на основе деревьев принятия решений, нейронных сетей и кластеризации
  • Освойте работу с рекомендательными системами, приемы обработки естественного языка, методы анализа социальных сетей, технологии MapReduce и баз данных.

Похожее:

Список отзывов:

Нет отзывов к книге.