Математика для Data Science. Управляем данными с помощью линейной алгебры, теории вероятностей и статистики

Математика для Data Science. Управляем данными с помощью линейной алгебры, теории вероятностей и статистики

Математика для Data Science. Управляем данными с помощью линейной алгебры, теории вероятностей и статистики

Автор: Томас Нилд
Дата выхода: 2025
Издательство: ТОО «Спринт Бук»
Количество страниц: 352
Размер файла: 17,8 МБ
Тип файла: ZIP (pdf+epub)
Добавил: codelibs
 Проверить на вирусы

Предисловие............................................................................................................11 

Условные обозначения...............................................................................................................14 

Использование исходного кода примеров.......................................................................15 

Благодарности.........................................................................................................16 

О редакторах русского издания.............................................................................................17 

От издательства..............................................................................................................................17 

Глава 1. Обзор начальной математики и математического анализа..............18 

Теория чисел....................................................................................................................................19 

Порядок выполнения арифметических операций........................................................21 

Переменные.....................................................................................................................................22 

Функции.............................................................................................................................................23 

Суммы.................................................................................................................................................28 

Возведение в степень..................................................................................................................30 

Логарифмы.......................................................................................................................................33 

Число e и натуральные логарифмы......................................................................................35 

Число e.........................................................................................................................................35 

Натуральные логарифмы....................................................................................................38 

Пределы.............................................................................................................................................39 

Производные...................................................................................................................................41 

Частные производные.........................................................................................................45 

Цепное правило......................................................................................................................48 

Интегралы.........................................................................................................................................50 

Заключение......................................................................................................................................55 

Упражнения для самопроверки.............................................................................................55 

Глава 2. Теория вероятностей................................................................................56 

Что такое вероятность................................................................................................................56 

Теория вероятностей и статистика................................................................................58 

Математика вероятностей........................................................................................................59 

Вероятность пересечения событий...............................................................................59 

Вероятность объединения событий..............................................................................60 

Условная вероятность и формула Байеса...................................................................62 

Условная вероятность пересечения и объединения событий.........................65

Биномиальное распределение...............................................................................................66 

Бета-распределение....................................................................................................................69 

Заключение......................................................................................................................................75 

Упражнения для самопроверки.............................................................................................76 

Глава 3. Описательная статистика и статистический вывод............................77 

Что такое данные?.........................................................................................................................78 

Описательная статистика и статистический вывод.......................................................80 

Совокупности, выборки и смещение...................................................................................81 

Описательная статистика..........................................................................................................85 

Среднее арифметическое и среднее взвешенное..................................................86 

Медиана......................................................................................................................................88 

Мода.............................................................................................................................................89 

Дисперсия и стандартное отклонение.........................................................................90 

Нормальное распределение.............................................................................................95 

PPF — функция, обратная к функции распределения........................................ 102 

Статистический вывод............................................................................................................. 105 

Центральная предельная теорема.............................................................................. 106 

Доверительные интервалы............................................................................................. 109 

p-значения.............................................................................................................................. 112 

Проверка гипотез................................................................................................................ 113 

Распределение Стьюдента: работа с малыми выборками...................................... 121

Кое-что о больших данных и ошибке меткого стрелка............................................ 123 

Заключение................................................................................................................................... 124 

Упражнения для самопроверки.......................................................................................... 125 

Глава 4. Линейная алгебра.................................................................................. 127 

Что такое вектор?....................................................................................................................... 128 

Сложение векторов............................................................................................................ 132 

Умножение вектора на число........................................................................................ 134 

Линейная оболочка и линейная зависимость ...................................................... 136 

Линейные преобразования................................................................................................... 138 

Базисные векторы............................................................................................................... 138 

Умножение матрицы на вектор..................................................................................... 141 

Умножение матриц.................................................................................................................... 145 

Определители.............................................................................................................................. 148 

Особые виды матриц................................................................................................................ 151 

Квадратная матрица........................................................................................................... 151 

Единичная матрица............................................................................................................ 152 

Обратная матрица............................................................................................................... 152 

Диагональная матрица..................................................................................................... 153 

Треугольная матрица......................................................................................................... 153 

Разреженная матрица....................................................................................................... 154 

Системы уравнений и обратные матрицы...................................................................... 154 

Собственные векторы и собственные значения ........................................................ 158 

Заключение................................................................................................................................... 161 

Упражнения для самопроверки.......................................................................................... 161 

Глава 5. Линейная регрессия.............................................................................. 163 

Простая линейная регрессия............................................................................................... 164 

Простая линейная регрессия с помощью scikit-learn ........................................ 167

 Остатки и квадратичные отклонения............................................................................... 168 

Поиск оптимальной прямой................................................................................................. 172 

Аналитическое решение.................................................................................................. 172 

Метод обратных матриц................................................................................................... 174 

Разложение матриц ........................................................................................................... 175 

Градиентный спуск.............................................................................................................. 176 

Переобучение и дисперсия................................................................................................... 183 

Стохастический градиентный спуск.................................................................................. 185 

Коэффициент корреляции..................................................................................................... 188 

Статистическая значимость................................................................................................... 191 

Коэффициент детерминации................................................................................................ 196 

Стандартная ошибка оценки................................................................................................. 198 

Интервалы прогнозирования .............................................................................................. 199 

Обучающая и тестовая выборки ........................................................................................ 202 

Многомерная линейная регрессия.................................................................................... 208 

Заключение................................................................................................................................... 209 

Упражнения для самопроверки.......................................................................................... 210 

Глава 6 . Логистическая регрессия и классификация..................................... 211 

Что такое логистическая регрессия.................................................................................. 212 

Как выполнять логистическую регрессию..................................................................... 214 

Логистическая функция.................................................................................................... 214 

Подгонка логистической кривой................................................................................. 216 

Многомерная логистическая регрессия......................................................................... 223 

Логит-функция............................................................................................................................. 227 

R²......................................................................................................................................................... 230 

p-значения..................................................................................................................................... 235 

Обучающая и тестовая выборки......................................................................................... 237 

Матрица ошибок......................................................................................................................... 239 

Формула Байеса и классификация..................................................................................... 242 

ROC-кривая и показатель AUC............................................................................................. 243 

Дисбаланс классов..................................................................................................................... 245 

Заключение................................................................................................................................... 246 

Упражнения для самопроверки.......................................................................................... 247 

Глава 7. Нейронные сети..................................................................................... 248 

Когда использовать нейронные сети и глубокое обучение................................... 249 

Простая нейронная сеть......................................................................................................... 250 

Функции активации............................................................................................................ 253 

Прямое распространение............................................................................................... 258 

Обратное распространение.................................................................................................. 264 

Как вычислять производные по весовым коэффициентам и смещениям.......................................................................................................................... 265 

Стохастический градиентный спуск........................................................................... 269 

Scikit-learn для нейронных сетей........................................................................................ 273 

Ограничения нейронных сетей и глубокого обучения............................................ 275 

Заключение................................................................................................................................... 279 

Упражнения для самопроверки.......................................................................................... 280 

Глава 8. Советы по дальнейшей карьере......................................................... 281 

Так что же такое data science?............................................................................................... 283 

Краткая история data science................................................................................................ 285 

Как найти работу своей мечты............................................................................................. 288 

Язык SQL................................................................................................................................... 288 

Программирование............................................................................................................ 291 

Визуализация данных........................................................................................................ 296 

Предметная область........................................................................................................... 298 

Эффективное обучение.................................................................................................... 299 

Практик или консультант................................................................................................. 300 

На что стоит обратить внимание, устраиваясь на работу в области data science.................................................................................................................................... 303 

Должностные обязанности............................................................................................. 304 

Организационная направленность и заинтересованность............................ 305 

Необходимые ресурсы...................................................................................................... 307 

Разумные цели...................................................................................................................... 308 

Конкуренция с существующими системами........................................................... 310 

Должность не соответствует вашим ожиданиям.................................................. 312 

А существует ли работа вашей мечты?............................................................................. 313 

Куда же податься?...................................................................................................................... 314 

Заключение................................................................................................................................... 316 

Приложение A. Дополнительные материалы................................................. 317 

Как использовать верстку LaTeX для выражений SymPy......................................... 317 

Биномиальное распределение с нуля....................................................................... 319 

Бета-распределение с нуля............................................................................................ 320 

Вывод формулы Байеса.................................................................................................... 321 

Как построить функцию распределения (CDF) и обратную к ней функцию с нуля......................................................................................................... 323 

Как применять число e, чтобы прогнозировать вероятность события во времени........................................................................................................... 324 

Поиск восхождением к вершине и линейная регрессия.................................. 326 

Поиск восхождением к вершине и логистическая регрессия........................ 328 

Краткое введение в линейное программирование............................................ 330 

Классификатор MNIST на основе scikit-learn........................................................... 335 

Приложение Б. Ответы на упражнения для самопроверки.......................... 337 

Глава 1.............................................................................................................................................. 337 

Глава 2.............................................................................................................................................. 338 

Глава 3.............................................................................................................................................. 339 

Глава 4.............................................................................................................................................. 341 

Глава 5.............................................................................................................................................. 343 

Глава 6.............................................................................................................................................. 346 

Глава 7.............................................................................................................................................. 348 

Об авторе............................................................................................................... 350 

Иллюстрация на обложке.................................................................................... 351

 Освойте математический аппарат, который необходим, чтобы преуспеть в сфере data science, машинного обучения и статистики. Автор книги Томас Нилд поможет вам разобраться в таких дисциплинах, как математический анализ, теория вероятностей, линейная алгебра и статистика, и научиться применять их в контексте таких методов, как линейная регрессия, логистическая регрессия и нейронные сети. Попутно вы узнаете, что представляет собой современная область data science и как использовать полученные знания, чтобы достичь максимального успеха в карьере.


Похожее: