Предисловие............................................................................................................11
Условные обозначения...............................................................................................................14
Использование исходного кода примеров.......................................................................15
Благодарности.........................................................................................................16
О редакторах русского издания.............................................................................................17
От издательства..............................................................................................................................17
Глава 1. Обзор начальной математики и математического анализа..............18
Теория чисел....................................................................................................................................19
Порядок выполнения арифметических операций........................................................21
Переменные.....................................................................................................................................22
Функции.............................................................................................................................................23
Суммы.................................................................................................................................................28
Возведение в степень..................................................................................................................30
Логарифмы.......................................................................................................................................33
Число e и натуральные логарифмы......................................................................................35
Число e.........................................................................................................................................35
Натуральные логарифмы....................................................................................................38
Пределы.............................................................................................................................................39
Производные...................................................................................................................................41
Частные производные.........................................................................................................45
Цепное правило......................................................................................................................48
Интегралы.........................................................................................................................................50
Заключение......................................................................................................................................55
Упражнения для самопроверки.............................................................................................55
Глава 2. Теория вероятностей................................................................................56
Что такое вероятность................................................................................................................56
Теория вероятностей и статистика................................................................................58
Математика вероятностей........................................................................................................59
Вероятность пересечения событий...............................................................................59
Вероятность объединения событий..............................................................................60
Условная вероятность и формула Байеса...................................................................62
Условная вероятность пересечения и объединения событий.........................65
Биномиальное распределение...............................................................................................66
Бета-распределение....................................................................................................................69
Заключение......................................................................................................................................75
Упражнения для самопроверки.............................................................................................76
Глава 3. Описательная статистика и статистический вывод............................77
Что такое данные?.........................................................................................................................78
Описательная статистика и статистический вывод.......................................................80
Совокупности, выборки и смещение...................................................................................81
Описательная статистика..........................................................................................................85
Среднее арифметическое и среднее взвешенное..................................................86
Медиана......................................................................................................................................88
Мода.............................................................................................................................................89
Дисперсия и стандартное отклонение.........................................................................90
Нормальное распределение.............................................................................................95
PPF — функция, обратная к функции распределения........................................ 102
Статистический вывод............................................................................................................. 105
Центральная предельная теорема.............................................................................. 106
Доверительные интервалы............................................................................................. 109
p-значения.............................................................................................................................. 112
Проверка гипотез................................................................................................................ 113
Распределение Стьюдента: работа с малыми выборками...................................... 121
Кое-что о больших данных и ошибке меткого стрелка............................................ 123
Заключение................................................................................................................................... 124
Упражнения для самопроверки.......................................................................................... 125
Глава 4. Линейная алгебра.................................................................................. 127
Что такое вектор?....................................................................................................................... 128
Сложение векторов............................................................................................................ 132
Умножение вектора на число........................................................................................ 134
Линейная оболочка и линейная зависимость ...................................................... 136
Линейные преобразования................................................................................................... 138
Базисные векторы............................................................................................................... 138
Умножение матрицы на вектор..................................................................................... 141
Умножение матриц.................................................................................................................... 145
Определители.............................................................................................................................. 148
Особые виды матриц................................................................................................................ 151
Квадратная матрица........................................................................................................... 151
Единичная матрица............................................................................................................ 152
Обратная матрица............................................................................................................... 152
Диагональная матрица..................................................................................................... 153
Треугольная матрица......................................................................................................... 153
Разреженная матрица....................................................................................................... 154
Системы уравнений и обратные матрицы...................................................................... 154
Собственные векторы и собственные значения ........................................................ 158
Заключение................................................................................................................................... 161
Упражнения для самопроверки.......................................................................................... 161
Глава 5. Линейная регрессия.............................................................................. 163
Простая линейная регрессия............................................................................................... 164
Простая линейная регрессия с помощью scikit-learn ........................................ 167
Остатки и квадратичные отклонения............................................................................... 168
Поиск оптимальной прямой................................................................................................. 172
Аналитическое решение.................................................................................................. 172
Метод обратных матриц................................................................................................... 174
Разложение матриц ........................................................................................................... 175
Градиентный спуск.............................................................................................................. 176
Переобучение и дисперсия................................................................................................... 183
Стохастический градиентный спуск.................................................................................. 185
Коэффициент корреляции..................................................................................................... 188
Статистическая значимость................................................................................................... 191
Коэффициент детерминации................................................................................................ 196
Стандартная ошибка оценки................................................................................................. 198
Интервалы прогнозирования .............................................................................................. 199
Обучающая и тестовая выборки ........................................................................................ 202
Многомерная линейная регрессия.................................................................................... 208
Заключение................................................................................................................................... 209
Упражнения для самопроверки.......................................................................................... 210
Глава 6 . Логистическая регрессия и классификация..................................... 211
Что такое логистическая регрессия.................................................................................. 212
Как выполнять логистическую регрессию..................................................................... 214
Логистическая функция.................................................................................................... 214
Подгонка логистической кривой................................................................................. 216
Многомерная логистическая регрессия......................................................................... 223
Логит-функция............................................................................................................................. 227
R²......................................................................................................................................................... 230
p-значения..................................................................................................................................... 235
Обучающая и тестовая выборки......................................................................................... 237
Матрица ошибок......................................................................................................................... 239
Формула Байеса и классификация..................................................................................... 242
ROC-кривая и показатель AUC............................................................................................. 243
Дисбаланс классов..................................................................................................................... 245
Заключение................................................................................................................................... 246
Упражнения для самопроверки.......................................................................................... 247
Глава 7. Нейронные сети..................................................................................... 248
Когда использовать нейронные сети и глубокое обучение................................... 249
Простая нейронная сеть......................................................................................................... 250
Функции активации............................................................................................................ 253
Прямое распространение............................................................................................... 258
Обратное распространение.................................................................................................. 264
Как вычислять производные по весовым коэффициентам и смещениям.......................................................................................................................... 265
Стохастический градиентный спуск........................................................................... 269
Scikit-learn для нейронных сетей........................................................................................ 273
Ограничения нейронных сетей и глубокого обучения............................................ 275
Заключение................................................................................................................................... 279
Упражнения для самопроверки.......................................................................................... 280
Глава 8. Советы по дальнейшей карьере......................................................... 281
Так что же такое data science?............................................................................................... 283
Краткая история data science................................................................................................ 285
Как найти работу своей мечты............................................................................................. 288
Язык SQL................................................................................................................................... 288
Программирование............................................................................................................ 291
Визуализация данных........................................................................................................ 296
Предметная область........................................................................................................... 298
Эффективное обучение.................................................................................................... 299
Практик или консультант................................................................................................. 300
На что стоит обратить внимание, устраиваясь на работу в области data science.................................................................................................................................... 303
Должностные обязанности............................................................................................. 304
Организационная направленность и заинтересованность............................ 305
Необходимые ресурсы...................................................................................................... 307
Разумные цели...................................................................................................................... 308
Конкуренция с существующими системами........................................................... 310
Должность не соответствует вашим ожиданиям.................................................. 312
А существует ли работа вашей мечты?............................................................................. 313
Куда же податься?...................................................................................................................... 314
Заключение................................................................................................................................... 316
Приложение A. Дополнительные материалы................................................. 317
Как использовать верстку LaTeX для выражений SymPy......................................... 317
Биномиальное распределение с нуля....................................................................... 319
Бета-распределение с нуля............................................................................................ 320
Вывод формулы Байеса.................................................................................................... 321
Как построить функцию распределения (CDF) и обратную к ней функцию с нуля......................................................................................................... 323
Как применять число e, чтобы прогнозировать вероятность события во времени........................................................................................................... 324
Поиск восхождением к вершине и линейная регрессия.................................. 326
Поиск восхождением к вершине и логистическая регрессия........................ 328
Краткое введение в линейное программирование............................................ 330
Классификатор MNIST на основе scikit-learn........................................................... 335
Приложение Б. Ответы на упражнения для самопроверки.......................... 337
Глава 1.............................................................................................................................................. 337
Глава 2.............................................................................................................................................. 338
Глава 3.............................................................................................................................................. 339
Глава 4.............................................................................................................................................. 341
Глава 5.............................................................................................................................................. 343
Глава 6.............................................................................................................................................. 346
Глава 7.............................................................................................................................................. 348
Об авторе............................................................................................................... 350
Иллюстрация на обложке.................................................................................... 351
Освойте математический аппарат, который необходим, чтобы преуспеть в сфере data science, машинного обучения и статистики. Автор книги Томас Нилд поможет вам разобраться в таких дисциплинах, как математический анализ, теория вероятностей, линейная алгебра и статистика, и научиться применять их в контексте таких методов, как линейная регрессия, логистическая регрессия и нейронные сети. Попутно вы узнаете, что представляет собой современная область data science и как использовать полученные знания, чтобы достичь максимального успеха в карьере.