Отзывы о книге 13
Предисловие 15
Глава 1. Обзор ML-систем 23
Глава 2. Введение в проектирование ML-систем 46
Глава 3. Основы проектирования баз данных 67
Глава 4. Обучающие данные 98
Глава 5. Конструирование признаков 135
Глава 6. Разработка модели и ее автономная оценка 161
Глава 7. Развертывание модели и совершенствование ее сервиса прогнозирования 201
Глава 8. Сдвиги в распределении данных и мониторинг 232
Глава 9. Непрерывное обучение и тестирование в производстве 268
Глава 10. Инфраструктура и инструменты для MLOps 296
Глава 11. Человеческая сторона машинного обучения 334
Заключение 358
Предметный указатель 359
Об авторе 365
Об обложке 366
Сегодня машинное обучение – основной практический аппарат для применения искусственного интеллекта. Книга, основанная на стэнфордском учебном курсе, не ограничивается разбором конкретных библиотек, а описывает высокоуровневый подход к разработке систем машинного обучения, который упрощает их поддержку и развитие, позволяет избежать переобучения, искажения результатов. Рассказано, как сделать новую систему машинного обучения или нейронную сеть, надёжной, репрезентативной и расширяемой, а также качественно доработать уже существующие системы. Также показано, как подобрать библиотеки и алгоритмы с учётом имеющегося множества данных и действующих бизнес-требований, конструировать признаки и отслеживать метрики.
Книга адресована программистам и специалистам по data science
Эта книга не является введением в ML. Существует множество книг, курсов и ресурсов, посвященных теориям машинного обучения, и поэтому в этой книге эти концепции уходят в сторону, чтобы сосредоточиться на практических аспектах машинного обучения. Чтобы быть конкретным, книга предполагает, что читатели имеют базовое понимание следующих тем:
Модели машинного обучения , такие как кластеризация, логистическая регрессия, деревья решений, совместная фильтрация и различные архитектуры нейронных сетей, включая упреждающую, рекуррентную, сверточную и трансформирующую.
Методы машинного обучения , такие как контролируемое и неконтролируемое, градиентный спуск, функция цели/потери, регуляризация, обобщение и настройка гиперпараметров.
Такие метрики , как точность, F1, точность, полнота, ROC, среднеквадратическая ошибка и логарифмическая вероятность.
Статистические концепции, такие как дисперсия, вероятность и нормальное/длинное распределение.
Общие задачи машинного обучения, такие как языковое моделирование, обнаружение аномалий, классификация объектов и машинный перевод.
Инжиниринг данных и выбор нужных метрик, помогающих правильно решить задачу
Автоматизация процесса, позволяющая непрерывно разрабатывать, оценивать, развёртывать и обновлять модели
Разработка мониторинговой системы, позволяющей быстро обнаруживать и устранять проблемы, которые могут возникать в реальном использовании
Выстраивание платформы машинного обучения, которая была бы применима сразу во многих практических ситуациях
Ответственный подход к разработке систем машинного обучения
Сегодня машинное (ML) и глубокое (DL) обучение неотделимы от понятий искусственного интеллекта и анализа данных. Лёгкие подходы к машинному обучению исчерпаны. Требуется иметь дело с синтетическими данными, заниматься конструированием признаков (feature engineering), бороться с переобучением, выбросами, состязательными атаками, а также учитывать человеческий фактор в машинном обучении.
Автор подробно описывает, как готовить тренировочные наборы данных, конструировать признаки, доводить модели до совершенства, не переобучая их, как подбирать метрики и что именно отслеживать.
В книге представлен целостный подход к проектированию систем машинного обучения. Вы узнаете, как сделать новую ML-систему или нейронную сеть удобной в поддержке, надёжной, репрезентативной и расширяемой. Показано, как грамотно подобрать библиотеки и алгоритмы с учётом имеющегося множества данных и действующих бизнес-требований.