От издательства....12
Предисловие....13
Благодарности....22
Об авторе....23
Об иллюстрации на обложке (колофон)....24
Часть I. Понимание поведений....25
Глава 1. Причинно-поведенческий каркас для анализа данных....26
Почему для объяснения человеческого поведения нужна причинно-следственная аналитика....27
Различные типы аналитики....27
Люди – сложные существа....28
Чтоб ей пусто было! Скрытые опасности, когда разбирательства отданы на усмотрение регрессии....31
Данные....32
Почему корреляция не есть каузация: спутывающий фактор в действии....33
Слишком много переменных может испортить всю обедню....35
Выводы....41
Глава 2. Понимание поведенческих данных....42
Базовая модель человеческого поведения....43
Личностные характеристики....44
Познание и эмоции....46
Намерения....47
Действия....49
Поведения бизнеса....50
Как соединять поведения и данные....51
Развивать бихевиористски целостный менталитет....52
Не доверять и проверять....53
Выявлять категорию....54
Уточнять поведенческие переменные....56
Понимать контекст....57
Выводы....60
Часть II. Причинно-следственные диаграммы и распутывание....61
Глава 3. Введение в причинно-следственные диаграммы....62
Причинно-следственные диаграммы и причинно-поведенческий каркас....63
Причинно-следственные диаграммы представляют поведения....64
Причинно-следственные диаграммы представляют данные....66
Фундаментальные структуры причинно-следственных диаграмм....70
Цепочки....70
Развилки....74
Сталкиватели....76
Распространенные преобразования причинно-следственных диаграмм....78
Нарезка/дезагрегирование переменных....78
Агрегирование переменных....79
А что делать с циклами?....81
Пути....85
Выводы....86
Глава 4. Строительство причинно-следственных диаграмм с нуля....88
Деловая задача и настройка данных....89
Данные и пакеты....90
Понимание интересующей взаимосвязи....90
Выявление переменных-кандидатов на включение....92
Действия....94
Намерения....95
Познание и эмоции....96
Личностные характеристики....97
Поведения бизнеса....100
Временные тренды....101
Подтверждение наблюдаемых переменных для включения на основе данных....102
Взаимосвязи между числовыми переменными....103
Взаимосвязи между категориальными переменными....106
Взаимосвязи между числовыми и категориальными переменными....109
Итеративное расширение причинно-следственной диаграммы....111
Выявление косвенных индикаторов для ненаблюдаемых переменных....112
Выявление дальнейших причин....113
Итеративный повтор....114
Упрощения причинно-следственной диаграммы....114
Выводы....116
Глава 5. Использование причинно-следственных диаграмм для распутывания аналитических расчетов....117
Деловая задача: продажи мороженого и бутилированной воды....118
Критерий дизъюнктивной причины....121
Определение....121
Первый блок....121
Второй блок....123
Критерий боковой двери....124
Определения....124
Первый блок....127
Второй блок....128
Выводы....130
Часть III. Устойчивый анализ данных....131
Глава 6. Работа с пропущенными данными....132
Данные и пакеты....134
Визуализация пропущенных данных....135
Объем пропущенных данных....138
Корреляция пропущенности....140
Диагностика пропущенных данных....145
Причины пропущенности: классификация Рубина....148
Диагностика переменных MCAR....150
Диагностика переменных MAR....152
Диагностика переменных MNAR....154
Пропущенность как спектр....156
Работа с пропущенными данными....160
Введение во множественное вменение (MI)....161
Метод вменения по умолчанию: соотнесение с предсказательным средним значением....163
От PMM к нормальному вменению (только для R)....165
Добавление вспомогательных переменных....167
Вертикальное масштабирование числа наборов вмененных данных....169
Выводы....170
Глава 7. Измерение неопределенности с помощью бутстрапа....172
Введение в бутстрап: «опрашивание» самого себя....173
Пакеты....173
Деловая задача: малые данные с выбросом....173
Бутстраповский интервал уверенности для выборочного среднего....175
Бутстраповские интервалы уверенности для нерегламентированной статистики....181
Бутстрап для регрессионного анализа....183
Когда следует использовать бутстрап....186
Условия достаточности традиционной центральной оценки....187
Условия достаточности традиционного интервала уверенности....188
Определение числа бутстраповских выборок....190
Оптимизирование бутстрапа на R и Python....192
R: пакет boot....192
Оптимизация на Python....195
Выводы....196
Часть IV. Дизайн и анализ экспериментов....197
Глава 8. Экспериментальный дизайн: основы....199
Планирование эксперимента: теория изменения....200
Деловая цель и целевая метрика....201
Вмешательство....204
Поведенческая логика....206
Данные и пакеты....208
Определение случайного размещения и размера/мощности выборки....209
Случайное размещение....209
Размер выборки и анализ мощности....212
Анализирование и интерпретирование экспериментальных результатов....227
Выводы....230
Глава 9. Стратифицированная рандомизация....231
Планирование эксперимента....233
Деловая цель и целевая метрика....233
Определение вмешательства....235
Поведенческая логика....236
Данные и пакеты....236
Определение случайного размещения и размера/мощности выборки....237
Случайное размещение....238
Анализ мощности с помощью бутстраповских симуляций....246
Анализ и интерпретация экспериментальных результатов....253
Оценка намерения относительно экспериментальной процедуры для стимулирования вмешательства....254
Оценка причинно-следственного эффекта среднего по соблюдающим требования испытуемым в целях обязательного вмешательства....255
Выводы....261
Глава 10. Кластерная рандомизация и иерархическое моделирование....263
Планирование эксперимента....264
Деловая цель и целевая метрика....264
Определение вмешательства....264
Поведенческая логика....266
Данные и пакеты....266
Введение в иерархическое моделирование....267
Исходный код на R....268
Исходный код на Python....271
Определение случайного размещения и размера/мощности выборки....273
Случайное размещение....273
Анализ мощности....275
Анализ эксперимента....283
Выводы....283
Часть V. Продвинутые инструменты анализа поведенческих данных....285
Глава 11. Введение в модерацию....286
Данные и пакеты....287
Поведенческие разновидности модерации....287
Сегментация....287
Взаимодействия....294
Нелинейности....295
Как применять модерацию....298
Когда следует искать модерацию?....299
Несколько модераторов....310
Подтверждение модерации с помощью бутстрапа....316
Интерпретирование отдельных коэффициентов....318
Выводы....324
Глава 12. Опосредование и инструментальные переменные....326
Опосредование....327
Понимание причинно-следственных механизмов....327
Причинно-следственные систематические смещения....329
Выявление опосредования....330
Измерение опосредования....332
Инструментальные переменные....337
Данные....337
Пакеты....338
Понимание и применение инструментальных переменных....338
Измерение....341
Применение инструментальных переменных: часто задаваемые вопросы....344
Выводы....345
Библиография....347
Предметный указатель....351
Задействуйте всю мощь поведенческих данных в своей компании, используя инструменты, специально разработанные для их анализа. Автор, эксперт в области экономики и бихевиористики, показывает, как повысить ценность и результаты аналитических проектов за счет понимания того, что движет поведением людей. Практическая часть книги содержит полные примеры и упражнения на языках R и Python, которые помогут вам получать более глубокую информацию о данных.
Издание предназначено для бизнес-аналитиков и других специалистов, исследующих данные и владеющих программированием на R или Python. Для чтения требуется минимальное знакомство с линейной и логистической регрессией.