Регрессия. Теория и практика. С примерами на R и Stan

Регрессия. Теория и практика. С примерами на R и Stan

Регрессия. Теория и практика. С примерами на R и Stan
Автор: Вехтари Аки, Гельман Эндрю, Хилл Дженнифер
Дата выхода: 2022
Издательство: ДМК Пресс
Количество страниц: 750
Размер файла: 54.4 MB
Тип файла: PDF
Добавил: codelibs
 Проверить на вирусы

 Предисловие....14

Благодарности....15

Краткое содержание книги....16

Более увлекательные названия глав....17

Скачивание исходного кода примеров....19

Максимально эффективное использование книги....19

В помощь преподавателю: возможная структура курсов....19

Типографские соглашения, принятые в книге....20

Отзывы и пожелания....20

Список опечаток....21

Нарушение авторских прав....21

Часть I. Основы....22

Глава 1....23

Обзор темы и знакомство с регрессией....23

1.1. Три задачи статистики....23

1.2. Зачем изучать регрессию?....25

1.3. Несколько примеров регрессии....27

1.4. Проблемы построения и интерпретации регрессий....33

1.5. Классический и байесовский вывод....39

1.6. Вычисление наименьших квадратов и байесовской регрессии....44

1.7. Упражнения....45

Глава 2....49

Данные и показатели....49

2.1. Проверка происхождения данных....49

2.2. Достоверность и надежность....52

2.3. Все графики служат для сравнения....55

2.4. Данные и корректировка: тенденции в уровнях смертности....64

2.5. Упражнения....67

Глава 3....69

Обзор основных методов математики и теории вероятностей....69

3.1. Средневзвешенные значения....69

3.2. Векторы и матрицы....70

3.3. Построение линии....72

3.4. Экспоненциальный и степенной рост и спад, логарифмические отношения....73

3.5. Распределения вероятностей....77

3.6. Вероятностное моделирование....84

3.7. Упражнения....87

Глава 4....89

Статистический вывод....89

4.1. Выборочные распределения и генеративные модели....89

4.2. Оценки, стандартные ошибки и доверительные интервалы....91

4.3. Предвзятость и немоделируемая погрешность....99

4.4. Статистическая значимость, проверка гипотез и статистические ошибки....102

4.5. Проблемы с концепцией статистической значимости....107

4.6. Пример проверки гипотезы: 55 000 жителей нуждаются в вашей помощи!....112

4.7. Выход за рамки проверки гипотез....116

4.8. Упражнения....118

Глава 5....121

Моделирование случайных величин....121

5.1. Моделирование дискретных вероятностей....121

5.2. Моделирование непрерывных и смешанных дискретно-непрерывных вероятностей....124

5.3. Вычисление сводных показателей моделей с использованием среднего и среднего абсолютного отклонения....126

5.4. Моделирование выборочного распределения с помощью бутстрапа....127

5.5. Моделирование имитационных данных как образ жизни....131

5.6. Упражнения....131

Часть II. Линейная регрессия....136

Глава 6....137

Основы регрессионного моделирования....137

6.1. Регрессионные модели....137

6.2. Подгонка простой регрессии к смоделированным данным....138

6.3. Интерпретируйте коэффициенты как сравнения, а не как эффекты....141

6.4. Историческое происхождение регрессии....143

6.5. Парадокс регрессии к среднему....146

6.6. Упражнения....150

Глава 7....153

Линейная регрессия с одним предиктором....153

7.1. Пример: прогнозирование итога президентских выборов по экономической ситуации....153

7.2. Проверка подгонки модели с помощью моделирования данных....158

7.3. Сравнения как частный случай регрессионных моделей....161

7.4. Упражнения....165

Глава 8....167

Подгонка регрессионных моделей....167

8.1. Наименьшие квадраты, максимальное правдоподобие и байесовский вывод....167

8.2. Влияние отдельных точек в подогнанной регрессии....174

8.3. Наклон линии в методе наименьших квадратов как средневзвешенное значение наклонов пар....175

8.4. Сравнение подгоночных функций lm и stan_glm....176

8.5. Упражнения....179

Глава 9....183

Прогнозирование и байесовский вывод....183

9.1. Распространение погрешности вывода с помощью апостериорного моделирования....183

9.2. Прогноз и погрешность: predict, posterior_linpred и posterior_predict....186

9.3. Априорная информация и байесовский синтез....192

9.4. Пример байесовского вывода: соотношение привлекательности и пола....195

9.5. Равномерные, малоинформативные и информативные априорные значения в регрессии....198

9.6. Упражнения....205

Глава 10....209

Линейная регрессия с несколькими предикторами....209

10.1. Добавление предикторов в модель....209

10.2. Интерпретация коэффициентов регрессии....213

10.3. Взаимодействия....214

10.4. Индикаторные переменные....216

10.5. Построение плана парного и группового эксперимента как задача регрессии....221

10.6. Погрешность прогнозирования выборов в Конгресс....223

10.7. Математические обозначения и статистический вывод....229

10.8. Взвешенная регрессия....233

10.9. Подгонка одной модели ко многим наборам данных....235

10.10. Упражнения....236

Глава 11....241

Предположения, диагностика и оценка модели....241

11.1. Предположения регрессионного анализа....241

11.2. Построение графика данных и подогнанной модели....246

11.3. Графики остатков....252

11.4. Сравнение данных с репликациями из подогнанной модели....256

11.5. Прогнозное моделирование для проверки подгонки модели временного ряда....259

11.6. Остаточное стандартное отклонение σ и объясненная дисперсия R2....263

11.7. Внешняя валидация: проверка подогнанной модели на новых данных....268

11.8. Перекрестная проверка....269

11.9. Упражнения....281

Глава 12....284

Регрессия и преобразования данных....284

12.1. Линейные преобразования....284

12.2. Центрирование и стандартизация моделей с взаимодействиями....287

12.3. Корреляция и регрессия к среднему....290

12.4. Логарифмические преобразования....293

12.5. Другие преобразования....302

12.6. Создание и сравнение регрессионных моделей для прогнозирования....307

12.7. Модели с большим количеством предикторов....318

12.8. Упражнения....325

Часть III. Обобщенные линейные модели....330

Глава 13....331

Логистическая регрессия....331

13.1. Логистическая регрессия с одним предиктором....331

13.2. Интерпретация коэффициентов логистической регрессии и правило деления на 4....335

13.3. Прогнозы и сравнения....339

13.4. Интерпретация регрессии через скрытые данные....344

13.5. Максимальное правдоподобие и байесовский вывод для логистической регрессии....347

13.6. Перекрестная проверка и логарифмическая оценка для логистической регрессии....351

13.7. Построение модели логистической регрессии: колодцы в Бангладеш....354

13.8. Упражнения....361

Глава 14....366

Продолжаем работу с логистической регрессией....366

14.1. Графическое представление логистической регрессии и двоичных данных....366

14.2. Логистическая регрессия с взаимодействиями....368

14.3. Прогностическое извлечение имитационных данных....375

14.4. Средние прогностические сравнения по шкале вероятности....377

14.5. Остатки регрессии дискретных данных....383

14.6. Идентификация и разделение....388

14.7. Упражнения....393

Глава 15....397

Другие обобщенные линейные модели....397

15.1. Определение и обозначения....397

15.2. Регрессия Пуассона и отрицательная биномиальная регрессия....399

15.3. Логистически-биномиальная модель....408

15.4. Пробит-регрессия: нормально распределенные скрытые данные....410

15.5. Упорядоченная и неупорядоченная категориальная регрессия....412

15.6. Робастная регрессия с использованием t-модели....419

15.7. Модели конструктивного выбора....421

15.8. Выходим за рамки обобщенных линейных моделей....426

15.9. Упражнения....430

Часть IV. До и после подгонки регрессии....436

Глава 16....437

План исследования и размер выборки....437

16.1. Проблема статистической мощности....437

16.2. Общие принципы разработки исследования на примере оценки долей....440

16.3. Размер выборки и расчет плана для непрерывных результатов....446

16.4. Взаимодействия труднее оценить, чем основные эффекты....453

16.5. Расчет эксперимента после сбора данных....459

16.6. Анализ эксперимента с использованием имитационных данных....462

16.7. Упражнения....468

Глава 17....472

Постстратификация и внедрение недостающих данных....472

17.1. Постстратификация: использование регрессии для обобщения на новую популяцию....472

17.2. Генерация имитационных данных для регрессии и постстратификации....483

17.3. Моделирование недостающих данных....486

17.4. Простые подходы к работе с отсутствующими данными....489

17.5. Что такое множественная подстановка?....492

17.6. Неисключающие модели отсутствующих данных....502

17.7. Упражнения....503

Часть V. Причинный вывод....508

Глава 18....509

Причинный вывод и рандомизированные эксперименты....509

18.1. Основы причинного вывода....509

18.2. Средние причинные эффекты....515

18.3. Рандомизированные эксперименты....519

18.4. Распределения выборки, распределения рандомизации и систематическая ошибка в оценке....521

18.5. Использование дополнительной информации при планировании экспериментов....523

18.6. Свойства, допущения и ограничения рандомизированных экспериментов....528

18.7. Упражнения....537

Глава 19....545

Причинный вывод с использованием регрессии по переменной воздействия....545

19.1. Ковариаты до воздействия, методы воздействия и потенциальные результаты....545

19.2. Пример: эффект от показа детям образовательного телешоу....547

19.3. Использование предикторов, известных до воздействия....552

19.4. Различные эффекты воздействия, взаимодействие и постстратификация....556

19.5. Проблемы интерпретации коэффициентов регрессии как эффектов воздействия....560

19.6. Не применяйте для корректировки модели вторичные переменные....562

19.7. Промежуточные результаты и причинно-следственные связи....565

19.8. Упражнения....570

Глава 20....575

Наблюдательные исследования со всеми предполагаемыми искажающими факторами....575

20.1. Проблема причинного вывода....575

20.2. Использование регрессии для оценки причинного эффекта по данным наблюдений....579

20.3. Допущение о неведении при назначении воздействия в наблюдательном исследовании....582

20.4. Дисбаланс и недостаточное перекрытие....587

20.5. Пример: оценка программы по воспитанию детей....593

20.6. Подклассификация и средние эффекты воздействия....596

20.7. Сопоставление меры склонности в примере ухода за детьми....601

20.8. Реструктуризация для создания сбалансированных экспериментальных и контрольных групп....610

20.9. Дополнительные соображения относительно наблюдательных исследований....624

20.10. Упражнения....628

Глава 21....635

Дополнительные соображения о причинном выводе....635

21.1. Косвенная оценка причинно-следственных связей с использованием инструментальных переменных....635

21.2. Инструментальные переменные в регрессионном подходе....644

21.3. Разрывная регрессия: известный механизм назначения, но без перекрытия....653

21.4. Идентификация с использованием различий внутри или между группами....664

21.5. Причины следствий и следствия причин....673

21.6. Упражнения....679

Часть VI. Что дальше?....688

Глава 22....689

Расширенная регрессия и многоуровневые модели....689

22.1. Представление моделей в наиболее обобщенном виде....689

22.2. Неполные данные....690

22.3. Коррелированные ошибки и многомерные модели....692

22.4. Регуляризация моделей со многими предикторами....693

22.5. Многоуровневые, или иерархические, модели....694

22.6. Нелинейные модели – демонстрация с использованием Stan....695

22.7. Непараметрическая регрессия и машинное обучение....700

22.8. Вычислительная эффективность....706

22.9. Упражнения....710

Приложение A....712

Вычисления в R....712

A.1. Загрузка и установка R и Stan....712

A.2. Скачивание данных и кода примеров....714

А.3. Основы....714

A.4. Чтение, запись и просмотр данных....720

А.5. Создание графиков....722

A.6. Работа с неупорядоченными данными....726

A.7. Основы программирования на R....730

A.8. Работа с объектами rstanarm....733

Приложение B....736

10 кратких советов по регрессионному моделированию....736

B.1. Не забывайте о вариации и репликации....736

B.2. Забудьте о статистической значимости....736

B.3. Изображайте на графике только релевантные данные....737

B.4. Интерпретируйте коэффициенты регрессии как сравнения....738

B.5. Изучайте методы статистики при помощи симуляции данных....738

B.6. Подгоняйте много моделей....739

B.7. Настройте вычислительную часть рабочего процесса....740

B.8. Используйте преобразования....741

B.9. Делайте целенаправленные выводы о причинно-следственных связях....741

B.10. Изучайте методы на живых примерах....742

Предметный указатель....743

Регрессия - это статистический метод, который позволяет найти уравнение, наилучшим образом описывающее совокупность данных. Регрессионный анализ позволяет моделировать, проверять и исследовать пространственные отношения, а в ряде случаев устанавливать причинно-следственные связи между независимыми и зависимыми переменными.В этой книге представлен практический подход к компьютерному построению регрессионных моделей. Прочитав ее и проработав упражнения, вы научитесь выбирать, создавать, интерпретировать и оценивать линейные и обобщенные линейные модели и использовать их, чтобы делать прогнозы и выводы.Издание предназначено широкому кругу специалистов по анализу и обработке данных, а также может служить учебником для студентов технических вузов.


Похожее:

Список отзывов:

Нет отзывов к книге.