Читаем Статистический анализ взаимосвязи в Excel полностью

Нелинейная регрессия

Выбираем автоматическое построение графика «аппроксимации»:

Residuals — Line Fit Plots

Остатки — График подбора.

На экране появляются два загадочных графика.

Графики аппроксимации

Чтобы понять, почему появилось два графика вместо одного, заглянем в исходные данные второй диаграммы. Щёлкнем правой кнопкой по графику и выберем

Select Data

Выбрать данные.

В этой диаграмме использованы два набора данных: y (исходные «игреки») и Predicted y (прогноз значений «игрека» по уравнению регрессии). В окне

Select Data Source

Выбор источника данных

выберем строчку y и нажмём

Edit

Изменить.

Данные для второй диаграммы

Рассмотрим, какие данные были выбраны для диаграммы. Нужные сведения выводятся в окне

Edit Series

Изменение ряда.

Выясняется, что по горизонтальной оси были выбраны квадраты «иксов».

Данные для второй диаграммы

Оставляем только первый график, а второй — удаляем. Теперь настроим наш график аппроксимации и рассмотрим его поподробней.

«График» параболы

Вместо ЛИНИИ регрессии можно видеть странную фигуру, которая утолщается в середине и сужается по краям. Причина в том, что соседние точки на графике соединяются отрезками. Но эти точки идут в том же порядке, как в исходной таблице, а там данные расположены в случайном порядке, не по возрастанию. Придётся кое-что подправить.

Скопируем столбец «иксов» и вставим на место столбца

Observation

Наблюдение

в таблицу

RESIDUAL OUTPUT

ВЫВОД ОСТАТКА.

Столбец Observation содержит порядковые номера i наблюдений в таблице исходных данных.

Третий столбец

Residuals

Остатки

нам для работы не потребуется — мы его просто удаляем.

Таблица прогнозов

Теперь у нас есть пары соответствующих «иксов» и «игреков». Отсортируем их по возрастанию. Для этого выделяем диапазон данных в столбцах Х и

Predicted y

Предсказанное Y.

Вызываем сортировку через верхнее меню:

Home — Editing — Sort & Filter — Sort Smallest to Largest

Главная — Редактирование — Сортировка и фильтр — Сортировка по возрастанию.

Сортировка по возрастанию

Сортировка ячеек выделенного диапазона выполняется по возрастанию чисел в первом столбце. Это значит, что «иксы» выстраиваются по возрастанию, а соответствующие им «игреки» перемещаются вслед за своими «иксами».

Отсортированные данные

Теперь изменим диапазоны ячеек для Predicted y в данных для графика:

Select Data — Select Data Source — Legend Entries (Series) — Predicted y — Edit.

Выбор данных — Выбор источника данных — Легенда — Предсказанное Y — Изменить.

Данные для Predicted y

Вместо столбца исходных «иксов» выбираем отсортированные «иксы» из вспомогательной таблицы. Диапазон для прогноза «игреков» оставляем тем же.

Отсортированные Predicted y

Теперь линия регрессии на графике стала похожа на линию. Поскольку мы генерировали исходные данные с помощью уравнения прямой линии, в наших точках особой «кривизны» не наблюдается. Так что мы видим участок параболы с очень небольшой кривизной.

График по отсортированным данным

Перейдём к уравнению регрессии. Надстройка выдаёт нам оценки коэффициентов уравнения. Заголовки строк указывают, к чему относится каждый коэффициент:

Intercept — свободный член уравнения;

x — «иксы»;

x2 — квадраты «иксов».

В исходной таблице мы сделали красивый заголовок для квадратов «икса» x2с помощью форматирования. Как видим, при выводе результатов регрессионного анализа форматирование потерялось и осталось только x2. Делаем вывод: заголовки должны быть такими, чтобы они хорошо читались как с форматированием, так и без форматирования.

Оценки коэффициентов

Берём коэффициенты и записываем уравнение регрессии. Нам понадобится несколько ячеек. Используем ссылки на ячейки с оценками коэффициентов.

Уравнение регрессии

Коэффициент при квадрате «икса» небольшой. С учётом величины квадрата «икса» получаем небольшой вклад в общий результат — на фоне остальных членов уравнения. Сравним вклад членов уравнения для среднего значения аргумента. Вычисления округлим до целых:

x = 1 500

x2 = 2 250 000.

Свободный член: 1 086.

Вклад х: 1,0733 * 1500 = 1 610.

Вклад х2: 0,000 137 * 1 500 * 1 500 = 308.

Относительный вклад х2:

308 / (1086 +1610 +308) * 100% = 10%.

Получается, что нелинейная часть уравнения даёт всего 10% изменения результативного признака.

Чтобы построить уравнение третьей степени, повторите описанные шаги для диапазона ячеек, дополнительно включающего столбец третьих степеней «иксов».

Перейти на страницу:

Похожие книги

112 страниц про Париж. Опыт создания путеводителя (в помощь самостоятельным туристам)
112 страниц про Париж. Опыт создания путеводителя (в помощь самостоятельным туристам)

  По Парижу приятно гулять, бесцельно бродить, кружить по узким улочкам, отдыхать в маленьких кафе и в парках у фонтанов. Здесь есть все для любителей архитектуры, ценителей живописи, театралов, меломанов, гурманов, поклонников всевозможных развлечений. Париж притягивает, удивляет, очаровывает, постепенно приоткрывая тайны любознательному гостю, который теряется от сложности выбора: что же увидеть прямо сейчас, а что отложить на потом. Мои 112 страниц про Париж, надеюсь, помогут сделать этот выбор. Предложенные 7 прогулок по городу включают в себя не только известные всему миру достопримечательности, но и множество других, которые часто остаются за пределами стандартных туристических маршрутов.  

Елена Р Стамбулян , Елена Р. Стамбулян

Руководства / Путеводители / Словари и Энциклопедии
40+. Уход за телом
40+. Уход за телом

Женщина после 40 лет – настоящая богиня, умудренная опытом и оттого еще более прекрасная. Но чтобы надолго сохранить красоту и молодость, нужно постоянно собой заниматься: ухаживать за своим телом, руками и ногами, выполнять физические упражнения и соблюдать диету. Благодаря этой книге вы научитесь самостоятельно готовить омолаживающие, питательные, увлажняющие кремы и маски, а также скрабы и пилинги из натуральных продуктов; выполнять легкие и эффективные упражнения для стройной фигуры и профилактики варикозного расширения вен, делать массаж рук и ног, навсегда избавитесь от целлюлита и сможете легко ориентироваться в выборе омолаживающих процедур в СПА-салонах и хирургических операций в клиниках красоты. Правила здорового питания, популярные диеты и рецепты полезных блюд – в этой книге есть все, что поможет 40-летним женщинам всегда быть в форме.

Анастасия Витальевна Колпакова

Здоровье / Руководства / Здоровье и красота / Дом и досуг / Словари и Энциклопедии