Data — Analysis — Data Analysis — Histogram
Данные — Анализ — Анализ данных — Гистограмма
Появляется диалоговое окно
Histogram
Гистограмма
Выбираем диапазон ячеек, где находятся наши исходные данные:
Input — Input Range
Входные данные — Входной интервал
Нажимаем кнопку выбора диапазона со стрелкой, нарпавленной вверх — см. рисунок.
Выбор диапазона
Появляется окно выбора диапазона.
Выбор диапазона
Переходим на нужный лист нашей рабочей книги и выделяем столбец округлённых данных — вместе с заголовком. В этом случае имя переменной — заголовок столбца — автоматически появится в таблицах и на графиках. Поэтому щёлкаем по первой ячейке столбца B и нажимаем комбинацию клавиш Ctrl + Shift + ↓, а затем клавишу Enter или кнопку со стрелкой, направленной вниз. Кроме диапазона адресов указывается название листа, на котором находятся наши данные — см. рисунок.
Здесь 04 — указание на лист с названием 04.
$B$1:$B$10001 — диапазон ячеек на указанном листе
Выбранный диапазон
Чтобы использовать заголовок столбца в качестве названия переменной, поставим галочку в разделе
Labels
Метки
Следующий шаг — выбираем диапазон ячеек, в котором мы сформировали ВЕРХНИЕ (ПРАВЫЕ) ГРАНИЦЫ интервалов группировки. Не перепутайте, именно верхние границы!
Input — Bin Range
Входные данные — Интервал карманов
Щёлкаем кнопку выбора диапазона и выделяем диапазон верхних границ — тоже вместе с заголовком.
Диапазон верхних границ
Аналогично указываем диапазон ячеек для вывода результатов. На самом деле, мы указываем только одну ячейку — левый верхний угол той области, куда будут выводиться результаты группировки.
Output options — Output Range
Параметры вывода — Выходной интервал
Настройки функции Гистограмма
Отмечаем ещё две позиции
Накопленные (кумулятивные) относительные частоты:
Cumulative Percentage
Интегральный процент
Автоматическое построение графика по результатам группировки:
Chart Output
Вывод графика
Настройка закончена. Нажимаем OK.
Рассматриваем результаты группировки данных.
Результаты группировки
Можно заметить, что ширина столбцов осталась стандартной, и длинные заголовки не умещаются в таких ячейках. Настроим ширину столбцов. Для этого наводим курсор на границу между именами столбцов, и он превращается в указатель границы ячеек (двунаправленную стрелку). Стрелочки влево и вправо намекают, что эту границу можно передвинуть.
Дважды щёлкаем левой кнопкой мыши, и программа автоматически подстраивает ширину левого из двух соседних столбцов. В результате ширина столбца меняется так, чтобы всё содержимое всех ячеек данного столбца было видно на экране и не перекрывалось ячейками справа.
Аналогично настроим ширину остальных «пострадавших» столбцов. Если слова и числа в столбце короткие, то ширина столбца может даже уменьшиться.
Столбцы разной ширины
Рассмотрим полученную таблицу. В ней всего три столбца.
Первый столбец — верхние границы интервалов группировки. В качестве заголовка столбца использован заголовок соответствующего столбца нашей вспомогательной таблицы границ интервалов
Второй столбец — абсолютные частоты, то есть число попаданий в интервал:
Frequency
Частота
Третий столбец — накопленные (кумулятивные) относительные чатоты в процентах:
Cumulative %
Интегральный %
Теперь обратим внимание на график. Здесь есть столбики, отдалённо напоминающие стандартную гистограмму. Ширину столбиков придётся дополнительно настроить.
Есть график накопленных частот, который называется КУМУЛЯТА. Про кумуляту мы подробно поговорим чуть позже, когда будем строить её вручную. Пока примем к сведению, что кумулята — это график накопленных относительных частот в процентах. Кумулята — это оценка формы функции распределения по результатам группировки данных.
Для каждого графика имеется своя вертикальная ось, потому что числа слишком уж разные. Вертикальная ось слева — для гистограммы, показывает число единиц, попавших в интервалы. Масштаб от 0 до 1200. Вертикальная ось справа — для кумуляты; здесь указан масштаб в процентах. Ломаная линия накопленных процентов идёт от 0% до 100%.
Гистограмма и кумулята
Займёмся настройкой гистограммы. Дважды щёлкнем по любому столбцу и настроим изображение, как было описано выше: ширина столбика, заливка, линии, цвета.
Настроим график кумуляты. Кроме линии, здесь присутствуют маркеры для каждой точки:. Чтобы убрать маркеры и оставить только линию, щёлкаем по ней и устанавливаем следующие настройки:
Сплошная линия на графике:
Format Data Series — Series Options — Fill & Line — Line — Solid line