В результате выборочного обследования коммерческих банков были получены следующие данные:
№ банка по порядку Число сотрудников, чел. Прибыль, млн. руб.
1 103 3
2 102 3
3 315 15
4 300 13
5 220 11
6 196 3
7 270 13
8 374 16
9 431 8
10 192 4
11 319 14
12 203 2
13 210 9
14 303 10
15 500 11
16 700 14
17 177 6
18 256 12
19 145 15
20 162 5
21 121 4
22 136 4
23 157 6
24 320 17
25 297 11
Проведите статистический анализ полученных данных. Для этой цели:
I. 1) Постройте статистический ряд распределения банков по размеру прибыли, выделив 4 группы с равными интервалами. Постройте график ряда распределения.
2) Рассчитайте характеристики ряда распределения банков по размеру прибыли: среднюю арифметическую, среднее линейное отклонение, среднее квадратическое отклонение, дисперсию, коэффициент вариации. Сделайте выводы.
II. 1) Методом аналитической группировки установите характер связи между размером банка по численности работающих и величиной полученной прибыли. Результаты оформите в таблице. Сделайте выводы.
Решение
I. 1) Построим статистический ряд распределения банков по размеру прибыли, выделив 4 группы с равными интервалами.
Определим величину интервала ряда распределения по формуле:
,
где хмах – наибольшее значение признака в исследуемой совокупности;
хmin – наименьшее значение признака в исследуемой совокупности;
число групп.
Величина интервала составит:
млн. руб., округляем до 4 млн. руб.
Определим границы каждого интервала.
Прибавляя к минимальному значению признака найденное значение интервала, получаем верхнюю границу первой группы: 2 + 4 = 6 млн. руб. Прибавляя далее величину интервала к верхней границе первой группы, получаем верхнюю границу второй группы: 6 + 4 = 10 млн. руб. и т.п.
Определяем число банков, входящих в каждую группу, используя принцип полуоткрытого интервала [ ), согласно которому банки с значениями прибыли, которые служат одновременно верхними и нижними границами смежных интервалов, будем относить ко второму из смежных интервалов.
Полученный интервальный ряд распределения представим в таблице 1.
Таблица 1
Статистический ряд распределения банков по размеру прибыли
Группы банков по размеру прибыли, млн. руб.
(варианта ) Число банков
(частота) В % к итогу (частость ) Накопленная частота
()
2 – 6 8 32,0 8
6 – 10 4 16,0 12
10 – 14 7 28,0 19
14 – 18 6 24,0 25
Итого 25 100,0 -
Изобразим ряд распределения с помощью гистограммы (рис. 1).
Гистограмма строится следующим образом: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда
. На отрезках строят прямоугольники, площади которых пропорциональны частотам интервала.
Рис. 1. Гистограмма распределения банков по размеру прибыли
2) Рассчитаем характеристики ряда распределения банков по размеру прибыли.
Среднюю величину прибыли определим по формуле средней арифметической взвешенной:
,
где индивидуальные значения осредняемого признака;
частота признака.
Для определения среднего показателя в интервальном ряду необходимо образовать дискретный ряд распределения, рассчитав середину каждого интервала.
Так, для первого интервала середина будет равна , а для второго интервала и т. д.
Составим расчетную таблицу 2.
Таблица 2
Вспомогательные расчеты
Группы банков по размеру прибыли, млн. руб. Число банков Середина интервала, млн. руб.
2 – 6 8 4 32 -5,76 46,08 265,42
6 – 10 4 8 32 -1,76 7,04 12,39
10 – 14 7 12 84 2,24 15,68 35,12
14 – 18 6 16 96 6,24 37,44 233,63
Итого 25 - 244 - 106,24 546,56
Средний размер прибыли составит:
млн. руб.
Среднее линейное отклонение определяется из отношения суммы, взятой по абсолютной величине (без учета знака) отклонения всех вариант от средней арифметической, к объему всей совокупности:
Среднее линейное отклонение составит:
млн. руб.
Дисперсия – это средняя из квадратов отклонений значений признака от его средней арифметической величины. Дисперсия определяется по формуле:
Дисперсия составит:
Среднее квадратическое отклонение определяется по формуле:
Среднее квадратическое отклонение составит:
млн. руб