В приложении Б приведены данные о выручке (нетто) от продажи товаров, продукции, работ, услуг (без НДС, акцизов и других аналогичных платежей) малых предприятий одной из отраслей экономики региона. Используя таблицу случайных чисел или их генератор, включенный в различные статистические (математические) пакеты программ обработки данных на ПЭВМ, сформируйте массив случайных чисел и произведите 30-процентную простую случайную бесповторную выборку.
По выборочным данным:
постройте интервальный ряд распределения, определив оптимальное число групп с помощью известных методов(например, формулы Стерджесса);
сформулируйте заголовки макета и представьте в табличной форме полученный ряд распределения, включающий как частоту, так и частость распределения единиц по группам;
представьте полученный ряд распределения в графической форме: в форме полигона, гистограммы и кумуляты;
исчислите средний размер выручки от продажи товаров, продукции, работ, услуг одного предприятия, а также долю малых предприятий с размером выручки более 20 млн. руб.;
с вероятностью 0,954 определите доверительные интервалы, в которых можно ожидать генеральные параметры: а) средний размер выручки от продажи товаров, продукции, работ, услуг одного предприятия; б) долю малых предприятий с размером выручки более 20 млн руб.; в) общий размер выручки от продажи товаров, продукции, работ, услуг малых предприятий региона; г) число предприятий с размером выручки более 20 млн руб.
Подтвердите достоверность полученных оценок расчетом генеральных характеристик.
Сделайте выводы.
Решение
На основе таблицы случайных чисел был сформирован массив случайных чисел и произведена 30-процентная простая случайная бесповторная выборка.
Таблица 2
Выборочные данные
Номер
предприятия Выручка от продажи товаров, продукции,
работ, услуг, млн руб.
1 22
2 7
12 20
20 10
22 31
24 19
35 17
44 13
49 12
50 22
54 32
55 35
59 4
60 18
69 5
72 18
74 24
77 6
78 20
79 27
80 13
87 7
33 3
64 10
65 8
68 12
3 5
95 7
71 25
96 27
Для построения статистического ряда распределения необходимо определить величину интервала.
Число групп приближенно определяется по формуле Стэрджесса n = 1 + 3,322log n = 1 + 3,322log(30) = 6
При заданных n = 6, xmax = 35 и xmin = 3, получим h=(35-3)/6 = 5.
Результаты группировки оформим в виде таблицы 3.
Таблица 3
Группы № совокупности Частота fi
3 − 8 23,13,15,27,18,2,22,28 8
8 − 13 25,4,24,9,26 5
13 − 18 8,21,7 3
18 − 23 14,16,6,3,19,1,10 7
23 − 28 17,29,20,30 4
28 − 33 5,11,12 3
Ниже предоставим таблицу 4 с необходимыми расчетами
Таблица 4
Интервальный ряд распределения
Группы Середина интервала, xцентр
Кол-во, fi
xi·fi
Накопленная частота, S |x-xср|·fi
(x-xср)2·fi Относительная частота, fi/f
3 - 8 5.5 8 44 8 84.8 898.88 0.267
8 - 13 10.5 5 52.5 13 28 156.8 0.167
13 - 18 15.5 3 46.5 16 1.8 1.08 0.1
18 - 23 20.5 7 143.5 23 30.8 135.52 0.233
23 - 28 25.5 4 102 27 37.6 353.44 0.133
28 - 35 31.5 3 94.5 30 46.2 711.48 0.1
Итого
30 483
229.2 2257.2 1
Полученный ряд распределения покажем в графической форме: в форме полигона, гистограммы и кумуляты.
Полигон распределения предприятий за выручкой от продажи товаров, продукции, работ, услуг
.
Гистограмма распределения предприятий за выручкой от продажи товаров, продукции, работ, услуг.
Кумулята распределения предприятий за выручкой от продажи товаров, продукции, работ, услуг.
Средний размер выручки от продажи товаров, продукции, работ, услуг одного предприятия рассчитаем:
х=x*i⋅nin=48330=16.1.
Доля малых предприятий с размером выручки более 20 млн. руб. составляет 930.
По сгруппированным данным определите модальное и медианное значение изучаемого признака расчетным и графическим методами;
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x0 – начало модального интервала;
h – величина интервала;
f2 –частота, соответствующая модальному интервалу;
f1 – предмодальная частота;
f3 – послемодальная частота.
Выбираем в качестве начала интервала 3, так как именно на этот интервал приходится наибольшее количество.Наиболее часто встречающееся значение ряда – 6.636.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
Таким образом, 50% единиц совокупности будут меньше по величине 16.333.
Определение моды графическим способом
Определение медианы графическим способом
Исчислите абсолютные и относительные показатели вариации: размах, среднее линейное отклонение, среднеквадратическое отклонение, дисперсию, коэффициенты вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.
R = xmax - xmin = 35 - 3 = 32
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 7.64
Среднее квадратическое отклонение.
Каждое значение ряда отличается от среднего значения 16.1 в среднем на 8.674
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е