Как сделать ранжированный ряд в excel? Построение вариационного ряда. Виды рядов

Понятие сводки, группировки, классификации

Сводка – систематизация и подведение итогов: метеосводка, сводка с полей. Сводка не позволяет детально проанализировать информацию. Любая сводка должна опираться на группировку данных, т.е. сначала группировка, а потом сводка данных.

Группировка – разделение совокупностей на ряд групп по наиболее существенным признакам.

Различают качественную и количественную группировку. Качественная – атрибутивная, количественная – вариационная. В свою очередь вариационная делится на структурную и аналитическую. Структурная группировка предполагает расчет удельного веса каждой группы. Пример: на предприятии 80% - рабочие, 20% - служащие, из них 5% - руководители, 3% - служащие,12% - специалисты. Цель аналитической группировки – выявить взаимосвязь между признаками: стажем работы и средним заработком, стажем и выработкой и другими.

При проведении группировки необходимо:

Проведение всестороннего анализа природы изучаемого явления;

Выявление группировочного признака (одного или нескольких);

Установить границы групп таким образом, чтобы группы существенно отличались друг от друга, и в каждой группе объединялись однородные элементы.

По степени сложности группировки могут быть простые и комбинационные (по признакам).

По исходной информации различают первичную и вторичную группировки, первичная осуществляется на основе исходных данных наблюдения, вторичная использует данные первичной группировки.

Количество групп определяется по формуле Стерджесса:

где n - количество групп, N – генеральная совокупность.

Если используются равные интервалы, то величина интервала равна .

Интервалы могут быть равные и неравные. Последние, в свою очередь, делятся на изменяющиеся по закону арифметической или геометрической прогрессии. Первый и последний интервалы могут быть открытые или закрытые. Закрытые интервалы включают или не включают границы интервала.

Если интервалы закрытые, и ничего не сказано о включении верхних границ, то считаем, что верхние границы включены.

Если интервалы открытые, то ориентируемся по последнему интервалу.

Признак в этих интервалах может измеряться дискретно и непрерывно (т.е. дробиться). При непрерывном признаке границы смыкаются 1- 10, 10 - 20, 20 – 30; если признак изменяется дискретно, то можно использовать следующую запись: 1 – 10, 11 – 20, 21 – 30.

Если интервалы открытые, то величина последнего интервала приравнивается к предыдущему, а первого - ко второму.

Классификация – группировка по качественному признаку. Она относительно устойчива, стандартизирована и утверждается органами государственной статистики.


3.2. Ряды распределения: виды и основные характеристики

Под рядом распределения понимается ряд данных, характеризующих какое-либо социально-экономическое явление по одному признаку. Это простейший вид группировки по двум признакам.

Ряды распределения делятся на качественные и количественные, на ранжированные и не ранжированные, на сгруппированные и не сгруппированные, с дискретным и непрерывным распределением признака.

Примером не сгруппированного, не ранжированного ряда по заработной плате является ведомость заработной платы. В то же время, список работников может быть ранжированный по алфавиту или по табельным номерам. Примером ранжированного ряда является список команд, рейтинг теннисистов.

Ранжированный ряд распределения - ряд данных, расположенных в порядке убывания или возрастания признака.

Для сгруппированных ранжированных рядов выделяют следующие характеристики: варианту, частоту или частость, кумуляту и плотность распределения.

Варианта () – среднее интервальное значение признака. Т.к. при создании группировки должен выполняться принцип равномерного распределения признака в каждом интервале, то варианту можно рассчитывать как полусумму границ интервалов.

Частота () показывает сколько раз встречается данное значение признака. Относительное выражение частоты представляет собой частость (.) , т.е. долю, удельный вес от суммы частот.

Кумулята () – накопленная частота или частость, расчет нарастающим итогом. Кумулятивно подсчитываются объем, затраты, доходы, т.е. результаты деятельности.

Таблица 1

Группировка действующих кредитных организаций
по величине зарегистрированного уставного капитала

в 2008 году в РФ

картофель производство ранжированный статистический

На основе показателей таблицы 2 составляем ранжированные ряды по производству картофеля на 100 га пашни; по урожайности картофеля; по себестоимости. Зависимость между этими показателями изображаем графически.

Первым этапом статистического изучения вариации являются построение вариационного ряда - упорядоченного распределения единиц совокупности по возрастающим (чаще) или убывающим (реже) значениям признака.

Существуют три формы вариационного ряда: ранжированный ряд, дискретный ряд, интервальный ряд. Вариационный ряд часто называют рядом распределения.

Ранжированный ряд - это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака

Ранжирование - это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения. Вариационный размах показывает, насколько велико различие между единицами совокупности.

Ранг - это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин. Если значение признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Данные ранги называются связными.

Графики в статистике - это способ наглядного изображения статистических показателей в виде геометрических фигур и знаков, рисунков или схематических карт. Наглядное изображение облегчает восприятие информации, позволяет охватить совокупность показателей во взаимосвязи, выявить тенденцию развития и типичные соотношения показателей.

Для изображения показателей динамики целесообразно использовать линейные графики или столбиковые диаграммы. График должен быть наглядным, понятны, легко читаемым и по возможности художественно оформленным, что привлечет к нему внимание.

При построении точечных диаграмм в качестве графических образцов применяется совокупность точек; при построении линейных - линии. Построение графика всегда творческий процесс. Здесь необходим некоторый поиск. Лишь после составления и сравнения нескольких черновых вариантов можно определить правильную композицию графика, установить масштабы и расположение знаков на поле графика.

Из ранжированного ряда по производству картофеля на 100 га пашни, можно сделать следующий вывод, что самое низкое производство наблюдается в Балаганском районе, а наибольшей производительностью картофеля со 100 га пашни отличается Ангарский район.

Наименьшая урожайность была в Качугском районе-10 ц/га, а наибольшая в Усольском - 195,5 ц/га.

В Чунском районе при высоком производстве картофеля на 100 га пашни, соответствовала наименьшая себестоимость 1 ц. Максимальная себестоимость наблюдается в Нижне-Илимском районе. Размах вариации себестоимости центнера картофеля очень велик и равен 1161,01 р.

Другие публикации

Анализ хозяйственной деятельности предприятия
Переход к рыночной экономике требует от предприятия повышения эффективности производства, конкурентоспособности продукции и услуг на основе внедрения эффективных форм хозяйствования и управления производством, достижений научно-технического прогресса, активизации п...

Анализ финансово-хозяйственной деятельности ОАО ТрансКонтейнер
Финансовый анализ представляет собой процесс, основанный на изучении данных о финансовом состоянии предприятия и результатах его деятельности в прошлом с целью оценки будущих условий и результатов деятельности. Таким образом, главной задачей финансового анализа явл...

Практическое занятие 1

ВАРИАЦИОННЫЕ РЯДЫ РАСПРЕДЕЛЕНИЯ

Вариационным рядом или рядом распределения называют упорядоченное распределение единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существует 3 вида ряда распределения:

1) ранжированный ряд – это перечень отдельных единиц совокупности в порядке возрастания изучаемого признака; если численность единиц совокупности достаточно велика ранжированный ряд становится громоздким, и в таких случаях ряд распределения строится с помощью группировки единиц совокупности по значениям изучаемого признака (если признак принимает небольшое число значений, то строится дискретный ряд, а в противном случае – интервальный ряд);

2) дискретный ряд – это таблица, состоящая из двух столбцов (строк) – конкретных значений варьирующего признака X i и числа единиц совокупности с данным значением признака f i – частот; число групп в дискретном ряду определяется числом реально существующих значений варьирующего признака;

3) интервальный ряд – это таблица, состоящая из двух столбцов (строк) – интервалов варьирующего признака X i и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).

Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами или весами вариант и обозначаются строчной буквой латинского алфавита f . Общая сумма частот вариационного ряда равна объему данной совокупности, т. е.

где k – число групп, n общее число наблюдений, или объем совокупности.

Частоты (веса) выражают не только абсолютными, но и от­носительными числами – в долях единицы или в процентах от общей численности вариант, составляющих данную совокуп­ность. В таких случаях веса называют относительными частотами или частостями. Общая сумма частностей равна единице

или
,

если частоты выражены в про­центах от общего числа наблюдений п. Замена частот частостями не обязательна, но иногда оказывается полезной и даже необхо­димой в тех случаях, когда приходится сопоставлять друг с дру­гом вариационные ряды, сильно отличающиеся по их объемам.

В зависимости от того, как варьирует признак – дискретно или непрерывно, в широком или узком диапазоне, – статистиче­ская совокупность распределяется в безынтервальный или интер­вальный вариационные ряды. В первом случае частоты относятся непосредственно к ранжированным значениям признака, которые приобретают положение отдельных групп или классов вариаци­онного ряда, во втором – подсчитывают частоты, относящиеся к отдельным промежуткам или интервалам (от – до), на которые разбивается общая вариация признака в пределах от минималь­ной до максимальной варианты данной совокупности. Эти проме­жутки, или классовые интервалы, могут быть равными и не рав­ными по ширине. Отсюда различают равно- и неравноинтервальные вариационные ряды. В неравноинтервальных рядах характер распределения час­тот меняется по мере изменения ширины классовых интервалов. Неравноинтервальную группировку в биологии применяют сравнительно редко. Как правило, биометрические данные рас­пределяются в равноинтервальные ряды, что позволяет не только выявлять закономерность варьирования, но и облегчает вычисле­ние сводных числовых характеристик вариационного ряда, сопо­ставление рядов распределения друг с другом.

Приступая к построению равноинтервального вариационного ряда, важно правильно наметить ширину классового интервала. Дело в том, что грубая группировка (когда устанавливают очень широкие классовые интервалы) искажает типичные черты варьи­рования и ведет к снижению точности числовых характеристик ряда. При выборе чрезмерно узких интервалов точность обобщающих числовых характеристик повышается, но ряд получается слишком растянутым и не дает четкой картины варьирования.

Для получения хорошо обозримого вариационного ряда и обеспечения достаточной точности вычисляемых по нему числовых характеристик следует разбить вариацию признака (в пределах от минимальной до максимальной варианты) на такое число групп или классов, которое удовлетворяло бы обоим требо­ваниям. Эту задачу решают делением размаха варьирования признака на число групп или классов, намечаемых при построе­нии вариационного ряда:

,

где h – величина интервала; X м a x и X min – максимальное и минимальное значения в совокупности; k – число групп.

При построении интервального ряда распределения необходимо выбирать оптимальное число групп (интервалов признака) и установливать длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Если приходится иметь дело с интервальным рядом распределения с неравными интервалами, то для сопоставимости нужно частоты или частости привести к единице интервала, полученное значение называется плотностью ρ , то есть
.

Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.

Чаще всего число групп в ряду распределения определяют по формуле Стерждесса:

где n – численность совокупности.

Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, – это интервалы значений варьирующего признака, а высоты столбиков – частоты, соответствующие масштабу по оси ординат. Диаграмма такого типа называется гистограммой.

Если имеется дискретный ряд распределения или используются середины интервалов, то графическое изображение такого ряда называется полигоном , которое получается соединением прямыми точек с координатами X i и f i .

Если по оси абсцисс откладывать значения классов, а по оси ординат – накопленные частоты с последующим соединени­ем точек прямыми линиями, получается график, называемый кумулятой. Накопленные частоты находят последо­вательным суммированием, или кумуляцией частот в направлении от первого класса до конца вариационного ряда.

Пример . Имеются данные о яйценоскости 50 кур-несушек за 1 год, содер­жащихся на птицеферме (табл. 1.1).

Т а б л и ц а 1.1

Яйценоскость кур-несушек

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

№ курицы-несушки

Яйценоскость, шт.

Требуется построить интервальный ряд распределения и отобразить его графически в виде гистограммы, полигона и кумуляты.

Видно, что признак варь­ирует от 212 до 245 яиц, полученных от несушки за 1 год.

В нашем примере по формуле Стерждесса определим число групп:

k = 1 + 3,322lg 50 = 6,643 ≈ 7.

Рассчитаем длину (размах) интервала по формуле:

.

Построим интервальный ряд с 7 группами и интервалом 5 шт. яиц (табл. 1.2). Для построения графиков в таблице рассчитаем середину интервалов и накопленную частоту.

Т а б л и ц а 1.2

Интервальный ряд распределения яйценоскости

Группа кур-несушек по величине яйценоскости

X i

Число кур-несушек

f i

Середина интервала

Х i ’

Накопленная частота

f i

Построим гистограмму распределения яйценоскости (рис. 1.1).

Р и с. 1.1. Гистограмма распределения яйценоскости

Данные гистограммы показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже – крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.

Полигон и кумулята распределения яйценоскости имеют вид (рис. 1.2 и 1.3).

Р и с. 1.2. Полигон распределения яйценоскости

Р и с. 1.3. Кумулята распределения яйценоскости

Технология решения задачи в табличном процессоре Microsoft Excel следующая.

1. Введите исходные данные в соответствии с рис. 1.4.

2. Ранжируйте ряд.

2.1. Выделите ячейки А2:А51.

2.2. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Сортировка по возрастанию > .

3. Определите величину интервала для построения интервального ряд распределения.

3.1. Скопируйте ячейку А2 в ячейку Е53.

3.2. Скопируйте ячейку А51 в ячейку Е54.

3.3. Рассчитайте размах вариации. Для этого введите в ячейку Е55 формулу =E54-E53 .

3.4. Рассчитайте число групп вариации. Для этого введите в ячейку Е56 формулу =1+3,322*LOG10(50) .

3.5. Введите в ячейку Е57 округленное число групп.

3.6. Рассчитайте длину интервала. Для этого введите в ячейку Е58 формулу =E55/E57 .

3.7. Введите в ячейку Е59 округленную длину интервала.

4. Постройте интервальный ряд.

4.1. Скопируйте ячейку Е53 в ячейку В64.

4.2. Введите в ячейку В65 формулу =B64+$E$59 .

4.3. Скопируйте ячейку В65 в ячейки В66:В70.

4.4. Введите в ячейку С64 формулу =B65 .

4.5. Введите в ячейку С65 формулу =C64+$E$59 .

4.6. Скопируйте ячейку С65 в ячейки С66:С70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.5).

5. Рассчитайте частоту интервалов.

5.1. Выполните команду Сервис , Анализ данных , щелкнув поочередно левой кнопкой мыши.

5.2. В диалоговом окне Анализ данных с помощью левой кнопки мыши установите: Инструменты анализа  <Гистограмма> (рис. 1.6).

5.3. Щелкните левой кнопкой мыши на кнопке <ОК>.

5.4. На вкладке Гистограмма установите параметры в соответствии с рис. 1.7.

5.5. Щелкните левой кнопкой мыши на кнопке <ОК>.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.8).

6. Заполните таблицу «Интервальный ряд распределения».

6.1. Скопируйте ячейки В74:В80 в ячейки D64:D70.

6.2. Рассчитайте сумму частот. Для этого выделите ячейки D64:D70 и щелкните левой кнопкой мыши на панели инструментов на кнопке <Автосумма > .

6.3. Рассчитайте середину интервалов. Для этого введете в ячейку Е64 формулу =(B64+C64)/2 и скопируйте в ячейки Е65:Е70.

6.4. Рассчитайте накопленные частоты. Для этого скопируйте ячейку D64 в ячейку F64. В ячейку F65 введите формулу =F64+D65 и скопируйте в ячейки F66:F70.

Результаты решения выводятся на экран дисплея в следующем виде (рис. 1.9).

7. Отредактируйте гистограмму.

7.1. Щелкните правой кнопкой мыши на диаграмме на названии «карман» и на появившейся вкладке нажмите кнопку <Очистить>.

7.2. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

7.3. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки В64:С70 (рис. 1.10).

7.5. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.11).

8. Постройте полигон распределения яйценоскости.

8.1. Щелкните левой кнопкой мыши на панели инструментов на кнопке <Мастер диаграмм > .

8.2. В диалоговом окне Мастер диаграмм (шаг 1 из 4) с помощью левой кнопки мыши установите: Стандартные  <График> (рис. 1.12).

8.3. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.4. В диалоговом окне Мастер диаграмм (шаг 2 из 4) установите параметры в соответствии с рис. 1.13.

8.5. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.6. В диалоговом окне Мастер диаграмм (шаг 3 из 4) введите названия диаграммы и ос Y (рис. 1.14).

8.7. Щелкните левой кнопкой мыши на кнопке <Далее>.

8.8. В диалоговом окне Мастер диаграмм (шаг 4 из 4) установите параметры в соответствии с рис. 1.15.

8.9. Щелкните левой кнопкой мыши на кнопке <Готово>.

Результаты выводятся на экран дисплея в следующем виде (рис. 1.16).

9. Вставьте на графике подписи данных.

9.1. Щелкните правой кнопкой мыши на диаграмме и на появившейся вкладке нажмите кнопку <Исходные данные>.

9.2. В диалоговом окне Исходные данные измените подписи оси Х. Для этого выделите ячейки Е64:Е70 (рис. 1.17).

9.3. Нажмите клавишу .

Результаты выводятся на экран дисплея в следующем виде (рис. 1.18).

Кумулята распределения строится аналогично полигону распределения на основе накопленных частот.

Первым этапом статистического изучения вариации являются построение вариационного ряда - упорядоченного распределения единиц совокупности по возрастающим (чаще) или по убывающим (реже) значениям признака и подсчет числа единиц с тем или иным значением признака.

Существуют три формы вариационного ряда: ранжированный, дискретный, интервальный. Вариационный ряд часто называют рядом распределения. Этот термин употребляется при изучении вариации как количественных, так и неколичественных признаков. Ряд распределения представляет собой структурную группировку (гл. 6).

Ранжированный ряд - это перечень отдельных единиц совокупности в порядке возрастания (убывания) изучаемого признака.

Ниже приведены сведения о крупных банках Санкт-Петербурга, ранжированных по размерам собственного капитала на 01.10.1999 г.

Название банка Собственный капитал, млн руб.

Балтонэксим банк 169

Банк «Санкт-Петербург» 237

Петровский 268

Балтийский 290

Промстройбанк 1007

Если численность единиц совокупности достаточно велика, ранжированный ряд становится громоздким, а его построение, даже с помощью компьютера, занимает длительное время. В таких случаях вариационный ряд строится с помощью группировки единиц совокупности по значениям изучаемого признака.

Определение числа групп

Число групп в дискретном вариационном ряду определяется числом реально существующих значений варьирующего признака. Если признак принимает дискретные значения, но их число очень велико (например, поголовье скота на 1 января года в разных сельскохозяйственных предприятиях может составить от нуля до десятков тысяч голов), то строится интервальный вариационный ряд. Интервальный вариационный ряд строится и для изучения признаков, которые могут принимать любые, как целые, так и дробные значения в области своего существования. Таковы, например, рентабельность реализованной продукции, себестоимость единицы продукции, доход на одного жителя города, доля лиц с высшим образованием среди населения разных территорий и вообще все вторичные признаки, значения которых рассчитываются путем деления величины одного первичного признака на величину другого (см. гл. 3).

Интервальный вариационный ряд представляет собой таблицу, состоящую из двух граф (или строк) - интервалов признака, вариация которого изучается, и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа от общей численности совокупности (частостей).

Наиболее часто используются два вида интервальных вариационных рядов: равноинтервальный и равночастотный. Равноинтервальный ряд применяется, если вариация признака не очень сильна, т.е. для однородной совокупности, распределение которой по данному признаку близко к нормальному закону. (Такой ряд представлен в табл. 5.6.) Равночастотный ряд применяется, если вариация признака очень сильна, однако распределение не является нормальным, а, например, гиперболическим (табл. 5.5).

При построении равноинтервального ряда число групп выбирается так, чтобы в достаточной мере отразились разнообразие значений признака в совокупности и в то же время закономерность распределения, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.


Границы интервалов могут указываться разным образом: верхняя граница предыдущего интервала повторяет нижнюю границу следующего, как показано в табл. 5.5, или не повторяет.

В последнем случае второй интервал будет обозначен как 15,1-20, третий - как 20,1-25 и т.д., т.е. предполагается, что все значения урожайности обязательно округлены до одной десятой. Кроме того, возникает нежелательное осложнение с серединой интервала 15,1-20, которая, строго говоря, уже будет равна не 17,5, а 17,55; соответственно при замене округленного интервала 40-60 на 40,1-60 вместо округленного значения его середины 50 получим 50,5. Поэтому предпочтительнее оставить интервалы с повторяющейся округленной границей и договориться, что единицы совокупности, имеющие значение признака, равное границе интервала, включаются в тот интервал, где это точное значение впервые указывается. Так, хозяйство, имеющее урожайность, равную 15 ц/га, включается в первую группу, значение 20 ц/га - во вторую и т.д.

Равночастотный вариационный ряд необходим при очень сильной вариации признака потому, что при равноинтерваль-ном распределении большая часть единиц совокупности ока-

Таблица 5.5

Распределение 100 банков России по балансовой оценке активов на 01.01.2000 г.

Границы интервалов при равночастотном распределении - это фактические величины активов первого, десятого, одиннадцатого, двадцатого и так далее банков.

Графическое изображение вариационного ряда

Существенную помощь в анализе вариационного ряда и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные на оси абсцисс, - это интервалы значений варьирующего признака, а высота столбиков - частоты, соответствующие масштабу по оси ординат. Графическое изображение распределения хозяйств области по урожайности зерновых культур приведено на рис. 5.1. Диаграмма этого рода часто называется гистограммой (гр. histos - ткань).

Данные табл. 5.6 и рис. 5.1 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже - крайние, малые и большие значения признака. Форма этого распределения близка к рассматриваемому в курсе математической статистики закону нормального распределения. Великий русский математик А. М. Ляпунов (1857-1918) доказал, что нор-

Таблица 5.6 Распределение хозяйств области по урожайности зерновых культур

мальное распределение образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего влияния. Случайное сочетание множества примерно равных факторов, влияющих на вариации урожайности зерновых культур, как природных, так и агротехнических, экономических, создает близкое к нормальному закону распределения распределение хозяйств области по урожайности.

Рис. 5.2. Кумулята и огива распределения хозяйств по урожайности

Такой ряд называется кумулятивным. Можно построить кумулятивное распределение «не меньше, чем», а можно «больше, чем». В первом случае график кумулятивного распределения называется кумулятой, во втором - огивой (рис. 5.2).

Плотность распределения

Если приходится иметь дело с вариационным рядом с неравными интервалами, то для сопоставимости нужно частоты, или частости, привести к единице интервала. Полученное отношение называется плотностью распределения:

Плотность распределения используется как для расчета обобщающих показателей, так и для графического изображения вариационных рядов с неравными интервалами.

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации