Расчет средней арифметической по способу моментов. Метод упрощения вычисления средней арифметической называется методом условных моментов или методом отчета от условного нуля

4. Четные и нечетные.

В чётных вариационных рядах сумма частот или общее число наблюдений выражено чётным числом, в нечётных ― нечётным.

5. Симметричные и асимметричные.

В симметричном вариационном ряду все виды средних величин совпадают или очень близки (мода, медиана, среднее арифметическое).

В зависимости от характера изучаемых явлений, от конкретных задач и целей статистического исследования, а также от содержания исходного материала, в санитарной статистике применяются следующие виды средних величин:

· структурные средние (мода, медиана);

· средняя арифметическая;

· средняя гармоническая;

· средняя геометрическая;

· средняя прогрессивная.

Мода (М о) - величина варьирующего признака, которая более часто встречается в изучаемой совокупности т.е. варианта, соответствующая наибольшей частоте. Находят ее непосредственно по структуре вариационного ряда, не прибегая к каким-либо вычислениям. Она обычно является величиной очень близкой к средней арифметической и весьма удобна в практической деятельности.

Медиана (М е) - делящая вариационный ряд (ранжированный, т.е. значения вариант располагаются в порядке возрастания или убывания) на две равные половины. Медиана вычисляется при помощи так называемого нечетного ряда, который получают путем последовательного суммирования частот. Если сумма частот соответствует четному числу, тогда за медиану условно принимают среднюю арифметическую из двух средних значений.

Мода и медиана применяются в случае незамкнутой совокупности, т.е. когда наибольшая или наименьшая варианты не имеют точной количественной характеристики (например, до 15 лет, 50 и старше и т.п.). В этом случае среднюю арифметическую (параметрические характеристики) рассчитать нельзя.

Средня я арифметическая - самая распространенная величина. Средняя арифметическая обозначается чаще через М .

Различают среднюю арифметическую простую и взвешенную.

Средняя арифметическая простая вычисляется:

― в тех случаях, когда совокупность представлена простым перечнем знаний признака у каждой единицы;

― если число повторений каждой варианты нет возможности определить;

― если числа повторений каждой варианты близки между собой.

Средняя арифметическая простая исчисляется по формуле:

где V - индивидуальные значения признака; n - число индивидуальных значений; - знак суммирования.

Таким образом, простая средняя представляет собой отношение суммы вариант к числу наблюдений.

Пример: определить среднюю длительность пребывания на койке 10 больных пневмонией:

16 дней - 1 больной; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

койко-дня.

Средняя арифметическая взвешенная исчисляется в тех случаях, когда индивидуальные значения признака повторяются. Ее можно вычислять двояким способом:

1. Непосредственным (среднеарифметическим или прямым способом) по формуле:

где P - частота (число случаев) наблюдений каждой варианты.

Таким образом, средняя арифметическая взвешенная представляет собой отношение суммы произведений вариант на частоты к числу наблюдений.

2. С помощью вычисления отклонений от условной средней (по способу моментов).

Основой для вычисления взвешенной средней арифметической является:

― сгруппированный материал по вариантам количественного признака;

― все варианты должны располагаться в порядке возрастания или убывания величины признака (ранжированный ряд).

Для вычисления по способу моментов обязательным условием является одинаковый размер всех интервалов.

По способу моментов средняя арифметическая вычисляется по формуле:

,

где М о - условная средняя, за которую чаще принимают величину признака, соответствующую наибольшей частоте, т.е. которая чаще повторяется (Мода).

i - величина интервала.

a - условное отклонение от условий средней, представляющее собой последовательный ряд чисел (1, 2 и т.д.) со знаком + для вариант больших условной средней и со знаком–(–1, –2 и т.д.) для вариант, которые ниже условной средней. Условное же отклонение от варианты, принятой за условную среднюю равно 0.

P - частоты.

Общее число наблюдений или n.

Пример: определить средний рост мальчиков 8 лет непосредственным способом (таблица1).

Т а б л и ц а 1

Рост в см

мальчиков P

Центральная

варианта V

Центральная варианта ― середина интервала ― определяется как полу сумма начальных значений двух соседних групп:

; и т.д.

Произведение VP получают путем умножения центральных вариант на частоты ; и т.д. Затем полученные произведения складывают и получают , которую делят на число наблюдений (100) и получают среднюю арифметическую взвешенную.

см.

Эту же задачу решим по способу моментов, для чего составляется следующая таблица 2:

Т а б л и ц а 2

Рост в см (V)

мальчиков P

В качестве М о принимаем 122, т.к. из 100 наблюдений у 33 человек рост был 122см. Находим условные отклонения (a) от условной средней в соответствии с вышесказанным. Затем получаем произведение условных отклонений на частоты (aP) и суммируем полученные величины (). В итоге получится 17. Наконец, данные подставляем в формулу.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной: при

Свойство 2. Алгебраическая сумма отклонений индивидуальных значений признака от средней арифметической равна нулю: для несгруппированных данных и для рядов распределения.

Это свойство означает, что сумма положительных отклонений равна сумме отрицательных отклонений, т.е. все отклонения, обусловленные случайными причинами взаимно погашаются.

Свойство 3. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное: для несгруппировочных данных и для рядов распределения. Это свойство означает, что сумма квадратов отклонений индивидуальных значений признака от средней арифметической всегда меньше суммы отклонений вариантов признака от любого другого значения, даже мало отличающегося от средней.

Второе и третье свойство средней арифметической применяются для проверки правильности расчета средней величины; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Все три первых свойства выражают сущностные черты средней как статистической категории.

Следующие свойства средней рассматриваются как вычислительные, поскольку они имеют некоторое прикладное значение.

Свойство 4. Если все веса (частоты) разделить на какое-либо постоянное число d, то средняя арифметическая не изменится, поскольку это сокращение в равной степени коснется и числителя и знаменателя формулы расчета средней.

Из этого свойства вытекают два важных следствия.

Следствие 1. Если все веса равны между собой, то вычисление средней арифметической взвешенной можно заменить вычислением средней арифметической простой.

Следствие 2 . Абсолютные значения частот (весов) можно заменять их удельными весами.

Свойство 5. Если все варианты разделить или умножить на какое-либо постоянное число d, то средняя арифметическая уменьшиться или увеличиться в d раз.



Свойство 6. Если все варианты уменьшить или увеличить на постоянной число A, то и со средней произойдут аналогичные изменения.

Прикладные свойства средней арифметической можно проиллюстрировать, применив способ расчета средней от условного начала (способ моментов).

Средняя арифметическая способом моментов вычисляется по формуле:

где А – середина какого-либо интервала (предпочтение отдается центральному);

d – величина равновеликого интервала, или наибольший кратный делитель интервалов;

m 1 – момент первого порядка.

Момент первого порядка определяется следующим образом:

.

Технику применения этого способа расчета проиллюстрируем по данным предшествующего примера.

Таблица 5.6

Стаж работы, лет Число рабочих Середина интервала x
до 5 2,5 -10 -2 -28
5-10 7,5 -5 -1 -22
10-15 12,5
15-20 17,5 +5 +1 +25
20 и выше 22,5 +10 +2 +22
Итого Х Х Х -3

Как видно из расчетов, приведенных в табл. 5.6 из всех вариантов вычитается одно из их значений 12,5, которое приравнивается нулю и служит условным началом отсчета. В результате деления разностей на величину интервала – 5 получают новые варианты.

Согласно итогу табл. 5.6 имеем: .

Результат вычислений по способу моментов аналогичен результату, который был получен применением основного способа расчета по средней арифметической взвешенной.

Структурные средние

В отличие от степенных средних, которые рассчитываются на основе использования всех вариант значений признака, структурные средние выступают как конкретные величины, совпадающие с вполне определенными вариантами ряда распределения. Мода и медиана характеризуют величину варианта, занимающего определенное положение в ранжированном вариационном ряду.

Мода – это величина признака, которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

Нахождение моды в дискретном ряду распределения не требует вычислений. Путем просмотра столбца частот находят наибольшую частоту.

Например, распределение рабочих предприятия по квалификации характеризуются данными табл. 5.7.

Таблица 5.7

Наибольшая частота в этом ряду распределения 80, значит мода равна четвертому разряду. Следовательно, наиболее часто встречаются рабочие, имеющие четвертый разряд.

Если ряд распределения интервальный , то по наибольшей частоте устанавливают только модальный интервал, а затем уже вычисляют моду по формуле:

,

где – нижняя граница модального интервала;

– величина модального интервала;

– частота модального интервала;

– частота предмодального интервала;

– частота послемодального интервала.

Вычислим моду по данным, приведенным в табл. 5.8.

Таблица 5.8

Это значит, что чаще всего предприятия имеют прибыль 726 млн р.

Практическое применение моды ограниченно. На значение моды ориентируются, когда определяют наиболее ходовые размеры обуви и одежды при планировании их производства и реализации, при изучении цен на оптовых и розничных рынках (метод основного массива). Моду используют вместо средней величины при подсчете возможных резервов производства.

Медиана соответствует варианте, стоящей в центре ранжированного ряда распределения. Это значение признака, которое делит всю совокупность на две равные части.

Положение медианы определяется ее номером (N).

где – число единиц совокупности. Используем данные примера, приведенные в табл. 5.7 для определения медианы.

, т.е. медиана равна средней арифметической из 100-го и 110-го значений признака. По накопленным частотам определяем, что 100-я и 110-я единицы ряда имеют величину признака, равную четвертому разряду, т.е. медиана равна четвертому разряду.

Медиана в интервальном ряду распределения определяется в следующем порядке.

1. Подсчитываются накопленные частоты по данному ранжированному ряду распределения.

2. На основе накопленных частот устанавливается медианный интервал. Он находится там, где первая накопленная частота равна или больше половины совокупности (всех частот).

3. Вычисляется медиана по формуле:

,

где – нижняя граница медианного интервала;

– величина интервала;

– сумма всех частот;

– сумма накопленных частот, предшествующих медианному интервалу;

– частота медианного интервала.

Вычислим медиану по данным табл. 5.8.

Первая накопленная частота, которая равна половине совокупности 30, значит медиана находится в интервале 500-700.

Это означает, что половина предприятий получает прибыль до 676 млн р., а другая половина свыше 676 млн р.

Медиану часто используют вместо средней величины, когда совокупность неоднородна, т.к. она не находится под влиянием крайних значений признака. Практическое применение медианы также связано с ее свойством минимальности. Абсолютная сумма отклонений индивидуальных значений от медианы есть величина наименьшая. Поэтому медиану применяют в расчетах при проектировании места расположения объектов, которые будут использоваться различными организациями и лицами.

Средняя арифметическая обладает некоторыми свойствами, которые определяют ее широкое применение в экономических расчетах и в практике статистического исследования.

Свойство 1. Средняя арифметическая постоянной величины равна этой постоянной:

Свойство 2 (нулевое). Алгебраическая сумма линейных отклонений (разностей) индивидуальных значений признака от средней арифметической равна нулю:

для первичного ряда и для сгруппированных данных (d i - линейные (индивидуальные) отклонения от средней, т.е. x i - ).

Это свойство можно сформулировать следующим образом: сумма положительных отклонений от средней равна сумме отрицательных отклонений.

Логически оно означает, что все отклонения от средней в ту и в другую сторону, обусловленные случайными причинами, взаимно погашаются.

Свойство 3 (минимальное). Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное:

что означает: сумма квадратов отклонений индивидуальных значений признака каждой единицы совокупности от средней арифметической всегда меньше суммы квадратов отклонений вариантов признака от любого значения (А), сколь угодно мало отличающегося от средней у выбранной единицы исследуемой совокупности.

Для сгруппированных данных имеем:

Минимальное и нулевое свойства средней арифметической применяются для проверки правильности расчета среднего уровня признака; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Рассмотренные свойства выражают сущностные черты средней арифметической. Существуют также расчетные (вычислительные) свойства средней арифметической, имеющие прикладное значение:

  • если значения признака каждой единицы совокупности (все усредняемые варианты) уменьшить или увеличить на одну и ту же величину А, то и со средней арифметической произойдут аналогичные изменения;
  • если значения признака каждой единицы совокупности разделить или умножить на какое-либо постоянное число А, то средняя арифметическая уменьшится или увеличится в А раз;
  • если вес (частоту) каждого значения признака разделить на какое-либо постоянное число А, то средняя арифметическая не изменится.

В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность в связи с использованием ЭВМ при расчете обобщающих статистических показателей.



18.Упрощенный способ расчета средней арифметической .

Способ моментов

Часто мы сталкиваемся с расчетом средней арифметической упрощенным способом. В этом случае используются свойства средней величины. Метод упрощенного расчета называется способом моментов, либо способом отсчета от условного нуля.

Способ моментов предполагает следующие действия :

1) Если возможно, то уменьшаются веса.

2) Выбирается начало отсчета – условный нуль. Обычно выбирается с таким расчетом, чтобы выбранное значение признака было как можно ближе к середине распределения. Если распределение по своей форме близко к нормальному, но за начало отсчета выбирают признак, обладающий наибольшим весом.

3) Находятся отклонения вариантов от условного нуля.

4) Если эти отклонения содержат общий множитель, то рассчитанные отклонения делятся на этот множитель.

5) Находится среднее значение признака по следующей формуле

Пример :


до 70 -30 -3 -45
70-80 -20 -2 -34
80-90 -10 -1 -13
90-100
100-110
110-120
120-130
130-140
140 и более
Сумма -12

▲ 19 Мода и медиана и их использование в статистике.

Модой распределения называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие. Мода - значение варьирующего признака, имеющего наибольшую частоту. Мода в интервальном ряду распределения с равными интервалами.
Mo=xMo+iMo*(fMo-f(Mo-1))/((fMo-f(Mo-1))+(fMo-f(Mo-1)) Мода в интервальном ряду с неравными интервалами.
100-120 10 0,5
120-140 30 1,5 <- Mo (мода)
140-180 40 1
180-220 20 0,5
Всего: 100
Для упорядоченного дискретного ряда распределения мода, являющаяся характеристикой вариационного ряда, определяется по частотам вариантов и соответствует варианту с наибольшей частотой.
Медиана – значение варьирующегося признака у той единицы совокупности, которая находится в середине рентированного ряда.
Медиана в дискретном ряду: 23 28 30 35 37 (30 медиана)
Медиана в интервальном ряду распределения: Me = xMe+iMe*(суммаf/2-fиск)/fиск
В дискретном ряду распределения мода определяется визуально. Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины. Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Вычисление квартилей аналогично вычислению медианы. Децили – это значение вариант, которые делят ранжированный ряд на десять равных частей: 1-й дециль делит совокупность в соотношении 1/10 к 9/10, 2-й дециль – в соотношении 2/10 к 8/10 и т. д. вычисляются децили по той же схеме, что и медиана, и квартили.

▲ 20 Причины, порождающие вариацию признаков, изучаемых статистикой. Необходимость изучения вариации.

18 Причины, порождающие вариацию признаков, изучаемых статистикой. Необходимость изучения вариации.
При изучении явлений и процессов общественной жизни статистика встречается с разнообразной вариацией (изменчивостью) признаков, характеризующих отдельные единицы совокупности. Величины признаков изменяются под действием различных факторов. Очевидно, что чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация. Например, размер заработной платы рабочих зависит от нескольких факторов: специальности, разряда, стажа работы, образования, состояния здоровья и т.д. Чем больше различия между значениями факторов, тем больше вариация в уровне заработной платы.
При характеристике колеблемости признака используют систему абсолютных и относительных показателей.
При изучении явлений и процессов общественной жизни статистика встречается с разнообразной вариацией (изменчивостью) признаков, характеризующих отдельные единицы совокупности.
Вариация - это различие в значениях, какого - либо признака у разных единиц данной совокупности в один и тот же момент времени. Величины признаков изменяются под действием различных факторов. И, следовательно, чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация. Исследование вариации в статистике имеет большое значение, т. к. помогает изучить сущность явления. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (продолжительность жизни, доходы и расходы населения и т. д.) для принятия научно-обоснованных управленческих решений.

▲ 21 Показатели вариации абсолютные и относительные, общие, внутригрупповые и межгрупповые, их смысл и значение. Правило сложения дисперсий.

(122.51 КБ) Скачиваний: 0

▲ 22 Среднелинейное отклонение, средний квадрат отклонения (дисперсия), средвнеквадратическое отклонение, коэффициент вариаций.

23. Математические свойства дисперсии. Упрощенные способы расчета дисперсии

Дисперсия представляет собой средний квадрат отклонений индивидуальных значений признака от их средней величины и вычисляется по формулам простой и взвешенной дисперсий (в зависимости от исходных данных):

среднее квадратическое отклонение (σ):

(простое среднеквадратическое отклонение),

(взвешенное среднеквадратическое отклонение).

Среднее квадратическое отклонение – это обобщающая характеристика размеров вариации признака в совокупности. Оно выражается в тех же единицах, что и признак.

Расчет дисперсии может быть упрощен. В случае равных интервалов в вариационном ряду распределения используется способ отсчета от условного нуля (способ моментов). Для его понимания необходимо знать следующие свойства дисперсии :
Свойство 1 . Дисперсия постоянной величины равна нулю.
Свойство 2 . Уменьшение всех значений признака на одну и ту же величину A не меняет величины дисперсии . Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-либо постоянного числа.
Свойство 3 . Уменьшение всех значений признака в K раз уменьшает дисперсию в K 2 раз, а среднее квадратическое отклонение в K раз . Значит, все значения признака можно разделить на какое-то постоянное число, например, на величину интервала ряда, исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число: .
Свойство 4 . Если вычислить средний квадрат отклонений от любой величины A, в той или иной степени отличающейся от средней арифметической (), то он всегда будет больше среднего квадрата отклонений, вычисленного от средней арифметической . Средний квадрат отклонений при этом будет больше на величину (– A) 2:
.
Значит, дисперсия от средней величины всегда меньше дисперсий, вычисленных от любых других величин, т.е. она имеет свойство минимальности.
На этих математических свойствах дисперсии основываются способы, которые позволяют упростить ее вычисление. Например, расчет дисперсии по способу моментов или способу отсчета от условного нуля применяется в вариационных рядах с равными интервалами. Расчет производится по формуле:

,
где K – ширина интервала;
A – условный нуль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
– момент второго порядка.
Между средним линейным и средним квадратическим отклонениями существует примерное соотношение если фактическое распределение близко к нормальному.
В условиях нормального распределения существует следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений:
1) в пределах ± 1σ располагается 68,3 % количества наблюдений;
2) в пределах ± 2σ – 95,4 %;
3) в пределах ± 3σ – 99,7 %;
В действительности, на практике почти не встречаются отклонения, которые превышают ±3σ. Отклонение 3σ может считаться максимально возможным. Это положение называют «правилом трех сигм».

▲ 24 Дисперсия альтернативного признака.

21 Дисперсия альтернативного признака.
Альтернативный признак – это признак, характеризующий обладание или не обладание чем-то (см.п.1.2.).
В статистике при изучении вариации альтернативных признаков наличия изучаемого признака обозначаются «1», а его отсутствие – «0».
Доля единиц совокупности, обладающих изучаемым признаком – «p” , а не обладающих им “q”, следовательно, p + q = 1
Дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Корень квадратный из этого показателя соответствует среднему квадратическому отклонению альтернативного признака.
Показатели вариации альтернативных признаков широко используются в статистике, в частности при проектировании выборочного наблюдения, обработке данных социологических обследований, статистическом контроле качества продукции, в ряде других случаев.

▲ 25 Выборочное наблюдение, значение и условия применения.

22 Выборочное наблюдение, значение и условия применения.
статистическое наблюдение, при котором исследованию подвергают не все элементы изучаемой совокупности (называемой при этом «генеральной»), а только некоторую, определённым образом отобранную их часть. Отобранная часть элементов совокупности (выборка) будет представлять всю совокупность с приемлемой точностью при двух условиях: она должна быть достаточно многочисленной, чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности; элементы выборки должны быть отобраны объективно, независимо от воли исследователя, так чтобы каждый из них имел одинаковые шансы быть отобранным или же чтобы шансы эти были известны исследователю. Эти условия устанавливаются математической теорией выборочного метода. Она основана на ряде важнейших теорем теории вероятностей, составляющих так называемый закон больших чисел (см. Больших чисел закон). Лишь при соблюдении этих условий возникает объективная возможность оценить точность Выборочное наблюдение на основании самих выборочных данных. Точность Выборочное наблюдение измеряется с помощью средней ошибки выборки, величина которой прямо пропорциональна степени вариации изучаемых признаков и обратно пропорциональна объёму выборки. Выборочное наблюдение можно произвести быстрее сплошного, с меньшими затратами и получить результаты, по точности мало уступающие результатам сплошного наблюдения, а с учётом же возможности более тщательного наблюдения - даже нередко превосходящие их.

▲ 26 Ошибки выборочного наблюдения.

23 Ошибки выборочного наблюдения.
Между признаками выборочной совокупности и признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой статистического наблюдения. При массовом наблюдении ошибки неизбежны, но возникают они в результате действия различных причин. Величина возможной ошибки выборочного признака слагается из ошибок регистрации и ошибок репрезентативности. Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п.
Под ошибкой репрезентативности (представительства) понимают расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности. Ошибки репрезентативности бывают случайными и систематическими.
Систематические ошибки связаны с нарушением установленных правил отбора. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности
. В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки. Особенность ошибки смещения состоит в том, что, представляя собой постоянную часть ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается. Кроме того, величину случайной ошибки можно определить, тогда, как размер ошибки смещения непосредственно практически определить очень сложно, а иногда и невозможно. Поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.

▲ 27 Методы определения ошибки выборки для средней и для частости, при различных способах и методах отбора.

24 Методы определения ошибки выборки для средней и для частости, при различных способах и методах отбора.
-Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.
Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.

▲ 28 Определение численности выборки.

25 Определение численности выборки.
Определение необходимого объема выборки – это важная задача, с которой сталкивается исследователь, организующий выборочное наблюдение.
При этом ему, как правило, известно: какие характеристики генеральной совокупности он хотел бы оценить, какую величину ошибки он считал бы несущественной, какой метод выбора данных он использует. Известно также расположение генеральной совокупности и часто (но не всегда) количество элементов в ней.
Расчет численности выборки основывается на статистическом подходе обработки данных и за ним стоит множество вычислений, но для простоты, ниже мы представим формулу, следуя которой можно достичь хороших результатов.

Вариационные ряды распределения состоят их двух элементов вариантов и частот.

Вариантами называются числовые значения колличественного признака в ряду распределения, они могут быть положительными и отрицательными, абсолютными и относительными. Частоты – это численности отдельных вариантов или каждой группы вариационного ряда. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.

Ряды распр-я могут быть образованы по качественному(атрибутивному) и колич-му пр-ку. В первом случае они наз. атрибутивными,а во втором- вариационными.

Вариационные ряды распр-ия по сп-бу постр-ия бывают дискретные и интервальные:

Дискр. вариац. ряд распр-я - группы сост-ны по признаку, изменяющемуся дискретно и приним-му только целые значения. Интервальный вариац. ряд распр-ия - группировачный признак, сост-ий групп-ки, может принимать в опред-ом интервале любые знач-ия. Число ед-ц частоты, приходящиеся на ед-цу инт-ла наз. плотностью распред-я . Ряд накопл-ых частот (кумулятивный)-показ-т число случаев ниже или выше опред-го уровня. Графич изображения ряда распред.: линейные, плоскостные диаграммы, гистограммы, куммулятивная кривая (изображ-ет ряд накопл-х частот)

9. Средняя арифметическая взвешенная.

При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной, которая имеет вид: X средн = (EXi*fi)/ Efi

При расчете средней по интервальному вариационному ряду для выполнения необходимых вычислений от интервалов переходят к их серединам.

Расчет средней по способу моментов. Основан на свойствах средней арифметической. В качестве условного ноля – X0 выбирают середину одного из центральных интервалов, обладающего наибольшей частотой.Этот способ используется только в рядах с равными интервалами.

10. Средняя гармоническая простая и взвеш.

Средняя гармоническая. Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1. Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:

К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:

В статист практике чаще исп гармонич взвеш , формула кот имеет вид:

Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.

Например, при расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам не известно количество реализованных единиц (речь идет о разных товарах), но известны суммы реализаций этих различных товаров. Допустим, необходимо узнать среднюю цену реализованных товаров: Вид товара Цена за единицу, руб.Сумма реализаций, руб.

Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

11. Упрощенный расчет средней арифм. (ср. ар.) (способ моментов).

Пользуясь св-ми ср. ар., ее можно рассчитать след. образом: 1) вычесть из всех вариант постоянное число (лучше значение серединной варианты); 2) разделить варианты на постоянное число – на величину интервала; 3) частоты выразить в %. Вычисление ср. ар. первыми двумя способами называется способом отсчета от условного начала (способом моментов). Этот способ применяется в рядах с разными интервалами. Ср. ар. в этом случае опред. по ф-ле:

Где m – момент первого порядка; х 0 – начало отсчета; К – величина интервала.

12. Мода и медиана.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода, или так называемые структурные средние. Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Для ранжированного ряда с нечетным числом индивидуальных величин (например, 1, 2, 3, 3, 6, 7, 9, 9, 10) медианой будет величина, которая расположена в центре ряда, т.е. пятая величина. Для ранжированного ряда с четным числом индивидуальных величин (например, 1, 5, 7, 10, 11, 14) медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин. Для нашего случая медиана равна (7+10) : 2= 8,5. То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле Nme=(n+1)/2, где n - число единиц в совокупности. Численное значение медианы определяют по накопленным частотам в дискретном вариационном ряду. Для этого сначала следует указать интервал нахождения медианы в интервальном ряду распределения. Медианным называют первый интервал, где сумма накопленных частот превышает половину наблюдений от общего числа всех наблюдений. Численное значение медианы обычно определяют по формуле----- где xМе - нижняя граница медианного интервала; i - величина интервала; S-1 - накопленная частота интервала, которая предшествует медианному; f - частота медианного интервала.

Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой. Чтобы найти конкретное значение моды, необходимо использовать формулу

где xМо - нижняя граница модального интервала; iМо - величина модального интервала; fМо - частота модального интервала; fМо-1 - частота интервала, предшествующего модальному; fМо+1 - частота интервала, следующего за модальным.

Мода имеет широкое распространение в маркетинговой деятельности при изучении покупательского спроса, особенно при определении пользующихся наибольшим спросом размеров одежды и обуви, при регулировании ценовой политики.

13. Свойства средней ариф. (ср. ар.)

1.Если из всех вариантов ряда (-) или ко всем вариантам (+) постоянное число, то ср. ар. соответственно уменьшится или увеличится на это число.
.2.Если все варианты ряда умножить или разделить на постоянное число, то ср. ар. соответственно увеличится или уменьшится в это число раз.
3.Если все частоты увеличить или уменьшить в постоянное число раз, то средняя от этого не изменится.
.

4.Сумма отклонений всех вариантов ряда от ср. ар. = 0. (Нулевое свойство средней). . 5.Σf i =Σfix i . Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты.

6.Сумма квадратов отклонений всех вариантов ряда от ср. ар.

Данное св-во положено в основу метода наименьших квадратов, кот. широко применяется в исследовании стат. взаимосвязей.

14. Виды дисперсий. Правило их сложения .

Различают три вида дисперсий: общая; средняя внутригрупповая; межгрупповая. Общая дисперсия ( 2 о ) характеризует вариацию признака всей совокупности под влиянием всех тех факторов, которые обусловили данную вариацию. Эта величина определяется по формуле  2 о =  (X – Xо средн) 2 *f / f, где Xо средн - общая средняя арифметическая всей исследуемой совокупности. Средняя внутригрупп дисперс ( 2 средн ) свидетельствует о случайной вариации, которая может возникнуть под влиянием каких-либо неучтенных факторов и которая не зависит от признака-фактора, положенного в основу группировки. Данная дисперсия рассчитывается следующим образом: сначала рассчитываются дисперсии по отдельным группам ( 2 i ), затем рассчитывается средняя внутригрупповая дисперсия ( 2 i cредн): где ni - число единиц в группе. Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле

где - средняя величина по отдельной группе. Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:

Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.

15 . Виды средних. Их исчисление .

16. Показатели вариации, применяемые в статистике.

Вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления. Для измерения вариации в статистике применяют несколько способов. Наиболее простым явл расчет показателя размаха вариации Н как разницы между Xmax и Xmin: H=Xmax - Xmin. Но размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается. Среднее линейное отклонение d - среднее арифметическое значение абсолютных отклонений признака от его среднего уровня: d =  (Xi – X средн) / n. При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной. В статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии: δ =  (Xi – X средн) 2 / n. Показатель s, равный √δ 2 , называется средним квадратическим отклонением. Величина Mx = √(δ 2 /n)-средняя ошибка выборки и явля хар-кой отклонения выборочного среднего значения призн от его истинной средней величины. Показатель средней ошибки использ при оценке достоверности результатов выборочн наблюд. Коэфф осцилляции отражает относит колеблемость крайних значений признака вокруг средней: Ko = (R/X средн)*100%. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины Kd = (d средн/ X средн)*100%. Коэффициент вариации: V = (δ/X средн)*100%

17. Простейшие приёмы обработки рядов динамики.

Простейшими видами обработки рядов динамики являются: укрупнение интервалов, метод скользящей средней, аналитическое выравнивание, экстраполяция и интерполяция.

Укрупнение интервалов. Ряд динамики разделяют на достаточно большое число равных интервалов. Если средн уровни по интервалам не позволяют увидеть тенденцию разв, переходят к расчету уровней за большие промежутки времени, увеличивая длину каждого интервала (уменьшая количество интервалов). Скользящая средняя. В этом методе исходные уровни ряда заменяются средними величинами, которые получают из данного уровня и нескольких симметрично его окружающих. Целое число уровней, по которым рассчитывается среднее значение, называют интервалом сглаживания. Для того чтобы создать модель, выражающую основную тенденцию изменения уровней динамического ряда во вре­мени, используется аналитическое выравнивание ряда динамики. Простейшими моделями, выражаю­щими тенденцию развития, являются: линейная функция прямой, показательная функция, парабола, парабола n-порядка, гипербола, экспонента. Иногда возникает необходимость предвидеть будущий уровень ряда динамики. В таких случаях прибегают к приему обработки рядов динамики, называемому экстраполяцией : y n +1 = y n + ∆y n +∆∆y n , где y n +1 - неизвестный уровень ряда, y n - последний известный уровень ряда, ∆y n - цепной абсолютный прирост последнего уровня ряда (∆y n = y n - y n -1), ∆∆y n - изменение прироста последнего уровня ряда. Наряду с экстраполяцией иногда применяется такой прием обработки рядов динамики, как интерполяция - искусственное нахождение отсутствующих членов внутри динамического ряда. Неизвестный уровень ряда находится по формуле: y i = (y i +1 + y i -1) / 2. Где: y i - неизвестный уровень ряда, y i +1 - последующий за неизвестным уровень ряда, y i -1 - предыдущий уровень ряда.

ЦЕЛЬ ЗАНЯТИЯ: Овладеть основами вариационной статистики, навыками вычисления и оценки достоверности средних величин

МЕТОДИКА ПРОВЕДЕНИЯ ЗАНЯТИЯ: Студенты самостоятельно готовятся к практическому занятию по рекомендованной литературе и выполняют индивидуальное домашнее задание. Преподаватель в течение 10 минут проверяет правильность выполнения домашнего задания и указывает на допущенные ошибки, проверяет степень подготовки с использованием тестирования и устного опроса. Затем студенты самостоятельно вычисляют средние величины и оценивают их достоверность. В конце занятия преподаватель проверяет самостоятельную работу студентов.

КОНТРОЛЬНЫЕ ВОПРОСЫ:

1. Что представляет собой вариационный ряд, какие виды вариационных рядов выделяют в статистике, каковы элементы вариационного ряда.

2. Что такое средние величины, возможности их использования в медицине и практической деятельности врача.

3. Виды средних величин: мода, медиана, средняя арифметическая

4. Методика вычисления средней арифметической и параметров, характеризующих среднюю.

5. Какие математические законы позволяют теоретически обосновать достоверность статистических данных.

6. Как определить среднюю ошибку средней величины.

7. Что понимается под доверительной границей производных величин.

8. Оценка достоверности различий средних величин при помощи доверительного коэффициента t.

9. Оценка критерия достоверности при больших и малых выборках.

В медико-социальных исследованиях наряду с абсолютными и относительными широко используются средние величины. Средняя величина – это совокупная обобщающая характеристика количественных признаков, она обычно обозначается буквой М или Х. Средние величины существенно отличаются от статистических коэффициентов:

1. Коэффициенты характеризуют признак, встречающийся только у некоторой части статистического коллектива, так называемый альтернативный признак, который может иметь место или не иметь место (рождение, смерть, заболевание, инвалидность).

Средние величины охватывают признаки, присущие всем членам коллектива, но в разной степени (вес, рост, дни лечения в больнице).

2. Коэффициенты применяются для измерения качественных признаков. Средние величины - для варьирующих количественных признаков.

Применение средних величин в медико-социальных исследованиях широко используется при изучении физического развития. Кроме того, средние величины применяются:

1. Для характеристики организации работы лечебно-профилактических учреждений и оценки их деятельности:

А) в поликлинике: показатели нагрузки врачей, посещаемость поликлиники, среднее число посещений на 1-м году жизни, среднее число детей на участке, среднее число посещений при определенном заболевании и т. д.;

Б) в стационаре: среднее число дней работы койки в году; средняя длительность лечения при определенных заболеваниях и т. д.;

В) в органах санэпиднадзора: средняя площадь (или кубатура) на 1 человека, средние нормы питания (белки, жиры, углеводы, витамины, минеральные соли, калории) в дневном рационе возрастных групп у детей и взрослых и т. д.

2. Для определения медико-физиологических показателей организма в норме и патологии в клинических и экспериментальных исследованиях.

3. В специальных демографических и медико-социальных исследованиях.

Для расчета средней величины необходимо построить вариационный ряд - т. е. ряд числовых измерений определенного признака, отличающихся по своей величине.

Вариационные ряды бывают следующих видов:

А) ранжированный, неранжированный;

Б) сгруппированный, несгруппированный;

В) прерывный, непрерывный.

Ранжированный ряд - упорядоченный ряд; варианты располагаются последовательно по нарастанию или убыванию числовых значений.

Неранжированный ряд - варианты располагаются бессистемно.

Прерывный (дискретный) ряд - варианты выражены в виде целых (дискретных) чисел (окна в избе).

Непрерывный ряд – варианты могут быть выражены дробными числами.

Несгруппированный ряд – каждому значению варианты соответствует определенное число частот.

Сгруппированный ряд (интервальный) – варианты соединены в группы, объединяющие их по величине в пределах определенного интервала.

В статистике принято выделять следующие виды средних величин: мода (Мо), медиана (Ме) и средняя арифметическая (М). Мода – величина варьирующего признака, наиболее часто встречающаяся в совокупности. В вариационном ряду это варианта, имеющая наибольшую частоту встречаемости. Обычно мода является величиной довольно близкой к средней арифметической, совпадает с ней при полной симметрии распределения. Медиана – варианта, делящая вариационный ряд на две равные половины. При нечетном числе наблюдений медианой является варианта, имеющая в вариационном ряду порядковый номер (n + 1): 2. Средняя арифметическая величина (М) – в отличие от моды и медианы опирается на все произведенные наблюдения, поэтому является важной характеристикой для всего распределения.

В зависимости от вида вариационного ряда используется тот или иной способ расчета средней. Средняя арифметическая для простого ряда, где каждая варианта встречается один раз, вычисляется по формуле: М =

Знак суммы, V –отдельные значения вариант, n –число наблюдений. Средняя арифметическая взвешенная определяется по формуле: М=

Знак суммы, V –отдельные значения вариант, n –число наблюдений, р – частота встречаемости вариант. Одним из наиболее простых и достаточно точных способов расчета средней арифметической является способ моментов, основанный на том, что алгебраическая сумма отклонений каждой варианты вариационного ряда от средней арифметической равна нулю. М= А + i

Где А – условно принятая средняя или мода, а- отклонение каждой варианты от условно принятой средней, р –частота встречаемости вариант, n –число наблюдений, i – интервал или расстояние между соседними вариантами. Основные свойства средней величины: 1) имеет абстрактный характер, так как является обобщающей величиной: в ней стираются случайные колебания; 2) занимает срединное положение в ряду (в строго симметричном ряду); 3) сумма отклонений всех вариант от средней величины равна нулю. Данное свойство средней величины используется для проверки правильности расчета средней. Она оценивается по уровню колеблемости вариационного ряда. Критериями такой оценки могут служить: амплитуда (разница между крайними вариантами); среднее квадратическое отклонение, показывающее, как отличаются варианты от рассчитанной средней величины; коэффициент вариации.

Среднеквадратическое отклонение (

) наиболее точно характеризует степень разнообразия варьирующего признака, без чего нельзя достаточно полно охарактеризовать явление. Для простого вариационного ряда (р =1) среднеквадратическое отклонение расчитывается по формуле

Для взвешенного вариационного ряда по формуле:

Где d = V – M - отклонение каждой варианты от средней арифметической. При числе наблюдений меньше 30 в знаменателе этих формул берется не n, а n – 1 (так называемое в статистике число степеней свободы). При числе наблюдений более 30 уменьшение знаменателя на единицу не имеет практического значения, т.к. существенно не сказывается на конечном результате. Значительно упрощает вычисления расчет среднего квадратического отклонения по способу моментов.

где, величина

называется моментом первой степени, а

Моментом второй степени.

Степень разнообразия (колеблемости) признака в вариационном ряду можно оценить по коэффициенту вариации (отношение среднего квадратического отклонения к средней величине, умноженное на 100%); при вариации менее 10% отмечается слабое разнообразие, при вариации 10-20% - среднее, а при вариации более 20% - сильное разнообразие признака. Если нет возможности сравнить вариационный ряд с другими, то используют правило трех сигм. Если к средней прибавить одну сигму, то этой вычисленной средней соответствует 68,3%, при двух сигмах - 95,4%, при трех сигмах - 99,7% от всех признаков. В медицине с величиной М ± 1? связано понятие нормы; отклонения от средней (в любую сторону) больше, чем на 1?, но меньше чем на 2?, считаются субнормальными (выше или ниже нормы), а при отклонении от средней больше чем на 2?, варианты считаются значительно отличающимися от нормы (патология).

Мерой точности и достоверности результатов выборочных статистических величин являются средние ошибки представительности (репрезентативности). Средняя ошибка средней арифметической – m (отношение среднего квадратического отклонения к квадратному корню из общего числа наблюдений - объектов). m =

Мерой достоверности среднего показателя наряду с его ошибкой являются, доверительные границы и достоверность разности между двумя средними величинами.

ЗАДАНИЕ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ:

ЗАДАНИЕ №1. Определить моду и медиану вариационного ряда. На основе приведенных данных вычислите: среднюю арифметическую по способу моментов, среднее квадратическое отклонение, коэффициент вариации, среднюю ошибку средней арифметической

Задача 1.

Вычислите среднюю длительность пребывания больного в хирургическом отделении стационара

Задача 2.

Вычислите среднюю длительность временной нетрудоспособности при гипертонической болезни II стадии (гипертонический криз)

Вычислите среднюю частоту пульса в группе здоровых мужчин в возрасте 22 года после умеренной физической нагрузки

Задача 4.

Вычислите среднюю жилую площадь, приходящуюся на одного человека в семьях с низким уровнем достатка

Задача 5.

Вычислите средний вес у девочек 12 лет, воспитывающихся в интернате

Задача 6.

Вычислите максимальную мышечную силу правой кисти у 15-летних юношей, регулярно посещающих спортивные секции

Задача 7.

Вычислите средний рост 17-летних девушек, обучающихся в общеобразовательной школе.

Задача 8.

Вычислите среднее число пациентов принятых участковым терапевтом за один рабочий день

Задача 9.

Вычислите среднее число детей в дагестанской семье

Задача 10.

Вычислите среднее число пораженных кариесом зубов у 18 летних студенток медицинской академии (индекс КПУ)

Задача 11.

Вычислите среднее число детей первого года жизни, проживающих на одном педиатрическом участке

Задача 12.

Вычислить среднее число пропущенных занятий по дисциплине «Общественное здоровье и здравоохранение» студентами 4 курса лечебного факультета в весеннем семестре

Задача 13.

Вычислите средний рост призывников в Ставропольском крае

Задача 14.

Вычислите среднее число пациентов принятых хирургом в поликлинике за один рабочий день

ЗАДАНИЕ №2. Для средних величин, вычисленных в предыдущем задании определите доверительные границы с вероятностью безошибочного прогноза 95%.

Ю.П. Лисицын. Общественное здоровье и здравоохранение. Учебник для вузов. М., 2002.

Ю.П. Лисицын. Социальная гигиена (медицина) и организация здравоохранения. Казань, 1999. –с. 288-289.

В.К. Юрьев, Г.И. Куценко. Общественное здоровье и здравоохранение. С.-П., 2000. –с. 191-199.

А.Ф. Серенко, В.В. Ермаков. Социальная гигиена и организация здравоохранения. М., 1984. –с.124-146.

Общественное здоровье и здравоохранение. Под ред. В.А. Миняева, Н.И. Вишнякова. М. «МЕДпресс-информ», 2002. –с. 97-107.

Руководство по социальной гигиене и организации здравоохранения. Под ред. Ю.П. Лисицына. М., 1987.

Зайцев В.М., Лифляндский В.Г., Маринкин В.И. Прикладная медицинская статистика. С.-П. «Фолиант», 2003.