Вариационный ряд

В генеральной совокупности исследуется некоторый количественный признак. Из нее случайным образом извлекается выборка объема n , то есть число элементов выборки равно n . На первом этапе статистической обработки производят ранжирование выборки, т.е. упорядочивание чисел x1, x2, …, xn по возрастанию. Каждое наблюдаемое значение xi называется вариантой . Частота mi – это число наблюдений значения xi в выборке. Относительная частота (частость) wi – это отношение частоты mi к объему выборки n : wi=mi/n.

При изучении вариационного ряда также используют понятия накопленной частоты и накопленной частости. Пусть x некоторое число. Тогда количество вариантов, значения которых меньше x , называется накопленной частотой: miнак=mi для xi называется накопленной частостью: wiнак=miнак/n.

Признак называется дискретно варьируемым, если его отдельные значения (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом.

Числовые характеристики вариационного ряда

Числовые характеристики вариационных рядов вычисляют по данным, полученным в результате наблюдений (статистическим данным), поэтому их называют также статистическими характеристиками или оценками. На практике часто оказывается достаточным знание сводных характеристик вариационных рядов: средних или характеристик положения (центральной тенденции); характеристик рассеяния или вариации (изменчивости); характеристик формы (асимметрии и крутости распределения).

Средняя арифметическая характеризует значения признака, вокруг которого концентрируются наблюдения, т.е. центральную тенденцию распределения.

Достоинство медианы как меры центральной тенденции заключается в том, что на нее не влияет изменение крайних членов вариационного ряда, если любой из них, меньший медианы, остается меньше ее, а любой, больший медианы, продолжает быть большее ее. Медиана предпочтительнее средней арифметической для ряда, у которого крайние варианты по сравнению с остальными оказались чрезмерно большими или малыми. Особенность моды как меры центральной тенденции заключается в том, что она также не изменяется при изменении крайних членов ряда, т.е. обладает определенной

Характеристики поло

Среднее арифметическое (выборочное среднее)

xв=i=1nmixin

Мода

Mo = xj, если mj = mmax

Me = xk+1, если n = 2k+1;

Me = (xk + xk+1)/2, если n = 2k

Характеристики рассеяния

Выборочная дисперсия

Dв=i=1nmixixв2n

Выборочное среднее квадратичное отклонение

σв=Dв

Исправленная дисперсия

S2=nn1Dв

Исправленное среднее квадратичное отклонение

Коэффициент вариации

V=σвxв∙100%

Среднее абсолютное

отклонение

θ=i=1nmixixвn

Вариационный размах

R = xmax xmin

Квартильный размах

Rкв = Qв – Qн

Характеристики формы

Коэффициент асимметрии

As=i=1nmixixв3nσв3

Коэффициент эксцесса

Ek=i=1nmixixв4nσв43

устойчивостью к вариации признака. Но наибольший интерес представляют меры вариации (рассеяния) наблюдений вокруг средних величин, в частности, вокруг средней арифметической. К таким оценкам относятся выборочная дисперсия и среднее квадратичное отклонение . Выборочная дисперсия обладает одним существенным недостатком: если среднее арифметическое выражается в тех же единицах, что и значения случайной величины, то, согласно определению, дисперсия выражается уже в квадратных единицах. Этого недостатка можно избежать, если использовать в качестве меры вариации признака среднее квадратичное отклонение. При малых объемах выборки дисперсия является смещенной оценкой, поэтому при объемах n 30 используют исправленную дисперсию и исправленное среднее квадратичное отклонение . Другой часто используемой характеристикой меры рассеяния признака является коэффициент вариации . Достоинством коэффициента вариации является то, что это безразмерная характеристика, позволяющая сравнивать варьирование несоизмеримых

вариационных рядов. Кроме того, чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя. Совокупности с коэффициентом вариации V > 3035% принято считать неоднородными.

Наряду с дисперсией используют и среднее абсолютное отклонение . Достоинством среднего линейного отклонения является его размерность, т.к. выражается в тех же единицах, что и значения случайной величины. Дополнительным и простым показателем рассеяния значений признака является квартильный размах. Квартильный размах включает в себя медиану и 50% наблюдений, отражающих центральную тенденцию признака, исключая наименьшие и наибольшие значения.

К характеристикам формы относят коэффициент асимметрии и эксцесс. Если коэффициент асимметрии равен нулю, то распределение имеет симметричную форму. Если распределение асимметрично, одна из ветвей полигона частот имеет более пологий спуск, чем другая. Если асимметрия правосторонняя, то справедливо неравенство: xв>Me>Mo, что означает преимущественное появление в распределении более высоких значений признака. Если асимметрия левосторонняя, то выполняется неравенство: , означающее, что в распределении чаще встречаются более низкие значения. Чем больше значение коэффициента асимметрии, тем более асимметрично распределение (до 0,25 асимметрия незначительная; от 0,25 до 0,5 умеренная; свыше 0,5 – существенная).

Эксцесс является показателем крутости (островершинности) вариационного ряда по сравнению с нормальным распределением. Если эксцесс положителен, то полигон вариационного ряда имеет более крутую вершину. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине. Если эксцесс отрицателен то полигон имеет более пологую вершину по сравнению с нормальной кривой. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от минимального до максимального значения. Чем больше абсолютная величина эксцесса, тем существеннее распределение отличается от нормального.

У нас самая большая информационная база в рунете, поэтому Вы всегда можете найти походите запросы

Эта тема принадлежит разделу:

Поверхностное пластическое деформирование (ППД)

Шпаргалки на экзамен. Детали машин, методы поверхностного пластического деформирования (ППД). Ответы

К данному материалу относятся разделы:

Явления, происходящие в поверхностном слое детали при обработке ППД, механизм упрочнения

Качество поверхности, получаемое при обкатывании роликовым инструментом. Схема процесса, величина давления, кратность приложения деформирующей силы, технологическая оснастка в процессах обкатывания шаровым инструментом.

Качество поверхности, получаемое при обкатывании шаровым инструментом. Схема процесса, величина давления, кратность приложения деформирующей силы, технологическая оснастка в процессах обкатывания шаровым инструментом.

Формообразование микропрофиля поверхности при обработке скользящим индентором, его назначение, технологическая оснастка в процессах вибрациионной упрочняющей обработки, область применения.

Формообразование микропрофиля поверхности при обработке вращающимся индентором, его назначение, технологическая оснастка в процессах вибрационной упрочняющей обработки, область применения.

Какое влияние оказывает угол сетки рисок абразивных зерен бруска на производительность процесса и качество обрабатываемой поверхности при суперфинишировании? Как настроить технологическую оснастку на получение определенного угла сетки рисок?

Как обеспечить получение системы параллельных каналов и правильную сетку каналов при обработке скользящим индентором в процессах ППД? Сравнительная характеристика этих сеток каналов и их влияние на эксплуатационные свойства поверхностей деталей машин.

Какими технологическими методами обеспечивается качество поверхностного слоя детали на отделочном этапе обработки? Приведите их сравнительную характеристику. Критерии выбора определенного метода для решения конкретной технической задачи.

Виброударная обработка, сущность процесса, область применения, технологическое оснащение.

Суперфиниширование, сущность процесса, область применения. Выбор размеров, способа крепления брусков и их правки в процессах суперфиниширования.

Классификация методов поверхностного пластического деформирования (ППД), сравнительная характеристика и особенности их применения. Технологическое оснащение процессов ППД.

Объясните термины: опорная длина профиля, опорная кривая профиля поверхности, приведите примеры микрогеометрии поверхностей, полученные различными технологическими методами и методику оценки их несущей способности.

Жесткий и упругий контакт в процессах ППД, и его технологическое обеспечение. Влияние вида контакта на качество поверхностного слоя.

Почему для повышения эксплуатационных параметров деталей применяют вибрационное пластическое деформирование? Сравните его с традиционными методами обкатывания и выглаживания без вибраций. Характеристика технологического оснащения этих сравниваемых методов

Явления, происходящие в поверхностном слое детали при обработке ППД, механизм формирования остаточных напряжений.

Поверхностное и объемное дорнование отверстий, сущность процесса,область применения, технологическое обеспечение дорнования.

Сравнительная характеристика методов шлифования: скоростное; силовое; совмещенное; интегральное; упрочняющее.

Понятие эксперимента. Ошибки измерений: промахи, систематические, случайные. Похожие материалы:

Особенности изучения темы «Алгоритмы» в начальной школе с применение компьютерных обучающих программ

Курсовая работа направление подготовки Педагогическое образование. Цель данной работы состоит в том, чтобы выявить и доказать необходимость и эффективность изучения алгоритмизации в начальной школе с применением компьютерных обучающих программ.

Топографічні карти універсального призначення

Реферат. Топографічні фотокарти суші та акваторії. Зарубіжні топографічні карти

Эстетика (Аристотель и Платон)

Аристотель, теории мимезиса, принцип соразмерности человека и прекрасного. Музыкальная эстетика, пифагорейская эстетика, Музыкально-математическая гармония. Идеалистическая эстетика Платона

Система применения удобрения в севообороте

Курсовой проект агрономического факультета. Кафедра агрохимии и почвоведения

Энергоэффективность в строительстве. Тепловая сушка

Часть курсового проекта. Тепловая экономичность сушильных установок. Воздушные завесы.

Цель работы

Познакомиться с явлением рассеяния и научиться определять его характеристики.

Оснащение

1. Диски с номинальным значением А 1 .

2. Диски с номинальным значением А 2 .

3. Микрометр.

4. Стойка.

1. Общие сведения

При изготовлении партии деталей по одному и тому же технологическому процессу, одним и тем же рабочим, на одном и том же рабочем месте, в одних и тех же условиях наблюдаются отклонения значений параметров точности деталей от идеального прототипа и друг от друга. Это явление получило название рассеяние.

На всех этапах технологического процесса изготовления детали действует большое количество непрерывно или дискретно изменяющихся случайных и систематических факторов.

Систематические факторы бывают:

– постоянно действующие (например, погрешность формы обрабатываемой поверхности, обусловленная непараллельностыо оси шпинделя направляющим токарного станка; погрешность измерения и др);

– изменяющиеся по определенному закону у = f (x ) (например, размерный износ инструмента, тепловые деформации станка и др.).

Случайные факторы характеризуются большим их количеством, отсутствием связи между собой и нестабильностью (например, упругие отжатия звеньев системы СПИД).

На практике явление рассеяния любой характеристики качества изучается с помощью точечной диаграммы, которая позволяет определить все характеристики.

Для построения точечной диаграммы по оси абцисс откладываются порядковые номера измерений деталей, а по оси ординат в виде точек – полученные значения соответствующего номера измерений деталей (рис. 1.1). Через точки, соответствующие максимальному и минимальному значениям измерения, проводятся две линии, параллельные между собой и оси абцисс. Расстояние между этими линиями является первой характеристикой рассеяния значений и носит название поля рассеяния ω = А нб A нм . Эта характеристика обязательно дополняется координатой середины поля рассеяния – ∆ω , которая представляет собой расстояние между серединой поля рассеяния и номинальным значением. Она определяет положение поля рассеяния относительно номинала.

Второй характеристикой явления рассеяния служит практическая кривая рассеяния и определяющие ее параметры. Для построения практической кривой рассеяния необходимо поле рассеяния ω на точечной диаграмме разделить на 7…11 интервалов линиями, параллельными оси абцисс. В каждом интервале подсчитать количество попавших в него результатов измерений (абсолютная частость т) и изобразить это количество в виде прямоугольников шириной, равной величине интервала, и высотой, равной абсолютной частости т.

Получившаяся диаграмма называется гистограммой рассеяния. Изобразив абсолютную частоту т в виде прямых линий, расположенных посредине каждого интервала (нагруженных ординат), и соединив их верхние точки отрезками прямых линий, получают ломаную линию, называемую практической кривой рассеяния значений измерения (рис. 2.1).


Pиc. 1.1. Точечная диаграмма и практическая

кривая рассеяния значений измерения

Параметрами, характеризующими практическую кривую рассеяния, являются:

1. Уравнение кривой рассеяния у = φ (х ). Для большинства задач оценки точности в технологии машиностроения распределение текущих значений х i подчиняется нормальному закону (закону Гаусса), для которого

Кроме закона Гаусса текущие значения х i могут распределяться по закону равной вероятности, закону Симпсона, закону Шарлье и др.

2. Центр группирования случайной величины – это среднее значение, около которого располагается наибольшее количество значений. Иными словами, центр группирования – это значение случайной величины, принадлежащее большинству деталей в партии. Положение центра группирования определяется координатой центра группирования (математическим ожиданием) M (x ).

3. Среднее квадратичное отклонение σ, показывающее плотность группирования текущих значений относительно центра группирования М (х ). Графически σ изображается в виде двух абцисс, равноотстоящих от значения M (x ) на величину σ, Эта характеристика служит мерой рассеяния.

4. Коэффициент относительной асимметрии а, показывающий смещение центра группирования М (х ) относительно середины поля рассеяния. Для дискретных величин текущего значения х i характеристики M (x ), σ и а определяются по равенствам:

где р (х i ) = т / п количество значений измерений, попавших в соответству-ющий интервал, выраженное в процентах или долях всего количества измеренных величин (относительная частость).

Вычисленные характеристики рассеяния значений измерения представляются в графическом виде, учитывая, что у m ах ≈ 0,4/σ , у σ ≈ 0.24/σ (рис. 2.2).

Рис. 2.2. Характеристики явления рассеяния: M (x ); σ ; а



2. Порядок выполнения работы

Лабораторная работа выполняется двумя бригадами. Явление рассеяния в данной работе изучается на примере двух партий деталей по 50 штук номиналами А 1 , А 2 .

Произвести установку (50 раз) заготовки в трёхкулачковый патрон и измерить осевое смещение.

При установке деталь необходимо плотно прижимать торцовой поверхностью к оснастке, а при повторных установках деталь необходимо поворачивать вокруг ее оси на некоторый угол.

Результаты измерений зафиксировать после каждой установки детали.

По результатам измерений построить точечную диаграмму, гистограмму и кривую рассеяния аналогично этапу 2.

Определить параметры, характеризующие кривую рассеяния, аналогично этапу 3.

Сравнить результаты экспериментов и сделать выводы.

Построить схему этих характеристик явления рассеяния (рис.2.2).

1. Название, цель и оснащение работы.

2. Результаты измерений деталей номиналом А 1 .

3. Точечная диаграмма и характеристики явления рассеяния.

4. Результаты измерений деталей номиналом А 2 .

5. Точечная диаграмма и характеристики явления рассеяния.

6. Выводы.

4. Контрольные вопросы

1. Что такое явление рассеяния?

2. С помощью чего изучается явление рассеяния.

3. Назовите характеристики явления рассеяния.

4. Какие факторы действуют в процессе изготовления детали?

5. За что отвечают в точечной диаграмме систематические факторы?

6. За что отвечают в точечной диаграмме случайные факторы?

7. Почему при построении практической кривой рассеяния количество интервалов должно быть нечетным?

8. Что такое поле рассеяния?

9. Что такое координата середины поля рассеяния?

10. Зачем нужна координата середины поля рассеяния?

11. Что такое центр группирования?

12. Что такое математическое ожидание?

13. Что показывает математическое ожидание?

14. Что принято за меру рассеяния?

15. Назовите характеристики хода технологического процесса.

16. Назовите характеристики явления рассеяния при обработке партии деталей.

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения (средние характе­ристики, или центральная тенденция выборки ); характеристики рассеяния (ва­риации, или колеблемости ) и характеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение ), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости ) относятся: размах вариации , дисперсия , среднее квадратическое (стандартное ) отклонение , ошибка средней арифметической (ошибка средней ), коэффициент вариации и др.

К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

Характеристики положения

Среднее арифметическое значение – одна из основных характеристик вы­борки.

Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.

Для несгруппированных данных среднее арифметическое определяется по формуле:

где n - объем выборки, х 1 , х 2 , ... х n - результаты измерений.

Для сгруппированных данных:

где n - объем выборки, k – число интервалов группировки, n i – частоты интервалов, x i – срединные значения интервалов.

Мода

Определение 1. Мода - наиболее часто встречающаяся величина в данных вы­борки. Обозначается Мо и определяетсяпо формуле:

где - нижняя граница модального интервала, - ширина интервала группи­ровки, - частота модального интервала, - частота интервала, предшествую­щего модальному, - частота интервала, последующего за модаль­ным.

Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.

Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными .

Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.

Медиана

Определение . Медиана - результат измерения, который находится в сере­дине ранжированного ряда, иначе говоря, медианой называется значение признака Х , когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме .

Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.

Для данных, сгруппированных в интервалы, медиану определяют по фор­муле:

,

где - нижняя граница медианного интервала; ширина интервала группи­ровки, 0,5n – половина объёма выборки, - частота медианного интервала, - накопленная частота интервала, предшествующего медианному.

Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/ 2) или накопленная частость окажется больше 0,5.

Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.

Характеристики рассеяния результатов измерений

Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значе­ния может характеризовать совершенно различные выборки.

Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости ) результатов .

Размах вариации

Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется

R =X max - X min .

Информативность этого показателя невелика, хотя при малых объёмах вы­борки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.

Дисперсия

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.

Для несгруппированных данных дисперсия определяется по формуле

s 2 = , (1)

где Х i – значение признака, - среднее арифметическое.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле

,

где х i – среднее значение i интервала группировки, n i – частоты интервалов.

Для упрощения расчётов и во избежание погрешностей вычисления при округ­лении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая фор­мула:

для сгруппированных данных:

.

Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.

Наряду с наиболее вероятным значением риска важное значение имеет разброс возможных значений риска относительно его центрального значения. Учет разброса показателей необходим и при решении задач социально-гигиенического мониторинга.

Наиболее распространенными характеристиками разброса случайной величины являются дисперсия и среднеквадратичное отклонение.

Дисперсия случайной величины ξ обозначаемая как D (ξ) (используются также обозначения V (ξ) и σ 2 (ξ)), характеризует наиболее вероятное значение квадрата отклонения случайной величины от своего математического ожидания.

Для дискретной случайной величины, принимающей значения х i с вероятностями р i , дисперсия определяется как взвешенная сумма нитратов отклонений х i от математического ожидания ξ с весовыми коэффициентами, равными соответствующим вероятностям:

D(ξ) =

Для непрерывной случайной величины ξ ее дисперсия определяется по формуле:

D(ξ) =

Дисперсия обладает следующими практически важными свойствами:

1.Дисперсия любой случайной величины неотрицательна:

D(ξ) ≥ 0

2. Дисперсия постоянной величины равна 0:

D(C) = 0

где С - константа.

3. Дисперсия случайной величины ξ равна разности между математическим ожиданием квадрата этой случайной величины и квадратом математического ожидания ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. Прибавление константы к случайной величине не изменяет дисперсии; умножение случайной величины на константу а приводит к умножению дисперсии на а 2 :

D(aξ + b) = a 2 D(ξ),

где а и b - константы.

5. Дисперсия суммы независимых случайных величин равна сумме их дисперсий:

где ξ и η - независимые случайные величины.

Среднеквадратичным отклонением случайной величины ξ (используются также термин «стандартное отклонение») называется число σ (ξ) равное квадратному корню из дисперсии ξ:

Среднеквадратичное отклонение измеряет отклонение случайной нвеличины от ее математического ожидания в тех же величинах, в которых измеряется сама случайная величина (в отличие от дисперсии, размерность которой равна квадрату размерности исходной случайной величины). Для нормального распределения среднеквадратичное отклонение равно параметру σ. Таким образом, математическое ожидание и стандартное отклонение представляют собой полный набор характеристик нормального распределения и однозначно определяют вид плотности распределения. Для распределений, отличающихся от нормального, эта пара показателей не является столь же эффективной характеристикой распределения.


В качестве характеристики рассеяния случайной величины используется также коэффициент вариации. Коэффициентом вариации случайной величины ξ имеющей ненулевое математическое ожидание, называется число V (ξ) равное отношению среднеквадратичного отклонения ξ к ее математическому ожиданию:

Коэффициент вариации измеряет рассеяние случайной величины в долях ее математического ожидания и часто выражается в процентах от последнего. Этой характеристикой не следует пользоваться, если математическое ожидание близко к 0 или существенно меньше стандартного отклонения (в этом случае малые ошибки при определении математического ожидания приводят к высокой погрешности для коэффициента вариации), а также, если вид плотности распределении существенно отличается от гауссовского.

Коэффициент асимметрии (As ) определяет 3-ю степень отклонении случайной величины от математического ожидания и определяется по формуле:

На практике этот показатель используется в качестве оценки симметричности распределения. Для любого симметричного распределения он равен 0. Если же плотность распределения несимметрична (что часто может иметь место при оценке риска смерти и рисков, связанных с загрязнением воды и воздуха), то положительный коэффициент асимметрии соответствует случаю, когда левое плечо кривой плотности круче правого, а отрицательный - случаю, когда правое плечо круче левого (рис 4.17).

Для асимметричных распределений стандартное отклонение не является хорошим показателем рассеяния случайной величины. Для характеристики рассеяния в этом случае можно использовать такие показатели, как квартили, квантили и процентили.

Первой квартилью случайной величины ξ, имеющей функцию распределения F(х), называется число Q 1 являющееся решением уравнения

F(Q 1) = 1/4

т. е. такое число, для которого вероятность того, что ξ принимает значения, меньшие Q 1 , равна 1/4, вероятность того, что она принимает значения, большие Q 1 равна 3/4.

Второй квартилью (Q 2 ) случайной величины называется ее медиана, а третьей (Q 3 ) - решение уравнения

F(Q 3) = 3/4

Квартили делят ось абсцисс на 4 интервала: [-∞,Q 1 ], [Q 1 , Q 2 ], [Q 2 , Q 3 ] и [Q 3 , + ∞] в каждый из которых случайная величина попадает c равной вероятностью, а фигуру, ограниченную осью абсцисс и графиком плотности распределения - на 4 области с одинаковой площадью. И интервале между первой и третьей квартилями сосредоточено 50% распределения случайной величины. Для симметричных распределений первая и третья квартили одинаково удалены от медианы.

Квантилью порядка р случайной величины ξ с функцией распределения F(х) называется число х , являющееся решением уравнения

Таким образом, квартили являются квантилями порядка 0,25, 0,5 и 0,75. Если порядок квантили р выражается в процентах, то соответствующие значения х называются процентилями, или р -процентными точками распределения.

На рис. 4.18 показаны, наряду с квантилями, 2,5- и 97,5-процентные точки распределения. Между этими точками сосредоточено 95% распределения случайной величины, поэтому заключенный между ними интервал называют 95 %-м доверительным интервалом среднего (в частности, при оценке рисков - 95 %-м доверительным интервалом риска).

Задача 2. Какие из перечисленных ниже сведений о случайной величине ξ позволяют отвергнуть предположение о том, что она распределена по нормальному закону:

а) ξ - дискретная случайная величина;

б) математическое ожидание ξ отрицательно;

в) распределение ξ унимодально;

г) математическое ожидание ξ не равно ее медиане;

д) коэффициент асимметрии ξ отрицателен;

е) стандартное отклонение ξ больше ее математического ожидания;

ж) ξ характеризует распределение продолжительности острых заболеваний органов дыхания на исследуемой территории;

з) ξ характеризует распределение продолжительности жизни на исследуемой территории;

и) медиана ξ не совпадает с центром интервала между первой и третьей квартилями.

Ответ: Предположение о нормальном законе распределения случайной величины несовместимо с утверждениями а), г), д), з), и).

Рис. 4.17. Зависимость между знаком Рис.4.18. Квартили и процентили:

коэффициента асимметрии и формой иллюстрация с помощью функции

функции плотности распределения

Для выборки можно определить ряд числовых характеристик, которые аналогичны основным числовым характеристикам случайных величин в теории вероятностей (математическое ожидание, дисперсия, среднее квадратическое отклонение, мода, медиана) и являются в некотором смысле (который будет ясен дальше) их приближенным значением.

Пусть дано статистическое распределение выборки объема n для частот и относительных частот:

x i

x 1

x 2

x k

n i

n 1

n 2

n k


x i

x 1

x 2

x k

w i

w 1

w 2

w k

Выборочным средним называется среднее арифметическое значение всех вариант:

Если внести множитель под знак суммы, то получим формулу для выборочного среднего через относительные частоты:

.

Отметим, что в случае интервального ряда выборочное среднее вычисляется по тем же формулам, если в качестве чисел х 1 , … , х k взять середины интервалов: , … ,.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений выборки от их выборочного среднего:

Снова внося множитель под знак суммы, получим формулу для выборочной дисперсии через относительные частоты:

Несложные преобразования приводят к более удобной формуле для вычисления выборочной дисперсии

,

где есть выборочное среднее квадрата изучаемой случайной величины, т.е.

Если выборка представлена интервальным статистическим рядом, то формулы для выборочной дисперсии остаются те ми же, где, как обычно, в качестве чисел х 1 , … , х k берутся середины интервалов: , … ,.

Выборочным средним квадратическим отклонением называется квадратный корень из выборочной дисперсии

.

Размахом вариации R называется разность между максимальным и минимальным значением в выборке. Если варианты в выборке ранжированы (размещены в возрастающем порядке), то

.

Коэффициент вариации определяется по формуле

.

Модой М о вариационного ряда называется вариант, имеющий наибольшую частоту (или относительную частоту).

Медианой М е вариационного ряда называется число, являющееся его серединой. Для дискретного ряда с нечетным числом вариант медиана равна его серединному варианту. Если же число вариант четно, то Медина равна среднему (т.е. полусумме) двух серединных вариант.

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения(средние характе­ристики, или центральная тенденция выборки); характеристики рассеяния(ва­риации, или колеблемости) и характеристики формыраспределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости) относятся: размах вариации, дисперсия, среднее квадратическое (стандартное) отклонение, ошибка средней арифметической (ошибка средней), коэффициент вариации и др.

К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

51. Оценка параметров генеральной совокупности. Точечная и интервальная оценка. Доверительный интервал. Уровень значимости

Оценка параметров генеральной совокупности

Существуют точечные и интервальные оценки генеральных параметров.

Точечной одним числом . К таким оценкам относятся, например,

Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны быть:

    несмещенными;

    эффективными;

    состоятельными.

Оценка называется несмещенной, если математическое ожидание ее выборочного распределения совпадает со значением генерального параметра.

Точечная оценка называется эффективной, если она имеет наименьшую дисперсию выборочного распределения по сравнению с другими аналогичными оценками, т.е. обнаруживает наименьшую случайную вариацию.

Точечная оценка называется состоятельной, если при увеличении объема выборочной совокупности она стремиться к величине генерального параметра.

Например, выборочная средняя есть состоятельная, несмещённая оценка генеральной средней. Для выборки из нормальной генеральной совокупности эта оценка является также и эффективной.

При выборке малого объема точечная оценка может значительно отличаться от оцениваемого параметра, т.е. приводить к грубым ошибкам. По этой причине при небольшом объеме выборки следует пользоваться интервальными оценками.

Интервальной называют оценку, которая определяется двумя числами концами интервала доверительного интервала .

Интервальные оценки позволяют установить точность и надежность оценок.

Для оценки генерального параметра с помощью доверительного интервала необходимы три величины:

Например, доверительный интервал для генеральной средней находится по формуле:при уровне значимости.

Доверительный интервал - термин, используемый в математической статистике при интервальной оценке статистических параметров, более предпочтительной при небольшом объёме выборки, чем точечная.

Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.

Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р < 0,05 , то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05.

Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р < 0,01 , то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.

Если перевести все это на более формализованный язык, то уровень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.

Ошибка, состоящая в той, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой 1 рода. (См. Табл. 1)

Табл. 1. Нулевая и альтернативные гипотезы и возможные состояния проверки.

Вероятность такой ошибки обычно обозначается как α. В сущности, мы должны были бы указывать в скобках не р< 0,05 или р< 0,01, а α< 0,05 или α< 0,01.

Если вероятность ошибки - это α , то вероятность правильного решения: 1-α. Чем меньше α, тем больше вероятность правильного решения.

Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р≤0,05): достаточным – 1%-ый уровень (р≤0,01) и высшим 0,1%-ый уровень (р≤0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости р≤0,05 и р≤0,01, иногда - р≤0,001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. Например, для φ*=1,56 р=О,06.

До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу. Мы будем придерживаться следующего правила отклонения гипотезы об отсутствии различий (Но) и принятия гипотезы о статистической достоверности различий (Н 1).