Математическая статистика задачи с решением и примерами

Оглавление:

Математическая статистика задачи с решением

Прежде чем изучать готовые решения задач по математической статистике, нужно знать теорию, поэтому для вас я подготовила краткую теорию по предмету «математическая статистика», после которой подробно решены задачи.

Эта страница подготовлена для школьников и студентов.

Если что-то непонятно — вы всегда можете написать мне в WhatsApp и я вам помогу!

Приступая к изучению элементов статистики, отметим несколько особенностей в постановке и решении ее задач в сравнении с задачами теоретико-вероятностными.

Теория вероятностей, исходя из известных характеристик совокупности случайных величин, отвечает на вопрос о возможности осуществления того или иного события, обусловленного рассматриваемыми случайными величинами:

знаем закон распределения совокупности случайных величин Законы больших чисел и предельные теоремы — хотим уметь находить вероятности событий, которые этими случайными величинами определяются.

В статистике мы решаем задачи, в некотором смысле обратные, а именно: наблюдая некоторые события, о которых известно, что возможность их осуществления или неосуществления обусловливается комплексом случайных величин, хотим определить эти (неизвестные) случайные величины, их вероятностные характеристики:

знаем результаты наблюдений {конкретные значения, принятые случайной величиной} —хотим сделать какие-нибудь заключения о законе распределения (в частности о параметрах и числовых характеристиках} наблюдаемой случайной величины.

Ясно, что в силу принципиальной непредсказуемости результатов наблюдения за случайной величиной, выводы, сделанные на основе результатов эксперимента, будут информативными только в том случае, когда эти наблюдения «хорошие» — т. е. те значения £, которые имеют большую вероятность, будут наблюдаться в эксперименте чаще, а имеющие меньшую вероятность — реже. Законы больших чисел утверждают, что в подавляющем большинстве экспериментов так и будет. Однако, это не гарантирует нам, что данный конкретный эксперимент окажется именно таким.

Поэтому всякое статистическое заключение недостоверно: если основа заключения «хороший» эксперимент, то заключение достаточно близко к истине, если «плохой», то ошибочно. При этом «хорош» эксперимент или «плох» определяется не нами, не нашей добросовестностью наблюдателя и тщательностью экспериментатора, а исключительно случаем — природой.

Сказанное хорошо иллюстрируется следующим примером: пусть наблюдаются результаты n-кратного бросания монеты. Если бросать монету достаточно долго, то частота появления, например, герба, как гласит закон больших чисел в форме Бернулли, будет близка к вероятности. Поэтому по частоте (наблюдаемой и вычисляемой величине) можно сделать заключение о вероятности (неизвестной величине). Насколько это заключение соответствует истине?

Пусть монета симметрична, т. е. Р(Г) = Р(Р) = 0,5 (что тем не менее не препятствует асимметрии в количестве появлений герба и решки в конкретном эксперименте)!

Может статься, что в серии из 100 бросаний герб появится 45 раз, а решка 55, а может статься и так, что герб появится 20 раз, а решка — 80. Ясно, что первая серия может быть признана «хорошей» с точки зрения рассматриваемой задачи, а вторая — «плохой». В любом случае мы сделаем заключение о неизвестной вероятности выпадения герба по наблюденной в эксперименте частоте и в первом случае положим Р(Г) = 0,45, а во втором — 0,2. Основанием для оптимизма является то важное обстоятельство, что «плохие» серии будут встречаться тем реже, чем длиннее серия! Значит, при достаточно длинной серии бросаний эксперимент скорее будет «хорошим» чем «плохим», и определенная по результатам такого эксперимента Р(Г) будет «похожа» на истинную. Достоверность статистического вывода будет определяться тем, насколько «редки» плохие эксперименты.

Практика использования статистических процедур показывает, что чаще всего решения, принятые на основании подобных выводов, оказываются верными. И именно это обстоятельство (согласованность статистических выводов с экспериментом) делает математическую статистику не бесполезной в практическом отношении наукой.

В дальнейшем мы неоднократно будем употреблять термины «маленькая вероятность», «маловероятное событие» и т. п. Какая же вероятность может считаться маленькой, а какая нет? Не вдаваясь подробно в обсуждение этого вопроса, заметим только, что абсолютная величина вероятности вне связи с конкретной обстановкой не дает нам никаких сведений о ее малости или немалости. Скажем, если нам известно, что вероятность осуществления некоторого события равна 0,01, то эта вероятность будет маленькой, если комплекс условий, обусловливающий рассматриваемое событие, складывается один раз за сто лет. Если же комплекс условий, при котором наблюдается рассматриваемое событие, складывается каждые пять минут, то эта же вероятность должна рассматриваться как значительная. Другими словами, под маленькой вероятностью мы будем понимать вероятность такого события, которое практически не наблюдается, вне зависимости от ее численного значения.

Математическая статистика

Математическая статистика – это раздел математики, изучающий математические методы сбора, систематизации, обработки и интерпретации результатов наблюдений с целью выявления статистических закономерностей.

Статистический материал и его обработка

Результаты наблюдений массовых явлений, случайных величин составляют статистические данные или статистический материал. Выборкой объёма Решение задач по математической статистике называется совокупность Решение задач по математической статистике случайно отобранных объектов. Множество всех объектов, из которых производится выборка, называется генеральной совокупностью (ГС).

Выборочный метод состоит в том, что на основании изучения некоторого количественного признака Решение задач по математической статистике у некоторой части статистической совокупности (выборки), полученной в результате статистического отбора, можно сделать вывод о характере распределения этого признака по всей статистической совокупности (генеральной совокупности).

Результаты наблюдений выборки Решение задач по математической статистике объёма записываются, в частности, в виде статистической совокупности;

Решение задач по математической статистике

При больших значениях Решение задач по математической статистике и различных значениях xt статистическую совокупность подвергают специальным видам статистической обработки.

Расположим значения Решение задач по математической статистике которые назовём вариантами, в порядке возрастания и обозначим Решение задач по математической статистике. Величина Решение задач по математической статистике называется размахом статистической совокупности. Среди значений Решение задач по математической статистике могут быть одинаковые. Пусть значение Решение задач по математической статистике наблюдалось Решение задач по математической статистике раз, Решение задач по математической статистике раз, Решение задач по математической статистике наблюдалось Решение задач по математической статистике раз. Тогда общий объём выборки равен Решение задач по математической статистике. Число Решение задач по математической статистике показывающее, сколько раз встречается варианта (значение) Решение задач по математической статистике называется частотойРешение задач по математической статистике а число Решение задач по математической статистике — относительной частотой варианты Решение задач по математической статистике.

Последовательность Решение задач по математической статистике записанная в порядке возрастания с указанием частот и (или) относительных частот, называется вариационным рядом. Статистическим рядом называется последовательность пар Решение задач по математической статистике. Обычно статистический ряд записывается в виде следующей таблицы:

Решение задач по математической статистике

Геометрическим изображением вариационного ряда является эмпирический полигон распределения, являющийся аналогом плотности распределения случайной величины Решение задач по математической статистике— ломаная с вершинами Решение задач по математической статистике — см. рисунок 1.

Вариационный ряд обозрим при небольших значениях Решение задач по математической статистике. В противном случае его (или первоначальную статистическую совокупность) подвергают интервальной обработке.

Все варианты Решение задач по математической статистике принадлежат отрезку Решение задач по математической статистике. Пусть к некоторое (не больше 20) натуральное число. Отрезок Решение задач по математической статистике разобьём на Решение задач по математической статистике равных частей длины Решение задач по математической статистике.

Обозначим эти промежутки следующим образом: Решение задач по математической статистике. Через Решение задач по математической статистике обозначим число вариант, попавших в интервал Решение задач по математической статистике, при этом будем считать, что каждый промежуток содержит свой левый конец, но лишь последний промежуток содержит и свой правый конец. Пусть Решение задач по математической статистике (числа Решение задач по математической статистике и Решение задач по математической статистике можно также отнести к середине Решение задач по математической статистике. интервала Решение задач по математической статистике). Полученные данные занесём в таблицу, называемую интервальной обработкой ряда, или статистической совокупности.

Решение задач по математической статистике

Количество интервалов Решение задач по математической статистике можно рассчитать по формуле Стерджеса Решение задач по математической статистикеРешение задач по математической статистике либо с помощью таблицы:

Решение задач по математической статистике

Геометрическим изображением интервальной обработки служит гистограмма (см. рисунок 1). Гистограммой частот называется множество прямоугольников с основаниями Решение задач по математической статистике и высотами Решение задач по математической статистике. Площадь гистограммы равна объёму выборки Решение задач по математической статистике.

Нормированная гистограмма (гистограмма относительных частот) представляет собой ступенчатую фигуру из прямоугольников с основаниями равными интервалам значений признака Решение задач по математической статистике и высотами, равными плотности частоты Решение задач по математической статистике. Если соединить прямолинейными отрезками середины верхних оснований прямоугольников, получим полигон распределения. Суммарная площадь всех прямоугольников гистограммы равна 1:

Решение задач по математической статистике
Решение задач по математической статистике

Эмпирической функцией распределении (функцией распределения выборки) называется функция Решение задач по математической статистике, определяющая для каждого значения Решение задач по математической статистике относительную частоту события Решение задач по математической статистике (см. рисунок 2):

Решение задач по математической статистике

где Решение задач по математической статистике — число вариант Решение задач по математической статистике, меньших чем Решение задач по математической статистике — объем выборки.

Решение задач по математической статистике

Функция Решение задач по математической статистике обладает следующими свойствами (здесь Решение задач по математической статистикеРешение задач по математической статистике):

Решение задач по математической статистике

-монотонно неубывающая, непрерывная слева функция.

Функция Решение задач по математической статистике является статистическим аналогом функции распределения Решение задач по математической статистике генеральной совокупности. Функцию распределения Решение задач по математической статистикев математической статистике называют теоретической функцией распределения. Различие между теоретической и эмпирической функциями распределения состоит в том, что Решение задач по математической статистике определяет вероятность события Решение задач по математической статистике, a Решение задач по математической статистике — относительную частоту этого события.

Эмпирическая функция распределения служит для оценки вида теоретической функции распределения случайного признака, полигон и гистограмма — для оценки вида теоретической кривой распределения.

Числовые характеристики законов распределения эмпирических величии

Одна из задач математической статистики состоит в установлении закона распределения случайной величины Решение задач по математической статистике (генеральной совокупности) и оценке параметров этого закона.

Вид закона выбирается из каких-либо теоретических или практических соображений, а параметры следует вычислять, исходя из параметров этого закона.

Важнейшим этапом обработки статистических данных является вычисление оценок числовых характеристик исследуемой случайной величины.

Полученные оценки позволяют в числовой форме описать характерные черты статистического распределения и являются базой для построения математической модели изучаемого случайного явления.

Любая величина Решение задач по математической статистике, определяемая как функция выборочных значений Решение задач по математической статистике = Решение задач по математической статистике, называется выборочной статистикой или просто статистикой. Статистика в, используемая в качестве приближённого значения неизвестного параметра Решение задач по математической статистике, называется статистической оценкой параметра Решение задач по математической статистике.

Существует два вида оценок параметров: точечные и интервальные.

Точечной называется статистическая оценка, которая определяется одним числом.

К точечным статистическим оценкам предъявляется ряд требований.

Если Решение задач по математической статистике — статистическая оценка параметра Решение задач по математической статистике, то она должна удовлетворять следующим условиям:

1) быть несмещенной, что означает, что Решение задач по математической статистике.

2) быть состоятельной, т.е. предел по вероятности при Решение задач по математической статистике последовательности таких оценок должен быть равен искомому параметру, т.е. вероятность того, что Решение задач по математической статистике, стремится к нулю при Решение задач по математической статистике.

3) быть эффективной, т.е. дисперсия Решение задач по математической статистике — наименьшая или быть асимптотически эффективной, что означает, что Решение задач по математической статистике.

Число Решение задач по математической статистике называется точностью оценки, если имеет место равенство Решение задач по математической статистике. Если это неравенство имеет место с некоторой вероятностью Решение задач по математической статистике, то число Решение задач по математической статистике называется надёжностью оценки или уровнем надёжности. Наиболее употребительными уровнями надёжности являются Решение задач по математической статистике 0,999.

Выборочной средней Решение задач по математической статистике называют среднее арифметическое значение случайной величины Решение задач по математической статистике по выборочной совокупности объёма Решение задач по математической статистике:

Решение задач по математической статистике

Выборочная средняя служит несмещенной оценкой математического ожидания признака Решение задач по математической статистике или генеральной совокупности.

Кроме выборочной средней в статистическом анализе применяются структурные средние: медиана и мода.

Модой Мо называют варианту, которая имеет наибольшую частоту. Если распределение интервальное, то определяется модальный интервал Решение задач по математической статистике, которому соответствует наибольшая частота Решение задач по математической статистике, мода вычисляется по формуле:

Решение задач по математической статистике

где Решение задач по математической статистике — величина модального интервала; Решение задач по математической статистике — частоты предмодального и послемодального интервала.

Медианой Me называют варианту, которая делит вариационный ряд на две части, равные по числу вариант. Если Решение задач по математической статистике, а если Решение задач по математической статистике, то Решение задач по математической статистике при вычислении медианы интервального ряда распределения используется формула:

Решение задач по математической статистике

где Решение задач по математической статистике — накопленная частота интервала, предшествующего медианному, включая интервал, предшествующий медианному; Решение задач по математической статистике— — начальное значение интервала, который содержит медиану. Номер медианного интервала определяется из неравенства Решение задач по математической статистике случае выполнения равенства номер медианного интервала равен Решение задач по математической статистике, в противном случае — Решение задач по математической статистике.

Средние величины не отражают изменчивости (вариации) значений признака. Чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения Решение задач по математической статистике вводят свободную характеристику — выборочную дисперсию.

Выборочной дисперсией Решение задач по математической статистике называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения Решение задач по математической статистике:

Решение задач по математической статистике

Выборочным средним квадратическим отклонением (стандартом) называют квадратный корень из выборочной дисперсии:

Решение задач по математической статистике

Выборочная дисперсия является смещённой оценкой генеральной дисперсии, так как

Решение задач по математической статистике

В качестве несмещенной оценки генеральной дисперсии служит «исправленная» выборочная дисперсия:

Решение задач по математической статистике

При достаточно больших Решение задач по математической статистике выборочная и исправленная дисперсии мало отличаются, поэтому на практике исправленной дисперсией пользуются, если Решение задач по математической статистике< 50.

Выборочная средняя и дисперсия вариационного ряда являются частными случаями более общего понятия — выборочных (эмпирических) моментов.

Начальный момент Решение задач по математической статистике — го порядка вариационного ряда определяется по формуле

Решение задач по математической статистике

Центральный момент Решение задач по математической статистике — го порядка вариационного ряда определяется по формуле

Решение задач по математической статистике

В частности

Решение задач по математической статистике

Центральные моменты первых четырёх порядков выборки Решение задач по математической статистике выражаются через начальные моменты Решение задач по математической статистике по формулам:

Решение задач по математической статистике

Коэффициентом асимметрии вариационного ряда называется число

Решение задач по математической статистике

Эксцессом вариационного ряда называется число:

Решение задач по математической статистике

Асимметрия называется также нормированным третьим центральным моментом, а эксцесс — нормированным четвертым центральным моментом признака Решение задач по математической статистике. Знаки асимметрии и эксцесса указывают на отклонения графика закона распределения Решение задач по математической статистике от нормального распределения, для которого Решение задач по математической статистике. При Решение задач по математической статистике большая часть вариант будет расположена слева от Решение задач по математической статистике — имеет место левосторонняя асимметрия распределения, при Решение задач по математической статистике— правосторонняя. Если Решение задач по математической статистике, в этом случае распределение имеет симметричную форму (рисунок 3).

Решение задач по математической статистике

Положительное значение эксцесса указывает на то, что полигон распределения около моды имеет более высокую острую вершину, чем нормальная кривая, с тем же центром и той же дисперсией.

Отрицательное значение эксцесса имеет место для кривых с более низким и более плоским характером вершины по сравнению с нормальной кривой (см. рисунок 4).

Решение задач по математической статистике

Точечные оценки не указывают величину ошибки, которая совершается при замене Решение задач по математической статистике и Решение задач по математической статистике их приближёнными значениями (оценками). Поэтому иногда выгодно пользоваться интервальной оценкой, которая определяется двумя числами Решение задач по математической статистике и Решение задач по математической статистике — концами интервала, накрывающего оцениваемый параметр в с заданной вероятностью (надёжностью).

Пусть Решение задач по математической статистике — точечная оценка параметра Решение задач по математической статистике. Она тем лучше, чем меньше разность Решение задач по математической статистике. Тогда в качестве характеристики точности оценки можно взять некоторое Решение задач по математической статистике, такое, что Решение задач по математической статистике. Но в статистике можно говорить лишь о вероятности (надёжности) Решение задач по математической статистике, с которой выполняется это неравенство. Число Решение задач по математической статистике называется уровнем значимости.

Доверительной вероятностью оценки называется вероятность Решение задач по математической статистике выполнения неравенства Решение задач по математической статистике. Обычно у задаётся заранее и наиболее часто полагают Решение задач по математической статистике и пр. Таким образом:

Решение задач по математической статистике

Доверительный интервал — это интервал Решение задач по математической статистике, который накрывает неизвестный параметр Решение задач по математической статистике с заданной надёжностью Решение задач по математической статистике.

Границы интервала и его величина находятся по выборочным данным и поэтому являются случайными величинами в отличие от оцениваемого параметра Решение задач по математической статистике, поэтому говорят, что Решение задач по математической статистике накрывает, а не содержит истинное значение Решение задач по математической статистике.

Величина доверительного интервала существенно зависит от объёма выборки Решение задач по математической статистике (уменьшается с ростом Решение задач по математической статистике) и значения доверительной вероятности Решение задач по математической статистике (увеличивается с приближением Решение задач по математической статистике к единице).

Интервальной оценкой с надёжностью у математического ожидания а нормально распределённой случайной величины (признака) Решение задач по математической статистике по выборочной средней Решение задач по математической статистике при известном СКО Решение задач по математической статистике генеральной совокупности служит доверительный интервал

Решение задач по математической статистике

где Решение задач по математической статистике — точность оценки, Решение задач по математической статистике — объём выборки, Решение задач по математической статистике — значение аргумента функции ЛапласаРешение задач по математической статистике при котором Решение задач по математической статистике.

При неизвестном Решение задач по математической статистике (в условиях эксперимента Решение задач по математической статистике обычно неизвестно) доверительный интервал для математического ожидания Решение задач по математической статистике нормально распределённой случайной величины Решение задач по математической статистике имеет вид:

Решение задач по математической статистике

где Решение задач по математической статистике — квантиль распределения Стьюдента, определяемый по таблицам, а параметры Решение задач по математической статистике находятся по данным выборки.

При больших выборках Решение задач по математической статистике распределение Стьюдента приближается к нормальному, и тогда можно пользоваться теоремами о нормальном распределении.

Доверительный интервал для Решение задач по математической статистике задаётся неравенствами:

Решение задач по математической статистике

где Решение задач по математической статистике — квантили Решение задач по математической статистике распределения, определяемые по соответствующим таблицам по заданному уровню значимости а и числу степеней свободы Решение задач по математической статистикеРешение задач по математической статистике, либо

Решение задач по математической статистике

Величина Решение задач по математической статистике находится по таблице Решение задач по математической статистике и зависит от надежности и объема выборки.

Статистическая проверка гипотез

Статистической гипотезой называется предположение относительно параметров или вида распределения изучаемой случайной величины.

Статистические гипотезы можно разделить на следующие основные группы:

1 (гипотезы о параметрах распределения;

2)гипотезы о виде распределения.

Выдвинутую гипотезу называют нулевой и обозначают ее через Решение задач по математической статистике. Наряду с Решение задач по математической статистике рассматривают конкурирующую (или альтернативную) гипотезу Решение задач по математической статистике.

Таким образом, ставится задача проверки гипотезы Решение задач по математической статистике относительно конкурирующей гипотезы Решение задач по математической статистике на основе выборки Решение задач по математической статистике объема Решение задач по математической статистике. Правило, по которому принимается или отвергается гипотеза, называется статистическим критерием. Принципы проверки статистических гипотез впервые были сформулированы в работах известных математиков Е. Неймана и Э. Пирсона. Они исходили из того, что принимая или отвергая гипотезу Решение задач по математической статистике, можно допустить ошибки двух видов.

Ошибка первого рода: Решение задач по математической статистике отвергается (принимается Решение задач по математической статистике) в то время как в действительности верна гипотеза Решение задач по математической статистике. Вероятность ошибки первого рода называют уровнем значимости и обозначают Решение задач по математической статистике:

Решение задач по математической статистике

Величину Решение задач по математической статистике, то есть вероятность принять верную гипотезу, называют уровнем доверия (доверительным уровнем).

Ошибка второго рода: Решение задач по математической статистике принимается, в то время как верна гипотеза Решение задач по математической статистике. Вероятность ошибки второго рода обозначается Решение задач по математической статистике.

Вероятность принять гипотезу Решение задач по математической статистике если она верна, называют мощностью критерия.

Суть проверки статистической гипотезы заключается в том, что используется специально составленная выборочная характеристика (статистика) Решение задач по математической статистикеРешение задач по математической статистике, полученная по выборке Решение задач по математической статистике, так, чтобы в случае, если гипотеза Решение задач по математической статистике верна, точное или приближенное распределение Решение задач по математической статистике было бы известным. Построение критерия, в зависимости от вида гипотезы Решение задач по математической статистике, заключается в выборе таких значений Решение задач по математической статистике и Решение задач по математической статистике, что если Решение задач по математической статистике то гипотеза Решение задач по математической статистике принимается. Значения Решение задач по математической статистике и Решение задач по математической статистике называются критическими, а область Решение задач по математической статистике называется областью допустимых значений.

Множество возможных значений статистики Решение задач по математической статистике разбивается на 2 непересекающихся подмножества: критическую область — множество значений Решение задач по математической статистике, при которых Решение задач по математической статистике отвергается — Решение задач по математической статистике, и область допустимых значений — множество значений Решение задач по математической статистике, при которых Решение задач по математической статистике принимается — Решение задач по математической статистике. Если фактически наблюдаемое (полученное по выборке) значение статистики критерия Решение задач по математической статистике попадает в критическую область, то гипотезу Решение задач по математической статистике отвергают, в противном случае принимают.

Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона

Одной из задач математической статистики является установление истинного закона распределения случайной величины на основании экспериментальных данных. Критерии, устанавливающие закон распределения, называются критериями согласия.

Алгоритм применения критерия Пирсона.

1)Из генеральной совокупности образовывается случайная выборка, и на ее основе делается предположение о нормальном законе распределения. Выдвигается гипотеза Решение задач по математической статистике: «генеральная совокупность распределена нормально».

2)Вычисляются выборочные числовые характеристики Решение задач по математической статистике.

3)Вычисляются теоретические частоты:

а) Для дискретного ряда

Решение задач по математической статистике

где Решение задач по математической статистике — объем выборки, Решение задач по математической статистике — шаг (разность между двумя соседними вариантами),

Решение задач по математической статистике

Значения Решение задач по математической статистике определяются из таблицы приложения 1.

б) Для интервального ряда Решение задач по математической статистике, где Решение задач по математической статистике — объем выборки,

Решение задач по математической статистике
Решение задач по математической статистике

теоретические вероятности попадания в интервалы

Решение задач по математической статистике
Решение задач по математической статистике

функция Лапласа, значения которой определяются по таблице

4)Находится наблюдаемое значение критерия Пирсона по формуле

Решение задач по математической статистике

5)По таблице критических точек распределения Решение задач по математической статистике по заданному уровню значимости а и числу степеней свободы Решение задач по математической статистике (Решение задач по математической статистике — число групп для дискретного ряда или число интервалов для интервального ряда) находят критическую точку Решение задач по математической статистике правосторонней критической области.

6)Если Решение задач по математической статистике— нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо. Если Решение задач по математической статистике — гипотезу отвергают.

Замечание. Малочисленные варианты и интервалы (содержащие малочисленные частоты Решение задач по математической статистике) следует объединить, а соответствующие им частоты сложить. Если производилось объединение частот, то в формуле Решение задач по математической статистике следует в качестве Решение задач по математической статистике принять число групп или интервалов выборки, оставшихся после объединения частот.

Элементы теории регрессионного и корреляционного анализа

Методы теории корреляции позволяют определять зависимость между различными факторами или случайными величинами. Термин «корреляция» происходит от латинского «correlatio» — соотношение, взаимосвязь.

В естественных науках часто речь идёт о функциональной зависимости, когда каждому значению одной величины соответствует вполне определённое значение другой. Случайные величины обычно не связаны функциональной зависимостью. В большинстве случаев между переменными существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определённое, а множество возможных значений другой переменной. Такая зависимость получила название статистической (или стохастической, вероятностной).

В силу неоднозначной статистической зависимости между случайными величинами Решение задач по математической статистике и Решение задач по математической статистике для исследователя представляет интерес усреднённая схема зависимости — зависимость условного математического ожидания Решение задач по математической статистике или его статистического аналога Решение задач по математической статистике от значений Решение задач по математической статистике случайной величины Решение задач по математической статистике, то есть Решение задач по математической статистике или Решение задач по математической статистике. Здесь Решение задач по математической статистике — условная средняя, которая определяется как среднее арифметическое значений Решение задач по математической статистике, то есть Решение задач по математической статистике, соответствующих значению Решение задач по математической статистике. Такая зависимость получила название корреляционной. Корреляционной зависимостью Решение задач по математической статистике от Решение задач по математической статистике называют функциональную зависимость условной средней ух от Решение задач по математической статистике:

Решение задач по математической статистике

Уравнение (14) называют уравнением регрессии Решение задач по математической статистике на Решение задач по математической статистике; функцию Решение задач по математической статистике называют регрессией Решение задач по математической статистике на Решение задач по математической статистике, а её график -линиейрегрессии Решение задач по математической статистике на Решение задач по математической статистике.

Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей корреляционного анализа является выявление связи между случайными величинами и оценка ее тесноты. Основной задачей регрессионного анализа — установление и изучение формы зависимости между переменными.

Данные о статистической зависимости удобно представлять в виде корреляционной таблицы:

Решение задач по математической статистике

Здесь

Решение задач по математической статистике

значения случайных величин Решение задач по математической статистике и Решение задач по математической статистике соответственно, а

Решение задач по математической статистике

соответствующие частоты, Решение задач по математической статистике — частота, с которой встречается пара Решение задач по математической статистике.

По направлению корреляционная связь может быть положительной («прямой») и отрицательной («обратной»). При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака — низкие значения другого. При отрицательной корреляции соотношения обратные.

Наличие корреляции приближенно может быть определено с помощью корреляционного поля. Его получим, если нанесем на график в определенном масштабе точки, соответствующие наблюдаемым одновременным значениям двух величин Решение задач по математической статистике — если точки рассеяны хаотично, то связь между Решение задач по математической статистике и Решение задач по математической статистике отсутствует; если точки группируются около какой-то линии, то связь есть, и она тем теснее, чем ближе они группируются (рисунок 5).

Решение задач по математической статистике

Рассмотрим наиболее важный для практики случай линейной зависимости между величинами. В теории вероятностей показателем тесноты линейной зависимости являлся коэффициент корреляции, в математической статистике таким показателем является выборочный коэффициент корреляции.

Выборочным коэффициентом корреляции называется величина, рассчитываемая по формуле:

Решение задач по математической статистике

где

Решение задач по математической статистике

оценка корреляционного момента; Решение задач по математической статистике и Решение задач по математической статистике — исправленные средние квадратические отклонения.

Выборочный коэффициент корреляции обладает некоторыми свойствами:

  1. Решение задач по математической статистике;
  2. Чем ближе значение Решение задач по математической статистике к единице, тем более тесная линейная зависимость между изучаемыми величинами. В зависимости оттого, насколько Решение задач по математической статистике приближается к единице, различают слабую, умеренную, заметную, достаточно тесную и весьма тесную линейную связь.
  3. Если Решение задач по математической статистике, то говорят о прямой связи между изучаемыми величинами (т.е. с увеличением одной случайной величины увеличивается и другая), если же Решение задач по математической статистике, говорят об обратной связи (с увеличением одной случайной величины вторая уменьшается).
  4. Если все значения переменных увеличить (уменьшить) на одно и тоже число или в одно и то же число раз, то величина коэффициента корреляции не изменится. Коэффициент корреляции есть безразмерная характеристика тесноты линейной связи.
  5. При Решение задач по математической статистике корреляционная связь представляет линейную функциональную зависимость, при этом все точки поля корреляции лежат на одной прямой.
  6. При Решение задач по математической статистике или Решение задач по математической статистике близком к нулю линейная корреляционная связь отсутствует, но это не означает отсутствие другой зависимости, например, нелинейная связь может быть очень тесной.

Для ответа на вопрос о значимости коэффициента корреляции проверяют нулевую гипотезу Решение задач по математической статистике о равенстве нулю генерального коэффициента корреляции. Если гипотеза принимается, то говорят, что между Решение задач по математической статистике и Решение задач по математической статистике нет линейной корреляционной зависимости, иначе линейная зависимость признается значимой.

Для того чтобы при уровне значимости Решение задач по математической статистике проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции при конкурирующей Решение задач по математической статистике, надо вычислить наблюдаемое значение критерия:

Решение задач по математической статистике

затем, пользуясь таблицей критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы Решение задач по математической статистике найти критическую точку Решение задач по математической статистике для двухсторонней критической области. Если сравнить данные величины, то можно сделать вывод о степени коррелированности исходных признаков:

•если Решение задач по математической статистике, то верна нулевая гипотеза и, следовательно, величины Решение задач по математической статистике не коррелированны;

•если же Решение задач по математической статистике, то нулевая гипотеза отвергается.

Рассмотрим уравнение парной линейной регрессии Математическая статистика задачи с решением. Найдём формулы расчёта неизвестных параметров Математическая статистика задачи с решением и Математическая статистика задачи с решением по имеющимся статистическим данным Математическая статистика задачи с решением.

Согласно методу наименьших квадратов неизвестные параметры выбираются таким образом, чтобы сумма квадратов отклонений выборочных значений Математическая статистика задачи с решением от значений Математическая статистика задачи с решением, полученных по уравнению регрессии, была минимальна:

Математическая статистика задачи с решением

На основании необходимого условия экстремума, приравнивая нулю частные производные, получим:

Математическая статистика задачи с решением

После преобразования получаем систему нормальных уравнений для определения параметров линейной регрессии:

Математическая статистика задачи с решением

Из последней системы следуют формулы для определения параметров уравнения парной линейной регрессии Математическая статистика задачи с решением на Математическая статистика задачи с решением:

Математическая статистика задачи с решением

Уравнение регрессии Математическая статистика задачи с решением можно с учётом формулы вычисления параметра Математическая статистика задачи с решением записать в виде

Математическая статистика задачи с решением

Коэффициент Математическая статистика задачи с решением показывает, на сколько единиц в среднем изменится переменная Математическая статистика задачи с решением при увеличении переменной Математическая статистика задачи с решением на одну единицу.

Уравнение регрессии может быть использовано для прогнозирования значений Математическая статистика задачи с решением при значениях Математическая статистика задачи с решением, не указанных в корреляционной таблице.

Величину Математическая статистика задачи с решением называют остаточной дисперсией случайной величины Математическая статистика задачи с решением относительно случайной величины Математическая статистика задачи с решением; она характеризует величину ошибки, которая возникает при замене Математическая статистика задачи с решением линейной функцией. При Математическая статистика задачи с решением остаточная дисперсия равна нулю, т.е. при представлении Математическая статистика задачи с решением в виде линейной функции от Математическая статистика задачи с решением не возникает ошибки, a Математическая статистика задачи с решением и Математическая статистика задачи с решением связаны линейной функциональной зависимостью.

Кстати готовые на продажу задачи тут, и там же теория из учебников может быть вам поможет она.

Задачи с решением

Задача № 1

  • Из генеральной совокупности извлечена выборка объёма Математическая статистика задачи с решением:
Математическая статистика задачи с решением

Требуется:

1)Найти и построить эмпирическую функцию распределения;

2)Найти выборочное среднее, «исправленное» СКО, выборочную моду и медиану.

Решение:

1) Согласно определению эмпирической функции распределения её значение при любом Математическая статистика задачи с решением равно Математическая статистика задачи с решением, где Математическая статистика задачи с решением — количество элементов Математическая статистика задачи с решением; выборки, меньших, чем Математическая статистика задачи с решением — объём выборки.

Например, при

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

График эмпирической функции распределения изображён на рисунке 6.

Математическая статистика задачи с решением

2) Определим выборочное среднее выборки по формуле (2):

Математическая статистика задачи с решением

«Исправленную» дисперсию найдём, используя следующую формулу:

Математическая статистика задачи с решением

Так как мода — это варианта, которой соответствует наибольшая частота, то Математическая статистика задачи с решением.

Не сгруппированные данные образуют дискретный вариационный ряд, содержащий нечётное число вариант Математическая статистика задачи с решением:

Математическая статистика задачи с решением

Значит, медиана равна

Математическая статистика задачи с решением

Задача № 2

  • Записать в виде вариационного ряда выборку 20, 19, 12, 13, 16, 17, 17, 14, 16, 14, 13, 19, 18, 16, 14. Представить статистическое распределение выборки. Построить полигон относительных частот для статистического ряда. Вычислить числовые характеристики выборки: выборочное среднее, «исправленную» и выборочную дисперсии, «исправленное» среднеквадратическое отклонение (СКО).

Решение:

Объём выборки Математическая статистика задачи с решением. Упорядочив элементы выборки по возрастанию, получим вариационный ряд:

12, 13, 13, 14, 14, 14, 16, 16, 16, 17, 17, 18, 19, 19, 20.

Статистическое распределение исходной выборки можно записать в виде следующей таблицы:

Математическая статистика задачи с решением

Полигон относительных частот изображён на рисунке 7.

Математическая статистика задачи с решением

Находим выборочное среднее по формуле (2):

Математическая статистика задачи с решением

Для вычисления выборочной дисперсии используем формулу (5):

Математическая статистика задачи с решением

«Исправленная» дисперсия и СКО:

Математическая статистика задачи с решением

Задача № 3

  • Найти выборочное среднее, моду, медиану и выборочное СКО выборки объёмом Математическая статистика задачи с решением, распределение которой задано следующей таблицей:
Математическая статистика задачи с решением

Построить гистограмму и полигон частот.

Решение:

Для построения гистограммы все частоты необходимо разделить на длину интервала, равную 1,02, и откладывать по оси ординат. По оси абсцисс отмечаются границы интервалов (рисунок 8).

Для построения полигона частот найдем середины интервалов и дополним исходную таблицу:

Математическая статистика задачи с решением

Ломаная линия (рисунок 8) будет соединять точки с координатами Математическая статистика задачи с решением.

Математическая статистика задачи с решением

Для расчёта выборочного среднего и выборочного СКО составляем вариационный ряд, принимая в качестве вариант середины соответствующих интервалов:

Математическая статистика задачи с решением

Таким образом:

Математическая статистика задачи с решением

Так как наибольшая частота

Математическая статистика задачи с решением

отвечает интервалу 1,02 — 2,04, то

Математическая статистика задачи с решением

Мода (согласно формуле (3)) равна:

Математическая статистика задачи с решением

Определим номер медианного интервала. Так как Математическая статистика задачи с решением, то номер медианного интервала равен 3, а сам интервал — 2,04 — 3,06. Тогда, по формуле (4), получаем:

Математическая статистика задачи с решением

Задача № 4

Дан статистический ряд признака Математическая статистика задачи с решением:

Математическая статистика задачи с решением

Найти начальные и центральные моменты первых четырёх порядков признака Математическая статистика задачи с решением, а также определить асимметрию и эксцесс.

Решение:

Вычисления проводим по формулам (8) для Математическая статистика задачи с решением и по формулам (10) для Математическая статистика задачи с решением.

Начальные моменты:

Математическая статистика задачи с решением

Центральные моменты

Математическая статистика задачи с решением

Тогда, так как

Математическая статистика задачи с решением

то

Математическая статистика задачи с решением

Задача № 5

Предельная нагрузка для выборки из 50 стальных стержней характеризуется следующим рядом:

Математическая статистика задачи с решением

Считая распределение предельной нагрузки Математическая статистика задачи с решением нормальным, построить доверительные интервалы для оценки с надёжностью Математическая статистика задачи с решением средней предельной нагрузки и СКО предельной нагрузки стальных стержней партии, из которой произведена выборка.

Решение:

Вычислим выборочное среднее и исправленное СКО соответственно по формулам

Математическая статистика задачи с решением

По таблице (см. приложение 3) найдём

Математическая статистика задачи с решением

Точность оценки:

Математическая статистика задачи с решением

Доверительный интервал для средней предельной нагрузки найдём по формуле (13):

Математическая статистика задачи с решением

Доверительный интервал для СКО предельной нагрузки будем искать по формуле

Математическая статистика задачи с решением

так как

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Задача № 6

В результате эксперимента получены данные, представленные в виде статистического ряда:

Математическая статистика задачи с решением

Требуется:

1 )3аписать значения результатов эксперимента в виде вариационного ряда.

2)Представить данную выборку в виде интервального статистического ряда.

3)Найти числовые характеристики выборки:

Математическая статистика задачи с решением

4) Определить доверительные интервалы неизвестного математического ожидания и неизвестного среднего квадратического отклонения. Предполагается, что генеральная совокупность имеет нормальное распределение. Доверительную вероятность принять равной 0,95.

Решение:

1) Расположим значения результатов эксперимента в порядке возрастания, т.е. записываем вариационный ряд:

14 21 28 30 30 32 33 35 38 39 40 41 41 42 42 42 43 44 45 45 46 4747 47 48 48 49 49 50 51 52 53 54 54 56 57 58 58 59 59 60 60 60 60 61 61 65 67 72 77.

2) Объём выборки Математическая статистика задачи с решением. Наибольшая варианта — 77, наименьшая — 14. Найдём длину интервала:

Математическая статистика задачи с решением

Выбираем длину интервала 9. Интервальный статистический ряд примет вид:

Математическая статистика задачи с решением

3) Для вычисления числовых характеристик составляем вариационный ряд, принимая в качестве вариант середины соответствующих интервалов:

Математическая статистика задачи с решением

Таким образом:

Математическая статистика задачи с решением

4) Доверительный интервал для оценки математического ожидания нормально распределённой случайной величины найдём по формуле:

Математическая статистика задачи с решением

Из приложения 3 для Математическая статистика задачи с решением находим Математическая статистика задачи с решением. Далее

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Доверительный интервал для оценки а нормального распределения по несмещённой оценке Математическая статистика задачи с решением определяется из неравенства

Математическая статистика задачи с решением

где величина

Математическая статистика задачи с решением

определяется из таблицы (приложение 4).

Имеем

Математическая статистика задачи с решением

При

Математическая статистика задачи с решением

в таблице приложения находим

Математическая статистика задачи с решением

Следовательно,

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Значит,

Математическая статистика задачи с решением

Задача № 7

  • Требуется при уровне значимости Математическая статистика задачи с решением проверить по критерию согласия Пирсона гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические частоты Математическая статистика задачи с решением и теоретические частоты Математическая статистика задачи с решением:
Математическая статистика задачи с решением

Решение:

Определим наблюдаемое значение критерия Пирсона по формуле

Математическая статистика задачи с решением

В таблице критических точек Математическая статистика задачи с решением (приложение 5) находим при уровне значимости Математическая статистика задачи с решением значение Математическая статистика задачи с решением (имеем Математическая статистика задачи с решениемстепени свободы). Значение Математическая статистика задачи с решениемСледовательно, выдвинутая гипотеза о нормальном распределении генеральной совокупности не отвергается.

Задача № 8

  • Из генеральной совокупности извлечена выборка, представленная в виде ряда.

Требуется проверить, согласуются ли выборочные данные с гипотезой о нормальном распределении случайной величины Математическая статистика задачи с решением с помощью критерия согласия Пирсона при уровне значимости Математическая статистика задачи с решением, разбив отрезок Математическая статистика задачи с решением на Математическая статистика задачи с решением интервалов одинаковой длины. Величину Математическая статистика задачи с решением рассчитать по формуле Стерджеса Математическая статистика задачи с решениемМатематическая статистика задачи с решением.

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Решение:

Подсчитаем количество интервалов разбиения:

Математическая статистика задачи с решением

Из ряда видно, что

Математическая статистика задачи с решением

поэтому

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Границы интервалов будут:

Математическая статистика задачи с решением

Частота Математическая статистика задачи с решением— интервала Математическая статистика задачи с решением подсчитывается с помощью ряда как число наблюдений, попавших в интервал. Так в первый Математическая статистика задачи с решением интервал ) 0,6; 1,11 попало 7 значений, во второй [1,1; 1,6[ — 14 значений. Сведём полученные данные в таблицу:

Математическая статистика задачи с решением

Объем выборки равен

Математическая статистика задачи с решением

Выборочное среднее и дисперсия определяются по формулам:

Математическая статистика задачи с решением

Найдём теоретические вероятности Математическая статистика задачи с решением по формуле

Математическая статистика задачи с решением

где Математическая статистика задачи с решением — функция Лапласа, значения которой даются в приложении 3. Результаты вычислений сведём в таблицу:

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Вычислим наблюдаемое значение критерия Пирсона. Для этого составим следующую расчетную таблицу:

Математическая статистика задачи с решением

По таблице критических точек распределения Математическая статистика задачи с решением, уровню значимости Математическая статистика задачи с решением и числу степеней свободы

Математическая статистика задачи с решением

находим

Математическая статистика задачи с решением

Так как

Математическая статистика задачи с решением

то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности.

Задача № 9

  • По заданной таблице зависимости признаков Математическая статистика задачи с решением и Математическая статистика задачи с решением
Математическая статистика задачи с решением

вычислить выборочный коэффициент корреляции и остаточную дисперсию. Записать уравнения прямой регрессии Математическая статистика задачи с решением на Математическая статистика задачи с решением. Построить корреляционное поле и линию регрессии на корреляционном поле.

Решение:

Вычислим основные выборочные характеристики: Выборочные средние:

Математическая статистика задачи с решением

Найдем оценки для средних квадратичных отклонений и корреляционного момента, для чего составим следующую вспомогательную таблицу:

Математическая статистика задачи с решением

Согласно формуле (15):

Математическая статистика задачи с решением

Найдем методом наименьших квадратов эмпирическую формулу вида Математическая статистика задачи с решениемМатематическая статистика задачи с решением. Составим систему нормальных уравнений (17) для определения параметров линейной регрессии. Так как

Математическая статистика задачи с решением

Уравнение регрессии Математическая статистика задачи с решением наМатематическая статистика задачи с решением имеет вид:

Математическая статистика задачи с решением

Остаточная дисперсия:

Математическая статистика задачи с решением

Корреляционное поле и линия регрессии на корреляционном поле изображены на рисунке 9.

Математическая статистика задачи с решением

Задача № 10

  • Таблица значений признака Математическая статистика задачи с решением при данных значениях признака Математическая статистика задачи с решением имеет вид:
Математическая статистика задачи с решением

Построить корреляционное поле. Найти выборочный коэффициент корреляции, оценить его значимость. Записать уравнения прямой линии регрессии Математическая статистика задачи с решением на Математическая статистика задачи с решением.

Решение:

Корреляционное поле данной двумерной выборки приведено на рисунке 10.

Математическая статистика задачи с решением

По виду поля корреляции можно судить о том, что между величинами существует зависимость.

Для вычисления выборочных числовых характеристик составляем следующую расчётную таблицу:

Математическая статистика задачи с решением

Замечание. Строка

Математическая статистика задачи с решением

получается следующим образом:

Математическая статистика задачи с решением

Столбец

Математическая статистика задачи с решением

Вычислим выборочные средние

Математическая статистика задачи с решением
Математическая статистика задачи с решением

«Исправленные» дисперсии находим по формулам:

Математическая статистика задачи с решением

Оценку корреляционного момента вычисляем по формуле:

Математическая статистика задачи с решением

Рассчитав все нужные величины, можно вычислить выборочный коэффициент корреляции:

Математическая статистика задачи с решением

Для оценки значимости выборочного коэффициента корреляции вычислим наблюдаемое значение критерия, воспользовавшись формулой (16):

Математическая статистика задачи с решением

Затем по таблице критических точек распределения Стьюдента, по заданному уровню значимости Математическая статистика задачи с решением и числу степеней свободы Математическая статистика задачи с решением найдем критическую точку Математическая статистика задачи с решением для двухсторонней критической области:

Математическая статистика задачи с решением

Сравнивая Математическая статистика задачи с решением, получим, что Математическая статистика задачи с решением, следовательно, величиныМатематическая статистика задачи с решением коррелированы.

Оценкой теоретической линии регрессии является эмпирическая линия регрессии, уравнение которой имеет вид

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

Задача № 11

Из генеральной совокупности извлечена выборка, представленная в виде статистического ряда:

Математическая статистика задачи с решением

Требуется:

1)вычислить выборочное среднее Математическая статистика задачи с решением, выборочную дисперсию Математическая статистика задачи с решением, исправленную выборочную дисперсию Математическая статистика задачи с решением и среднее квадратичное отклонение Математическая статистика задачи с решением;

2)найти размах варьирования; моду и медиану;

3)построить полигон частот и эмпирическую функцию распределения;

4)провсрить, согласуются ли выборочные данные с гипотезой о нормальном распределении случайной величины Математическая статистика задачи с решением графически и с помощью критерия согласия Пирсона при уровне значимости Математическая статистика задачи с решением, представив данную выборку в виде интервального ряда. Количество интервалов рассчитать по формуле Стерджеса Математическая статистика задачи с решением;

5)найти с доверительной вероятностью Математическая статистика задачи с решениемдоверительный интервал для математического ожидания, а также доверительный интервал для Математическая статистика задачи с решением.

Решение:

1) Объем выборки равен

Математическая статистика задачи с решением

Выборочное среднее определим по формуле:

Математическая статистика задачи с решением

Для нахождения выборочной дисперсии составим следующую вспомогательную таблицу:

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Исправленное среднее квадратичное отклонение будет

Математическая статистика задачи с решением

2) Размах варьирования находится по формуле

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Так как мода — это варианта, которой соответствует наибольшая частота, то

Математическая статистика задачи с решением

Не сгруппированные данные образуют дискретный вариационный ряд, содержащий чётное число вариант Математическая статистика задачи с решением, поэтому Математическая статистика задачи с решениемМатематическая статистика задачи с решением

3) Согласно определению эмпирической функции распределения ее значение при любом Математическая статистика задачи с решением равно Математическая статистика задачи с решением где Математическая статистика задачи с решением — количество элементов Математическая статистика задачи с решением выборки, меньших, чем Математическая статистика задачи с решением.

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

График эмпирической функции распределения:

Математическая статистика задачи с решением

Полигон частот изображен на рисунке:

Математическая статистика задачи с решением

4) Так как полигон частот по форме напоминает кривую Гаусса, то можно сделать предположение о том, что случайная величина Математическая статистика задачи с решением распределена по нормальному закону. Проверим данное утверждение по критерию Пирсона. Вычислим количество интервалов:

Математическая статистика задачи с решением

Длина интервала

Математическая статистика задачи с решением

Границы интервалов будут:

Математическая статистика задачи с решением

Посчитаем число выборочных значений, попавших в каждый интервал. Частота Математическая статистика задачи с решением интервала Математическая статистика задачи с решением подсчитывается с помощью ряда, как число наблюдений, попавших в интервал. Так, в первый Математическая статистика задачи с решением интервал [4; 5,2] попало 3 значения; во второй Математическая статистика задачи с решением — [5,2; 6,4] попало 7 значений. Аналогично получаем частоты 3-7 интервалов.

Полученные данные сведём в следующую таблицу:

Математическая статистика задачи с решением

Найдем теоретические вероятности Математическая статистика задачи с решением по формуле:

Математическая статистика задачи с решением

Результаты вычислений сведем в таблицу:

Математическая статистика задачи с решением

Так как ожидаемые (эмпирические) частоты первого и седьмого интервалов группировки не удовлетворяют условию Математическая статистика задачи с решением5, объединим эти интервалы (первый со вторым; а седьмой — с шестым).

Вычислим наблюдаемое значение критерия Пирсона. Для этого составим

Математическая статистика задачи с решением

По таблице критических точек распределения Математическая статистика задачи с решением, уровню значимости Математическая статистика задачи с решениемМатематическая статистика задачи с решением и числу степеней свободы Математическая статистика задачи с решением находим Математическая статистика задачи с решением. Так как

Математическая статистика задачи с решением

то гипотеза о нормальном распределении принимается.

5) Доверительный интервал для математического ожидания найдём по формуле

Математическая статистика задачи с решением

Значение Математическая статистика задачи с решением определим по таблице для доверительной вероятности

Математическая статистика задачи с решением

и объёму выборки

Математическая статистика задачи с решением
Математическая статистика задачи с решением

Тогда доверительный интервал имеет вид:

Математическая статистика задачи с решением

Задача № 12

По заданной таблице зависимости признаков Математическая статистика задачи с решением и Математическая статистика задачи с решением:

1}Вычислить выборочный коэффициент корреляции; проверить его на значимость, приняв Математическая статистика задачи с решением.

2)Методом наименьших квадратов выровнять зависимость Математическая статистика задачи с решением от Математическая статистика задачи с решением по прямой Математическая статистика задачи с решением.

3)Вычислить остаточную дисперсию, сделать вывод.

4)Построить корреляционное поле и линию регрессии на корреляционном поле.

Математическая статистика задачи с решением

Решение:

Найдём выборочные средние х, у, а также оценки для средних квадратичсских отклонений и корреляционного момента, для чего составим следующую вспомогательную таблицу:

Математическая статистика задачи с решением

Здесь

Математическая статистика задачи с решением

Тогда

Математическая статистика задачи с решением

Выборочное значение коэффициента корреляции:

Математическая статистика задачи с решением

Проверим значимость полученного выборочного коэффициента корреляции. Найдём наблюдаемое значение критерия:

Математическая статистика задачи с решением

По таблице критических точек распределения Стьюдента, по уровню значимости Математическая статистика задачи с решением и числу степеней свободы Математическая статистика задачи с решением находим критическую точку двусторонней критической области Математическая статистика задачи с решением.

Так как Математическая статистика задачи с решением, то отвергаем гипотезу о равенстве нулю генерального коэффициента корреляции, значит Математическая статистика задачи с решением и Математическая статистика задачи с решением-коррелированы.

Математическая статистика задачи с решением

Запишем нормальную систему уравнений. Так как

Математическая статистика задачи с решением
Математическая статистика задачи с решением

то

Математическая статистика задачи с решением

Решая систему по формулам Крамера, получим:

Математическая статистика задачи с решением

Следовательно, зависимость между величинами Математическая статистика задачи с решением и Математическая статистика задачи с решением выражается приближённой формулой

Математическая статистика задачи с решением

3) Остаточная дисперсия:

Математическая статистика задачи с решением

То сеть величина ошибки, которая возникает при замене Математическая статистика задачи с решением линейной функцией, невелика можно сделать вывод, что между величинами Математическая статистика задачи с решением и Математическая статистика задачи с решением существует приближённая линейная зависимость.

4) Корреляционное поле и линия регрессии на корреляционном поле представлены на следующем рисунке:

Математическая статистика задачи с решением

Возможно эти страницы вам будут полезны:

Примеры решения задач по всем темам математической статистики

Математическая статистика – раздел математики, разрабатывающий методы регистрации, описания и анализа данных наблюдений и экспериментов с целью построения вероятностных моделей массовых случайных явлений.

Статистическое описание применяют к таким физическим процессам, для которых результат отдельного измерения не может быть предсказан с необходимой точностью. Тем не менее, при проведении достаточто большого числа повторных измерений может быть с достаточно хорошей точностью предсказана некоторая величина, являющаяся функцией результатов измерений.

При построении моделей в математической статистике предполагают вероятностную природу наблюдаемых явлений и используют математический аппарат теории вероятностей. Хотя математическая статистика и опирается на методы и понятия теории вероятностей, но можно сказать, что в каком-то смысле математическая статистика решает обратные задачи.

Основные понятия и задачи математической статистики

Математическая статистика — это наука, изучающая методы сбора, систематизации и интерпретации числовых (случайных) данных,

В этом определении интерпретация и систематизация данных рассматривается как существенный аспект.

Главная цель статистики — получение осмысленных заключений из несогласованных (подверженных разбросу) данных.

Действительно, исключая тривиальные ситуации, реальные данные всегда являются несогласованными, что требует применения статистических методов. Рассогласованность (разброс) между индивидуальными наблюдениями может быть, например, обусловлена ошибкой при считывании позиции стрелки прибора, когда она расположена между двумя делениями шкалы стрелочного прибора. Изменчивость может быть также следствием нестабильности работы электронного оборудования при передаче сообщений по радио или телеграфу. (В последнем случае для характеристики ситуации используется термин «шум»).

Чем же конкретно занимается математическая статистика? Какие задачи решает?

Выборочные распределения

Статистика должна получить свои выводы, используя наличную выборку. Каждое наблюдение является реализацией некоторой случайной величины. Известно множество значений, которые может принимать случайная величина; некоторые из них имеют большую возможность появления, чем другие.

Значение, которое наблюдалось, представляет собой реализацию. Вероятности возможных реализаций характеризуются распределением вероятностей случайных величин (СБ). Обычно функции распределения вероятностей бывают заданы с точностью до одного, двух параметров значений некоторых неизвестных. Это приводит к проблеме поиска таких комбинаций выборочных значений, которые бы давали наилучшее приближение для неизвестных параметров. Каждая такая комбинация и есть статистика. Выборочное распределение статистики поволяет судить, может ли предложенная статистика служить оценкой интересующего нас параметра,

Оценки, тесты (критерии значимости), решения Проблема оценивания была схематично рассмотрена выше. Ясно, что разумная процедура оценивания не должна ограничиваться лишь выбором приближенного численного значения для неизвестного параметра; она должна что-то говорить и о надежности этого приближения. Обычно говорят о точечном оценивании и об интервальном оценивании.

Существуют различные методы конструирования точечных оценок и определения их надежности. Наиболее полезным из них является метод максимального правдоподобия (ММП). Другой известный метод, который можно рассматривать либо как специальный случай ММП, либо как независимую процедуру подгонки, — метод наименьших квадратов.

Интервальное оценивание связано с определением «доверительных интервалов», правдоподобных интервалов, байесовских интервалов.

Поскольку статистика в целом основана на случайной изменчивости, каждая оценка подвержена ошибке. Так, если получены две различные оценки параметра — одна при одном наборе условий, а другая -при другом, непосредственно неясно, соответствует ли имеющееся между ними различие различию между параметрами. Вопрос об их различии решается с помощью статистического критерия (теста) или критерия значимости.

Один из подходов к статистическим критериям (проверки гипотез) связан с именем Р.А. Фишера, который рассматривает проверку гипотезы как пробный шаг в проведении научного исследования, позволяющий получить ученому объективный критерий, с помощью которого можно судить об истинности гипотезы.

Другой подход связан в основном с именами Дж. Неймана и Э. Пирсона, которые рассматривают процедуру проверки гипотезы как правило, с помощью которого должен быть сделан выбор либо принято решение об истинности одной гипотезы в противоречие другой.

Одна из частных проблем теории проверки статистических гипотез -оценка пригодности модели, предложенной для объяснения (интерпретации) данных, При этом необходимо решить: насколько предложенная модель соответствует выборке? И являются ли выборочные значения действительно близкими к тем, которые можно ожидать, используя подогнанную модель? Наиболее широко для решения подобных вопросов применяется процедура, предложенная Карлом Пирсоном и использующая критерий, основанный на ее выборочном распределении. Это пирсоновский критерий согласия хи-квадрат.

Генеральной совокупностью случайной величины

Статистическая устойчивость случайных явлений проявляется лишь при большом (в пределе — бесконечно большом) числе наблюдений. Однако на практике реальное число наблюдений ограничено. Поэтому характеристики случайных величин (СВ), определенные по малому числу наблюдений, в принципе не должны совпадать с величинами тех же характеристик, определенными по большому числу наблюдений (условия опыта остаются неизменными). Чтобы провести различие между характеристиками СВ, найденными по достаточно большому и малому числу наблюдений, в математической статистике введены понятия абстрактной генеральной совокупности и выборки.

Генеральной совокупностью случайной величины Примеры решения задач по математической статистике называется множество всех значений, которые может принимать случайная величина Примеры решения задач по математической статистике.

Выпорка представляет собой совокупность ограниченного числа наблюдений.

В соответствии с этим различают выборочные характеристики СВ, найденные по ограниченному числу наблюдений (выборке) и зависящие от числа наблюдений, и соответствующие им характеристики в генеральной совокупности, не зависящие от числа наблюдений. При этом выборочные характеристики рассматриваются как оценки соответствующих характеристик в генеральной совокупности.

На практике во многих случаях функция распределения рассматриваемой случайной величины Примеры решения задач по математической статистике неизвестна; ее определяют по результатам наблюдений или, как говорят, по выборке.

Выборкой объемом Примеры решения задач по математической статистике для данной случайной величины Примеры решения задач по математической статистике называется последовательность Примеры решения задач по математической статистике независимых наблюдений этой величины.

Пусть из генеральной совокупности извлечена выборка, причем

Примеры решения задач по математической статистике

Объем выборки:

Примеры решения задач по математической статистике

Наблюдаемые значения Примеры решения задач по математической статистике называют вариантами, а последовательность вариантов, записанных в возрастающем порядке, — вариационным рядом.

Число наблюдений называют частотами, а их отношение к объему выборки: Примеры решения задач по математической статистике — относительными частотами (частостями).

В статистике различают малые и большие выборки.

Малой выборкой считают такую выборку, при обработке которой методами, основанными на группировании наблюдений, нельзя достичь заданных точности и достоверности.

Больший считают такую выборку, при обработке которой можно перейти к группированию наблюдений без ощутимой потери информации и достижению заданных значений точности и достоверности.

Если выборка достаточно велика, то построенный на ее основе вариационный ряд неудобен для дальнейшего статистического анализа. В Этом случае строится гак называемый группированный статистический ряд.

Группирование данных, гистограмма, полигон

При группировании данных необходимо соблюдать определенные правила. Рассмотрим наиболее важные из них:

  1. Объем выборки должен быть достаточно велик Примеры решения задач по математической статистике.
  2. Число интервалов группирования Примеры решения задач по математической статистике (число групп) должно находиться в интервале Примеры решения задач по математической статистике. При выборе Примеры решения задач по математической статистике в каждом конкретном случае следует помнить, что при малом числе групп определение вида теоретической кривой распределения по эмпирическим данным может быть затруднено из-за маскировки (утраты) резких изменений кривой распределения, если они фактически имели место. При большом числе групп и незначительном объеме выборки будет наблюдаться большое количество пропусков (ноль попаданий в группу), что будет обусловлено не столько видом распределения, сколько недостатком статистики, кроме того, в этом случае даже небольшие случайные колебания приводят к искажению кривой распределения.
  3. Необходимо, по возможности, охватывать всю область данных, так как при неизвестных предельных значениях невозможно вычислить некоторые числовые характеристики выборки.
  4. Интервалы не должны перекрываться. Не должно возникать никаких сомнений относительно того, в какой интервал попадает любое значение.
  5. Если заведомо известно, что теоретическая кривая может быть двумодальной, число групп может быть увеличено в 1,5-2 раза по сравнению с оптимальным числом Примеры решения задач по математической статистике.

Оптимальное число групп Примеры решения задач по математической статистике выборки объемом Примеры решения задач по математической статистике рассчитывается по формулам:

• при известном значении

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

• при неизвестном значении Примеры решения задач по математической статистике, но известно, что

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

• согласно формуле Стерджесса:

Примеры решения задач по математической статистике

Из (8.3) видно, что для увеличения оптимального количества интервалов на единицу необходимо увеличить объем выборки вдвое, Шаг группирования (ширина интервала) Примеры решения задач по математической статистике определяется по формуле:

Примеры решения задач по математической статистике

Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма и кумулятивная кривая.

Гистограммой распределения, или просто гистограммой называется чертеж в прямоугольной системе координат, горизонтальная ось которого разбивается на Примеры решения задач по математической статистике равных интервалов (групп) шириной Примеры решения задач по математической статистике. На каждом отрезке, как на основании, строится прямоугольник с высотой, равной частоте (частости) Примеры решения задач по математической статистике соответствующего интервала.

Полигоном распределения. или просто полигоном называется ломаная линия, соединяющая середины верхних оснований каждого столбца гистограммы. За пределами гистограммы как слева, так и справа размещают пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс.

Кумулятивная кривая (кумулята) — кривая накопления частот (час-гостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки

Примеры решения задач по математической статистике

Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината — накопленной частоте (частости), равной нулю. Остальные точки этой ломаной соответствуют концам интервалов.

Пример № 1

Построить полигон, гистограмму и кумуляту по выборке объема Примеры решения задач по математической статистике. Сгруппированные данные приведены в таблице.

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

Статистическая (эмпирическая) функция распределения

Статистическим распределением выборки называют перечень вариантов и соответствующих им частот или относительных частот (частосгпей).

В теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике — соответствие между наблюдаемыми значениями и их частотами или относительными частотами.

Пример № 2

Задана выборка объемом Примеры решения задач по математической статистике с соответствующими частотами. Необходимо найти частости (относительные частоты).

Примеры решения задач по математической статистике

Контроль:

Примеры решения задач по математической статистике

Пусть исследуется статистическое распределение частот количественного признака (случайной величины) Примеры решения задач по математической статистике. Введем обозначение:

Примеры решения задач по математической статистике — число наблюдений, при которых отслеживалось значение признака меньшее Примеры решения задач по математической статистике;

Примеры решения задач по математической статистике — общее число наблюдений (объем выборки). Очевидно, что относительная частота (частость) события Примеры решения задач по математической статистике равна Примеры решения задач по математической статистике.

Статистической функцией распределения случайной величины Примеры решения задач по математической статистике называется функция, определяющая для каждого значения Примеры решения задач по математической статистике относительную частоту события Примеры решения задач по математической статистике:

Примеры решения задач по математической статистике

Сравним статистическую и интегральную функции распределения. Вспомним (теорема Бернулли), что относительная частота события Примеры решения задач по математической статистике, то есть Примеры решения задач по математической статистике стремится по вероятности к вероятности Примеры решения задач по математической статистике этого события.

Функция Примеры решения задач по математической статистике обладает теми же свойствами, что и Примеры решения задач по математической статистике:

  1. Значения Примеры решения задач по математической статистике.
  2. Эмпирическая функция распределения Примеры решения задач по математической статистике— неубывающая.
  3. Если Примеры решения задач по математической статистике — наименьшая варианта, то Примеры решения задач по математической статистике при Примеры решения задач по математической статистике.
  4. Если Примеры решения задач по математической статистике — наибольшая варианта, то Примеры решения задач по математической статистике при Примеры решения задач по математической статистике.

Пример № 3

Построить эмпирическую функцию по данной выборке:

Примеры решения задач по математической статистике

Решение:

Найдем объем выборки Примеры решения задач по математической статистике = 12 + 18 + 30 = 60. Теперь найдем статистическую функцию распределения:

Примеры решения задач по математической статистике

Представим Примеры решения задач по математической статистике в аналитическом и графическом виде:

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

Выборочные значения и оценка параметров

Рассмотрим один из возможных методов оценивания среднего значения и дисперсии случайной величины Примеры решения задач по математической статистике по Примеры решения задач по математической статистике независимым наблюдениям:

Примеры решения задач по математической статистике

Здесь Примеры решения задач по математической статистике и Примеры решения задач по математической статистике — выборочное среднее и выборочная дисперсия соответственно. Индекс в формуле Примеры решения задач по математической статистике (см. 8.7) указывает на смещенность оценки дисперсии. Наряду с вышеприведенными характеристиками, при обработке результатов наблюдений обычно находят следующие оценки:

• выборочная дисперсия (несмещенная)

Примеры решения задач по математической статистике

♦ среднее квадратическое отклонение

Примеры решения задач по математической статистике

• выборочный коэффициент асимметрии

Примеры решения задач по математической статистике

выборочный коэффициент эксцесса

Примеры решения задач по математической статистике

Для установления качества или «правильности» любой оценки используются свойства (требования) «хороших оценок».

Требования «хороших оценок»

1 Несмещенность.

Во-первых, желательно, чтобы математическое ожидание оценки равнялось оцениваемому параметру:

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике — оценка параметра Примеры решения задач по математической статистике. Если свойство (8.12) имеет место, то оценка называется несмещенной.

2, Эффективность,

Во-вторых, желательно, чтобы среднеквадратическая ошибка данной оценки была наименьшей среди всех возможных оценок, то есть:

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике — исследуемая оценка, a Примеры решения задач по математической статистике — любая другая оценка. Если по свойство имеет место, то оценка Примеры решения задач по математической статистике называется эффективной.

3* Состоятельность,

В-третьих, желательно, чтобы оценка сходилась к оцениваемому параметру с вероятностью, стремящейся к единице по мере увеличения размера выборки, то есть для любого Примеры решения задач по математической статистике

Примеры решения задач по математической статистике

Если выполнено условие (8,14), то оценка называется состоятельной. Из неравенства Чебышева следует, что достаточным для выполнения (8.14) является условие:

Примеры решения задач по математической статистике

В качестве примера «хорошей оценки» рассмотрим оценку среднего значения (8.6). Математическое ожидание выборочного среднего Примеры решения задач по математической статистике равно:

Примеры решения задач по математической статистике

Следовательно, согласно (8.12), оценка Примеры решения задач по математической статистике несмещенная.

Среднеквадратическая ошибка выборочного среднего Примеры решения задач по математической статистике равна:

Примеры решения задач по математической статистике

Поскольку наблюдения Примеры решения задач по математической статистике, независимы, то математическое ожидание членов, содержащих смешанные произведения, равны нулю. Поэтому из (8.17) получим:

Примеры решения задач по математической статистике

Таким образом, согласно (8.15) оценка Примеры решения задач по математической статистике — состоятельная. Можно показать, что эта оценка эффективна.

Рассмотрим оценку дисперсии по формуле (8.7).

Примеры решения задач по математической статистике

Однако

Примеры решения задач по математической статистике

Поскольку

Примеры решения задач по математической статистике

то, подставив получим:

Примеры решения задач по математической статистике

Следовательно, оценка Примеры решения задач по математической статистике — смещенная.

Хотя оценка (выборочная дисперсия) Примеры решения задач по математической статистике и является смещенной, она состоятельна и эффективна. Из (8.21) понятно, что для получения несмещенной оценки Примеры решения задач по математической статистике следует взять несколько видоизмененную выборочную дисперсию (8.8).

Интервальное оценивание

Ранее мы обсудили использование выборочных значений в качестве оценок параметров случайных величин. Однако такие процедуры дают только точечные оценки интересующих нас параметров и не позволяют судить о степени близости выборочных значений к оцениваемому параметру. Более предпочтительная процедура — построения интервала, который накрывает оцениваемый параметр с известной степенью достоверности, Такой подход называется «интервальным оцениванием».

Сразу отметим следующее: чем больше уверенность в том, что оцениваемый параметр лежит в интервале, тем шире интервал.

Так что искать интервал, накрывающий параметр с вероятностью, равной единице, бессмысленно. Это вся область Примеры решения задач по математической статистике, то естьПримеры решения задач по математической статистике.

Пусть для параметра Примеры решения задач по математической статистике получена несмещенная оценка Примеры решения задач по математической статистике. Мы хотим оценить возможную при этом ошибку. Назначим некоторую достаточно большую вероятность Примеры решения задач по математической статистике (например: Примеры решения задач по математической статистике …)„ такую, что событие с вероятностью Примеры решения задач по математической статистике можно считать практически достоверным, и найдем такое значение Примеры решения задач по математической статистике, для которого выполняется соотношение

Примеры решения задач по математической статистике

Тогда диапазон практически возможных значений ошибки, возникающей при замене Примеры решения задач по математической статистике на Примеры решения задач по математической статистике будет равен Примеры решения задач по математической статистике Ошибки, большие по абсолютной величине Примеры решения задач по математической статистике будут появляться с малой вероятностью Примеры решения задач по математической статистике. Запишем (9.1) в другом виде:

Примеры решения задач по математической статистике

То есть неизвестное значение параметра Примеры решения задач по математической статистике с вероятностью Примеры решения задач по математической статистике попадает в интервал

Примеры решения задач по математической статистике

Ранее (в теории вероятностей) мы рассматривали вероятность попадания случайной величины на некоторый интервал. У нас же а не случайная величина, а интервал случаен, здесь корректно говорить о вероятности Примеры решения задач по математической статистике накрыть точку а.

Вероятность Примеры решения задач по математической статистике принято называть доверительной вероятностью, а интервал Примеры решения задач по математической статистике — доверительным интервалом.

Рассмотрим задачу нахождения доверительных границ Примеры решения задач по математической статистике и Примеры решения задач по математической статистике параметра Примеры решения задач по математической статистике, имеющего несмещенную оценку Примеры решения задач по математической статистике. Если бы нам был известен закон распределения величины Примеры решения задач по математической статистике, то из выражения (9.1) нахождение Примеры решения задач по математической статистике при заданной Примеры решения задач по математической статистике не представляло бы затруднений. Однако, как правило, мы не знаем закон распределения случайной величины Примеры решения задач по математической статистике.

Пусть теперь распределение случайной величины Примеры решения задач по математической статистике отлично от нормального. Применяя центральную предельную теорему, получаем следующий результат.

С увеличением объема выборки Примеры решения задач по математической статистике выборочное распределение выборочного среднего Примеры решения задач по математической статистике стремится к нормальному распределению независимо от вида распределения исходной случайной величины.

Практически во многих случаях выборочное Примеры решения задач по математической статистике можно считать нормальным уже при Примеры решения задач по математической статистике, а при Примеры решения задач по математической статистике приближение будет хорошим.

В качестве примера рассмотрим задачу нахождения доверительного интервала математического ожидания, Пусть произведено Примеры решения задач по математической статистике независимых опытов над случайной величинойПримеры решения задач по математической статистике с неизвестными Примеры решения задач по математической статистике.

Для этих параметров выберем оценки:

Примеры решения задач по математической статистике

Необходимо построить доверительный интервал Примеры решения задач по математической статистике соответствующий доверительной вероятности Примеры решения задач по математической статистике:

Примеры решения задач по математической статистике

Интервальная оценка математического ожидания при известной дисперсии

Пусть СВ Примеры решения задач по математической статистике имеет гауссово распределение с параметрами Примеры решения задач по математической статистике причем Примеры решения задач по математической статистике неизвестно значение Примеры решения задач по математической статистике известно. Тогда эффективной оценкой параметра Примеры решения задач по математической статистике будет Примеры решения задач по математической статистике.

При этом Примеры решения задач по математической статистике имеет нормальное распределение

Примеры решения задач по математической статистике

Статистика (оценка) СВ

Примеры решения задач по математической статистике

имеет распределение Примеры решения задач по математической статистике, независимо от параметра Примеры решения задач по математической статистике, и как функция Примеры решения задач по математической статистике — непрерывна и монотонна. Вспомним, что Примеры решения задач по математической статистике. Тогда, с учетом (9.2), запишем:

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике ~ квантили стандартного нормального распределения Примеры решения задач по математической статистике, причем Примеры решения задач по математической статистике Подставим Примеры решения задач по математической статистике в явном виде в (9.6):

Примеры решения задач по математической статистике

Запишем это неравенство относительно Примеры решения задач по математической статистике:

Примеры решения задач по математической статистике

Квантили стандартного нормального распределения определяются по таблицам, тогда окончательно получим:

Примеры решения задач по математической статистике

Искомый доверительный интервал математического ожидания нормально распределенной СВ с известной дисперсией равен:

Примеры решения задач по математической статистике

На рис. 9.1 представлена плотность распределения стандартного нормального распределения с отмеченными квантилями Примеры решения задач по математической статистике.

Примеры решения задач по математической статистике

Интервальная оценка математического ожидания при неизвестной дисперсии

На практике почти всегда генеральная дисперсия Примеры решения задач по математической статистике (как и оцениваемое математическое ожидание Примеры решения задач по математической статистике) неизвестна. Итак, имеется нормально распределенная СВ

Примеры решения задач по математической статистике

с неизвестными параметрами Примеры решения задач по математической статистике и Примеры решения задач по математической статистике случайной выборке найдем несмещенные, эффективные оценки

Примеры решения задач по математической статистике

Построение интервальной оценки основано на статистике:

Примеры решения задач по математической статистике

Вспомним, что

Примеры решения задач по математической статистике

и подставим в (9.11):

Примеры решения задач по математической статистике

Числитель выражения (9.12), как было показано выше, имеет стандартное нормальное распределение Примеры решения задач по математической статистике. Показано, что величина Примеры решения задач по математической статистике имеет Примеры решения задач по математической статистике распределение с Примеры решения задач по математической статистике степенями свободы. А статистика Примеры решения задач по математической статистике имеет распределение Стыодснта с Примеры решения задач по математической статистике степенями свободы. Распределение Стьюдента не зависит от неизвестных параметров распределения случайной величины Примеры решения задач по математической статистике, а зависит лишь от числа Примеры решения задач по математической статистике.

Следует отметить, что распределение Стьюдента напоминает нормальное распределение, и при Примеры решения задач по математической статистике сколь угодно близко приближается к нему.

Число степеней свободы Примеры решения задач по математической статистике определяется как общее число Примеры решения задач по математической статистике наблюдений (вариантов) случайной величины Примеры решения задач по математической статистике минус число уравнений, связывающих эти наблюдения, то есть Примеры решения задач по математической статистике

Так, например, для распределения Примеры решения задач по математической статистике статистики число степеней свободы Примеры решения задач по математической статистике, поскольку одна степень свободы «теряется» при определении выборочного среднего Примеры решения задач по математической статистике (Примеры решения задач по математической статистике наблюдений связаны одним уравнением).

Таким образом, по аналогии с (9.6) запишем:

Примеры решения задач по математической статистике

Ha рис. 9,2 представлена плотность распределения Стьюдента с пятнадцатью степенями свободы.

Доверительный интервал математического ожидания нормально распределенной СB с неизвестной дисперсией равен:

Примеры решения задач по математической статистике

Интервальная оценка выборочной дисперсии

Доверительный интервал для оценки дисперсии по выборочной дисперсии Примеры решения задач по математической статистике для СВ

Примеры решения задач по математической статистике

строится аналогичным образом.

Естественно, что в качестве математического ожидания и дисперсии гауссовой СВ мы возьмем их несмещенные и эффективные оценки:

Примеры решения задач по математической статистике

Исходя из вышесказанного, запишем:

Примеры решения задач по математической статистике

Это интервал, который с вероятностью Примеры решения задач по математической статистике накрывает неизвестную дисперсию. Из статистики известно, что если СВ Примеры решения задач по математической статистике имеет гауссово распределение

Примеры решения задач по математической статистике

то справедливо соотношение:

Примеры решения задач по математической статистике

Здесь Примеры решения задач по математической статистике хи-квадрат распределения с Примеры решения задач по математической статистике степенями свободы. Теперь, задавая Примеры решения задач по математической статистике или что равносильно Примеры решения задач по математической статистике, можно найти квантили (соответствующие) Примеры решения задач по математической статистике. При этом следует учесть, что распределение не симметрично (рис. 9.3).

Примеры решения задач по математической статистике

Как же решить эту задачу однозначно? Ведь сдвигая интервал влево или вправо соответствующим образом, можно для заданной доверительной вероятности найти бесконечное множество решений (интервалов).

Для обеспечения единообразия условились выбирать такие квантили (интервал), чтобы площадь под кривой, лежащая левее левой квантили, равнялась площади под кривой, расположенной правее правой квантили:

Примеры решения задач по математической статистике

Тогда из (9.19), учитывая (9.20), получим соответствующие границы интервала:

Примеры решения задач по математической статистике

Пример № 4

Дана выборка СВ Примеры решения задач по математической статистике объемом Примеры решения задач по математической статистике. Предполагается, что СВ Примеры решения задач по математической статистике распределена нормально с неизвестными параметрами Примеры решения задач по математической статистике.

Примеры решения задач по математической статистике

Необходимо найти доверительные интервалы для математического ожидания и дисперсии при доверительной вероятности, равной 0,97,

Решение:

В качестве несмещенных и эффективных оценок вычислим:

Примеры решения задач по математической статистике

a) Вычислим доверительный интервал для математического ожидания, если дисперсия известна (полагаем, что Примеры решения задач по математической статистике). Тогда из таблицы нормального распределения получим

Примеры решения задач по математической статистике

Подставим значения квантилий в (9.9) и (9.10):

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

b) Вычислим доверительный интервал для математического ожидания, при неизвестной дисперсии. Воспользуемся таблицей распределения Стьюдснта с числом степеней свободы

Примеры решения задач по математической статистике

Соответствующие квантили равны

Примеры решения задач по математической статистике

Подставим полученные значения в (9.15) и (9.16):

Примеры решения задач по математической статистике

c) Вычислим доверительный интервал для дисперсии. Воспользуемся таблицей распределения Примеры решения задач по математической статистике Симметричный 97 % вероятностный интервал с

Примеры решения задач по математической статистике

числом степеней свободы: (2,33; 20,5). Подставив полученные значения в (9.21), получим:

Примеры решения задач по математической статистике

Статистические критерии

Прежде чем перейти к рассмотрению понятия статистической гипотезы, сформулируем так называемый принцип практической уверен-посты, лежащий в основе применения выводов и рекомендаций, полученных с помощью теории вероятностей и математической статистики.

Если вероятность события А в данном испытании очень мала, то при однократном испытании можно быть уверенным в том, что событие А не произойдет, и в практической деятельности вести себя так, как будто событие А вообще невозможно.

Вопрос о том, насколько малой должна быть вероятность а события А, чтобы его можно было считать практически невозможным, выходит за рамки математической теории и решается в каждом отдельном случае с учетом важности последствий, вытекающих из наступления события А. В ряде случаев можно пренебречь событиями, вероятность которых меньше 0,05, а в других, когда речь идет, например, о разрушении сооружений, гибели судна и т. п., нельзя пренебрегать событиями, которые могут появиться с вероятностью, равной 0,00К

Статистическим критерием (или просто критерием) называют случайную величину Кщ которая служит для проверки гипотезы.

Критерии значимости (критерии проверки гипотез, иногда просто тесты) — это простейшие, но наиболее широко используемые стати сти ч ее к и е средства.

Критерий значимости дает возможность статистику найти разумный ответ на вопрОС, подобный следующим;

• Сталь, произведенная разными методами, имеет неодинаковые пределы прочности. «Указывает ли это на то, что производимая разными методами сталь имеет различную прочность или же выявленное различие можно объяснить выборочными флуктуация ми?»

  • «Превосходит ли по эффективности одно противогриппозное средство другое?»
  • «Способствует ли отказ от курения снижению вероятности раковых заболеваний?»
  • «Превосходит ли по воздействию одно удобрение другое приращивании овощей ? »

Проверка гипотез

Статистически называют гипотезу о виде неизвестного распределения или о параметрах известных распределений.

Рассмотрим простейший вид статистической процедуры, называемой проверкой гипотез. Пусть дана некоторая оценка Примеры решения задач по математической статистике построенная по выборке из я независимых наблюдений СВ Примеры решения задач по математической статистике. Предположим, что есть основания считать истинное значение оцениваемого параметра равным Примеры решения задач по математической статистике.

Однако, даже если истинное значение параметра Примеры решения задач по математической статистике равно выборочное значение Примеры решения задач по математической статистике, вероятно, не будет в точности равняться из-за выборочной изменчивости, присущей Примеры решения задач по математической статистике. Поэтому сформулируем следующий вопрос. Если предположить, что Примеры решения задач по математической статистике=Примеры решения задач по математической статистике то при каком отклонении Примеры решения задач по математической статистике от Примеры решения задач по математической статистике эта гипотеза должна быть отвергнута как несостоятельная? На этот вопрос ответ можно дать в статистических терминах, вычислив вероятность любого значимого отклонения Примеры решения задач по математической статистике от Примеры решения задач по математической статистике по выборочному распределению Примеры решения задач по математической статистике. Если вероятность такого отличия мала, то отличие следует считать значимым и гипотезаПримеры решения задач по математической статистике = Примеры решения задач по математической статистике должна быть отвергнута. Если же вероятность такого отличия велика, то отклонение следует приписать естественной статистической изменчивости и гипотеза = может быть принята.

Проиллюстрируем общий подход, предположив, что выборочное значение Примеры решения задач по математической статистике, являющееся оценкой параметра Примеры решения задач по математической статистике имеет плотность вероятности нормального распределения Примеры решения задач по математической статистике. Теперь, если гипотеза Примеры решения задач по математической статистике, верна, то Примеры решения задач по математической статистике должна иметь среднее значение Примеры решения задач по математической статистике (рис. ЮЛ).

Вероятность использованная при испытании гипотез, называется уровнем значимости критерия.

Вероятность того, что Примеры решения задач по математической статистике окажется меньше нижней границы Примеры решения задач по математической статистике, равна вероятности того, что Примеры решения задач по математической статистике превзойдет верхнюю границу Примеры решения задач по математической статистике и каждая из них равна Примеры решения задач по математической статистике. Следовательно, вероятность того, что Примеры решения задач по математической статистике окажется вне интервала, заключенного между этими границами, равна а. Область значений Примеры решения задач по математической статистике, при которых гипотеза принимается, называется областью принятия гипотезы

Нулевой (основной) называют выдвинутую гипотезу Примеры решения задач по математической статистике. В данном

примере Примеры решения задач по математической статистике: Примеры решения задач по математической статистике.

Область значений Примеры решения задач по математической статистике при которых гипотеза должна быть отверг нута, называется областью отклонения гипотезы, или критической областью,

Примеры решения задач по математической статистике

Конкурирующей (альтернативной) называют гипотезу, которая противоречит нулевой.

В данном примере

Примеры решения задач по математической статистике

Рассмотренный нами простой критерий испытания гипотез называется двусторонним критерием, так как, когда гипотеза неверна, значение может быть либо больше, либо меньше Примеры решения задач по математической статистике.

В ряде случаев достаточно бывает односторонних критериев (рис. 10.2). Например, пусть основная гипотеза

Примеры решения задач по математической статистике

Тогда альтернативная гипотеза:

Примеры решения задач по математической статистике

Следовательно, в критерии должна использоваться только нижняя (левая} граница определяемая по плотности вероятности Примеры решения задач по математической статистике.

Примеры решения задач по математической статистике

Ошибки проверки гипотез

При проверке гипотезы возможны два типа ошибок.

  • Во-первых, гипотеза может быть отклонена, хотя фактически она верна. Такая ошибка называется ошибкой первого рода.
  • Во-вторых, гипотеза может быть принята, хотя фактически она неверна. Такая ошибка называется ошибкой второго рода.

Проиллюстрируем эти понятия графически (рис, 10.3).

Примеры решения задач по математической статистике

Из рисунка видно, что ошибка первого рода происходит в том случае, когда при справедливости гипотезы Примеры решения задач по математической статистике значение Примеры решения задач по математической статистике попадает в область ее отклонения (критическую область). Следовательно„ вероятность ошибки первого рода равна Примеры решения задач по математической статистике — уровню значимости критерия.

Для определения вероятности ошибки второго рода предположим, к примеру, что истинный параметр равен либо

Примеры решения задач по математической статистике

либо

Примеры решения задач по математической статистике

(см. рис. 10.3), Если гипотеза состоит в том, что

Примеры решения задач по математической статистике

тогда как на самом деле

Примеры решения задач по математической статистике

то вероятность того, что Примеры решения задач по математической статистике попадает в область принятия гипотезы, заключенную между

Примеры решения задач по математической статистике

равна Примеры решения задач по математической статистике Следовательно, вероятность ошибки второго рода равна Примеры решения задач по математической статистике при выявлении отклонения величиной ±d от гипотетического значения Примеры решения задач по математической статистике.

Вероятность называется мощностью критерия Следует отмстить, что вероятности ошибок первого и второго рода вычисляются при разных предположениях о распределении (если верна гипотеза Примеры решения задач по математической статистике и если верна гипотеза Примеры решения задач по математической статистике), так что никаких раз и навсегда фиксированных соотношений (например Примеры решения задач по математической статистике, независимо от вида гипотезы и вида критерия) между ними нет. Таким образом, при фиксированном объеме выборки Примеры решения задач по математической статистике мы можем сколь угодно уменьшать ошибку первого рола, уменьшая уровень значимости Примеры решения задач по математической статистике. При этом, естественно, возрастает вероятность Примеры решения задач по математической статистике — ошибки второго рода (уменьшается мощность критерия). Единственный способ одновременно уменьшить ошибки первого и второго рода — увеличить размер выборки Примеры решения задач по математической статистике.

Именно такие соображения лежат в основе выбора нужного размера выборки в статистических экспериментах.

Пример № 5

Построение критерия проверки гипотез,

Предположим, что среднее значение СВ Примеры решения задач по математической статистике равно

Примеры решения задач по математической статистике

также предположим, что дисперсия известна и равна

Примеры решения задач по математической статистике

Необходимо найти объем выборки, позволяющий построить критерий проверки гипотезы

Примеры решения задач по математической статистике

с 5%-м уровнем значимости и 5%-й ошибкой второго рода для выявления 10%-х отклонений от гипотетического значения. Построим также область принятия гипотезы Примеры решения задач по математической статистике.

Решение:

Выборочное среднее Примеры решения задач по математической статистике определяемое формулой (8.6), является несмещенной оценкой Примеры решения задач по математической статистике. Соответствующее выборочное распределение определяется из соотношения (9.7):

Примеры решения задач по математической статистике

где Примеры решения задач по математической статистике имеет распределение Примеры решения задач по математической статистике Верхняя и нижняя границы области принятия гипотезы соответственно равны:

Примеры решения задач по математической статистике

Если теперь истинное среднее значение равно

Примеры решения задач по математической статистике

то с вероятностью Примеры решения задач по математической статистике произойдет ошибка второго рода, если выборочное среднее Примеры решения задач по математической статистике окажется меньше (левее) верхней границы и больше (правее) нижней. В терминах выборочного распределения Примеры решения задач по математической статистике со средним

Примеры решения задач по математической статистике

или

Примеры решения задач по математической статистике

для верхней и нижней границ (рис. 10,3);

Примеры решения задач по математической статистике

Итак, справедливы следующие равенства:

Примеры решения задач по математической статистике

Вспомним, что благодаря симметричности распределения Примеры решения задач по математической статистикесправедливы равенства:

Примеры решения задач по математической статистике

Теперь из (10.4) с учетом (10.5) найдем требуемый объем выборки:

Примеры решения задач по математической статистике

Для конкретных значений данного примера:

Примеры решения задач по математической статистике
Примеры решения задач по математической статистике

Подставим эти значения в (10.6) и получим значение необходимою объема выборки Примеры решения задач по математической статистике. Таким образом, объем выборки должен быть равен или больше пятидесяти двух. Область принятия гипотезы Примеры решения задач по математической статистике определяется соответствующими границами (верхней и нижней (10.2)):

Примеры решения задач по математической статистике

Математическая статистика основные определения и вычисления

Основные задачи математической статистики:

Математическая статистика — это раздел математики, который изучает методы обработки и классификации статистических данных для получения научно обоснованных выводов и принятия решений.

Примером статистических данных служит последовательность значений случайной величины, полученных в результате некоторого наблюдения, эксперимента (опыта). Так, последовательность чисел, которые получаются в результате неоднократного измерения некоторой величины, скажем, взвешивания некоторого тела на
аналитических весах, является простейшим примером статистических данных. Рассмотрим еще один пример. Электрическая лампочка считается стандартной, если она горит не менее 1400 часов. Каким образом определить, в какой степени партия лампочек, выпущенная заводом, соответствует установленному стандарту? Очевидно, что испытывать все лампочки бессмысленно. Поэтому выбирают случайным образом некоторое количество лампочек для испытания. Последовательность полученных данных о продолжительности горения отобранных лампочек представляет собой статистические данные, которые, будучи обработаны методами математической статистики, позволяют делать выводы о качестве данной партии продукции.

В связи с тем, что статистические данные зависят от случайных факторов, математическая статистика тесно связана с теорией вероятностей, которая является ее теоретической основой.

Как мы уже знаем, теория вероятностей устанавливает правила нахождения вероятностей более сложных событий (суммы, произведения событий) и вычисления различных числовых характеристик случайных величин (математического ожидания, дисперсии) по заданным вероятностям исходных событий. На практике же редко встречаются задачи, в которых вероятности
рассматриваемых событий были бы заранее известны. В таких случаях методами математической статистики можно получить сведения о случайной величине путем изучения небольшого набора наблюденных значений случайной величины, содержащего как можно больше нужных сведении о случайной величине.

Основные задачи математической статистики могут быть сформулированы следующим образом:

а) оценка неизвестных параметров случайной величины (вероятности случайного события, математического ожидания случайной величины, дисперсии, функции распределения);

б) статистическая проверка гипотез, т. е. проверка предположений, сделанных относительно некоторых случайных событий, случайных величин (о вероятности события, о законе распределения случайной величины и т. д. );

в) принятие решений (сюда относятся, в частности, задачи оптимального выбора момента настройки или замены действующей аппаратуры, например, определения срока замены двигателя самолета, отдельных деталей станков и т. д.).

В настоящее время математическая статистика продолжает бурно развиваться; при этом все больше расширяется круг ее задач и методов исследования с широким применением ЭВМ.

Так, разрабатываются статистические методы распознавания образов, определения характеристик элементов системы автоматического управления и т. д.

Математическая и прикладная статистика используется при планировании и организации производства, при анализе технологических процессов при предупредительном и приемочном контроле качества продукции и в других практических задачах.

Основные понятия математической статистики

Пусть требуется изучить множество значений случайной величины или совокупности объектов относительно некоторого признака. Например, требуется определить процент изделий, выпускаемых одним и тем же оператором, параметры которых отличаются от
номинальных.

Если число элементов в совокупности не очень большое, обследование объекта не связано с его уничтожением или не требует больших затрат, то можно исследовать каждый элемент в отдельности, фиксировать значение исследуемого признака и соответствующей обработкой результатов сделать тот или иной вывод о наблюдаемом или измеряемом признаке.

Если же совокупность состоит из очень большого числа объектов, или исследование связано с уничтожением объекта, или оно дорого стоит, то сплошное обследование невозможно. Невозможно, например,
исследовать на долговечность всю партию электрических
лампочек, так как в результате исследуемые лампочки сгорают и вся партия уничтожилась бы. В этих случаях выводы об исследуемом признаке делаются на основе изучения ограниченного числа
объектов, должным образом отобранных из общей совокупности. Основными понятиями математической статистики являются генеральная и выборочная совокупности.

Множество всех значений некоторой изучаемой величины или, другими словами, совокупность всех объектов, которая подлежит изучению, носит название генеральной совокупности, а специальным образом отобранная группа объектов — выборочной совокупности или выборки. Например, партия всех электрических
лампочек, которая подлежит изучению, является генеральной совокупностью, а множество лампочек, взятых для обследования, составляет выборочную совокупность.

Число объектов совокупности (генеральной или выборочной) называется объемом данной совокупности (выборки). Например, если цех выпустил 2000 деталей, а для обследования отобрано 150 деталей, то объем генеральной совокупности равен 2000 (N = 2000), а объем
выборки— 150 (п = 150).

Сейчас можно сказать, что основная задача математической статистики состоит в получении обоснованных выводов о свойствах генеральной совокупности по известным свойствам извлеченной из нее выборки.

Рассмотрим теперь основные виды выборок. Различают выборки с возвращением и без возвращения. Если после фиксирования значения параметра объект возвращается в генеральную совокупность и, таким образом, он может многократно повторяться в выборке, то говорят о выборке с возвращением или с повторением. Если же раз отобранный объект обратно не возвращается и он не может больше, чем один раз, повторяться в выборке, то такая выборка называется выборкой без возвращения или без повторения. Заметим, что когда объем выборки намного меньше объема генеральной
совокупности, то различие между выборкой с возвращением и без возвращения практически исчезает.

Говорят, что выборка репрезентативна (представительна), если она достаточно «хорошо» представляет изучаемые признаки генеральной совокупности.

Важным условием обеспечения репрезентативности выборки является соблюдение случайности отбора, т. е. все объекты генеральной совокупности должны иметь равные вероятности попасть в выборку.

С целью обеспечения репрезентативности выборки в зависимости от конкретных условий применяются различные способы отбора: простой, типический, механический, серийный.

Простым называется отбор, при котором из генеральной совокупности случайным образом извлекается по одному элементу с возвращением или без возвращения. Например, для изучения белых медведей экспедиция ловит- случайным образом попавшихся ей белых медведей, измеряет исследуемые параметры и отпускает
на волю или сдает в зоопарк в зависимости от целей, которые стоят перед ней.

Типическим называется отбор, при котором объекты случайным образом отбираются из каждой «типической» части генеральной совокупности…

Например, если детали изготовляются разными цехами, то для обеспечения репрезентативности выборки отбор производится случайным образом с соблюдением пропорций из продукции каждого цеха. Типическим отбором пользуются тогда, когда исследуемый признак существенно колеблется в различных частях генеральной совокупности.

Механическим называется отбор, при котором объекты отбираются через определенный интервал, скажем, каждый пятый, двадцатый, сотый и т. д. Механическим отбором надо пользоваться осторожно.

Например, если резец заменяется после тридцати обработанных
деталей, то нельзя составлять выборку, отбирая каждую десятую или пятнадцатую детали. Отметим, что в таких случаях целесообразно, чтобы номер отбираемой детали и период ритма работы были взаимно простыми числами. Тогда в выборку попадут объекты со всех точек периода ритма.

Серийным называется отбор, при котором выборка состоит из целой серии объектов. Этим способом пользуются в тех случаях, когда исследуемый признак в генеральной совокупности колеблется незначительно.

Например, если квалификация всех рабочих цеха, качество технических средств и сырья существенно не изменяются в течение недели, то для проверки недельной продукции данного цеха можно провести сплошную проверку продукции одного дня.

На практике для обеспечения репрезентативности выборки пользуются сочетанием вышеуказанных способов отбора.

Если отбор объектов из генеральной совокупности и образование выборки невозможны непосредственным манипулированием самими объектами ввиду их громоздкости, труднодоступности или по другим причинам, то объектам генеральной совокупности присваиваются номера, которые записываются, например, на отдельных карточках, удобных для перемешивания и осуществления отбора. Путем случайного отбора карточек образуется выборка заданного объема, а впоследствии из генеральной совокупности отбираются те объекты номера которых совпадают с номерами карточек, попавших в выборку. Описанным способом поступают,
например, при составлении тиражей выигрышных билетов в денежно-вещевых лотереях, облигаций трехпроцентного займа и др.

В научных исследованиях для формирования выборок чаще всего пользуются так называемыми таблицами случайных чисел, которые могут быть получены при помощи случайного выбора карточек или
специальными алгоритмами на ЭВМ. Существуют таблицы случайных чисел четырехзначные, пятизначные и т. д. Если надо, например, образовать выборку объема n из генеральной совокупности объема N = 100 000, то берем пятизначную таблицу случайных чисел и выписываем любую группу из n последовательных ее чисел. Обследованию подвергаются те объекты генеральной совокупности, номера которых совпадают с выписанными числами из таблицы случайных чисел.

Выборочные ряды распределения

Группировка статистических данных. Определение
статистических (выборочных) распределений

Для установления закономерностей массовых случайных явлений изучаются статистические данные, т. е. сведения, полученные путем наблюдений или экспериментов о значениях интересующего нас признака. Примеры статистических данных были приведены в § 1. Рассмотрим здесь еще один пример. Экономист, интересующийся
тарифным разрядом рабочих некоторого подразделения завода, выбрал документы 100 рабочих и выписал из них последовательность разрядов 5, 1, 4, 5, 4, 3, 6 и т. д. Эта последовательность представляет собой статистические данные, которые подлежат обработке.

Изучение статистических данных обычно начинается с их группировки в порядке возрастания значения признака. Пусть в нашем примере после упорядочения по возрастанию статистических данных мы получили ряд из 100 чисел

Математическая статистика

где 1 повторяется 4 раза, 2 — 6 раз, 3—12 раз, 4 — 16 раз (для экономии места мы не выписали этот ряд полностью), 5 — 44 раза и 6— 18 раз.

Наблюдаемые значения рассматриваемого признака называются вариантами, а последовательность вариант, записанных в возрастающем порядке, называется выборочным или вариационным рядом.

Условимся обозначать через Математическая статистика значения вариант в данной выборке, Если Математическая статистика — вариационный ряд, т. е. Математическая статистика — это наименьшее значение признака,
Математическая статистика — наибольшее значение признака в данной выборке, а разность Математическая статистика называется размахом выборки. В нашем примере Математическая статистика

Пусть из генеральной совокупности отобрана выборка, в которой значение Математическая статистика признака X наблюдалось Математическая статистика раз, значение Математическая статистика раз, …, значение Математическая статистика раз. Если объем выборки равен n, то

Математическая статистика

Числа Математическая статистика.., называются частотами, а их отношения к объему выборки, т, е. Математическая статистикаотносительными частотами соответствующих вариант.

Рассматривается еще накопленная или кумулятивная частота Математическая статистика, которая показывает, сколько наблюдалось элементов выборки со значениями признака, меньшими Математическая статистика. Отношение Математическая статистика накопленной частоты к общему объему выборки называется относительной накопленной частотой,

Математическая статистика

Определение:

Статистическим распределением выборки называется перечень вариант и соответствующих им частот или относительных частот.

В теории вероятностей изучается аналогичное понятие, именно закон распределения или просто распределение случайной величины. При этом под распределением случайной величины понимается соответствие между возможными значениями случайной величины и их вероятностями. Для дискретной случайной величины X, принимающей значения Математическая статистика с вероятностями Математическая статистика, закон распределения записывается, как правило, в виде таблицы

Математическая статистика

В первой строке этой таблицы указаны значения случайной величины, во второй соответствующие вероятности Аналогичным образом, статистическое распределение выборки можно записать в виде таблицы, в первой строке которой указываются значения вариант выборки, во второй строке — значения частот:

Математическая статистика

или значения относительных частот (которые легко вычисляются по известным частотам и объему выборки):

Математическая статистика

Так, статистическое распределение выборки рассмотренного выше примера, запишется в виде

Математическая статистика

или

Математическая статистика

Можно свести обе эти характеристики выборки в одну таблицу:

Таблица 6

Математическая статистика

Пример:

Дано статистическое распределение выборки

Математическая статистика

Найти относительные частоты, накопленные частоты накопленные относительные частоты.

Решение:

Вычислим объем выборки n = 3 + 10 + 7 = 20. Тогда

Математическая статистика

Пример:

Найти вариационный ряд, частоты, относительные частоты для выборки, полученной при измерении электрической емкости двадцати пластин пьезоэлементов в пикофарадах по следующим результатам:

Математическая статистика

Решение:

Вариационный ряд для данной выборки будет:

Математическая статистика

Здесь каждая варианта встречается по одному разу, следовательно, Математическая статистика для всех Математическая статистика Равными будут также и относительные частоты, причем Математическая статистика.

Теперь мы можем следующим образом уточнить понятие репрезентативности выборки: выборка является репрезентативной, если относительные частоты выборки близки к соответствующим относительным частотам генеральной совокупности (по всем вариантам генеральной совокупности).

Пример:

Исследовать репрезентативность выборки

Математическая статистика

для генеральной совокупности, заданной таблицей 6.

Решение:

Вычислим относительные частоты для нашей выборки (обозначим их через Математическая статистика):

Математическая статистика

Из этих подсчетов делаем вывод, что данную выборку можно считать репрезентативной.

При большом числе наблюдений и большом числе
вариант, удобно варианты группировать по отдельным интервалам их значений. Для этого шкала интересующего нас признака разделяется на некоторое число интервалов, и вместо отдельных вариант рассматриваются группы значений вариант, попавших в последовательно расположенные интервалы. Число m таких интервалов, как правило, берется в пределах от 10 до 20. Ширина
интервалов Математическая статистика определяется путем деления размаха выборки Математическая статистика на количество интервалов: Математическая статистика. В таких случаях составляется статистическое распределение выборки по частотам интервалов (интервальное статистическое распределение выборки). При этом частота интервала равна сумме частот вариант, попавших
в данный интервал.

Пример:

Для выборки примера 2 составить таблицу статистического распределения, по интервалам, беря число интервалов m = 10.

Решение:

Вычисляем ширину интервалов:

Математическая статистика

Следовательно, имеем интервалы (точнее, — промежутки):
[7,0; 7,5], ]7,5; 8,0], ]8,0; 8,5], ]8,5; 9,0], ]9,0; 9,5], ]9,5; 10,0], ]10,0; 10,5], ]10,5; 11,0], ]11,0; 11,5], ]11,5; 12,0]. Используя данные примера 2, получаем следующую таблицу статистического распределения
выборки по интервалам:

Математическая статистика

Геометрическая интерпретация статистических распределений выборки

Если на оси абсцисс прямоугольной системы координат расположить варианты Математическая статистика а на оси ординат — соответствующие им частоты, то в плоскости получим точки Математическая статистика. Соединим точки Математическая статистика отрезками прямых. Полученная ломаная линия называется
полигоном частот.

Математическая статистика

Пример:

Построить полигон частот для статистического распределения выборки, заданной таблицей 6.

Решение:

См. рис. 148

Полигоном относительних частот называют ломаную, отрезки которой соединяют точки Математическая статистика, Математическая статистика, построенные в системе координат так, что на оси абсцисс расположены варианты Математическая статистика а на оси ординат — относительные частоты Математическая статистика. Так как Математическая статистика , то ординаты точек Математическая статистика получаются из ординат точек Математическая статистика уменьшением их в n раз.

Следовательно, полигон частот будет представлять полигон относительных частот в системе координат, у которой масштаб на оси ординат увеличен в n раз.

Пример:

Построить полигон относительных частот для статистического распределения выборки, заданной таблицей 6.

Решение:

См. рис. 149.

Математическая статистика

Если статистическое распределение выборки задается в виде
последовательности интервалов значений вариант и их частот, то геометрическое изображение дается при помощи гистограммы
частот (очевидно, что в этом случае нельзя построить полигон частот).

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, построенных на частичных интервалах с длиной d и высотой, равной отношению Математическая статистика (плотность частоты на данном интервале).

Математическая статистика

Площадь i-го частичного прямоугольника равна Математическая статистикаСледовательно, площадь гистограммы частот равна сумме всех частот, т. е. объему выборки.

Гистограммы относительных частот строятся аналогичным образом, только в качестве высот прямоугольников берется отношение Математическая статистика (плотность относительной частоты на данном интервале).

Гистограмма относительных частот может быть получена из гистограммы частот сжатием вдоль оси ординат в n раз, или увеличением масштаба на оси ординат в n раз.

Легко видеть, что площадь гистограммы относительных частот равна единице.

Пример:

По данным изучения выработки на одного рабочего в отчетном году в процентах по отношению к предыдущему году было составлено интервальное статистическое распределение в виде таблицы 7 для выборки объема n = 117, извлеченной из всей
совокупности рабочих завода. Построить гистограмму статистического распределения данной выборки.

Таблица 7

Математическая статистика

Решение:

См. рис. 150.

Можно построить и график кумулятивной частоты или кумулятивной относительной частоты — кумулятивную кривую.

Пример:

Построить кумулятивную кривую частот для статистического распределения выборки, заданной таблицей 6.

Решение:

См. рис. 151.

Заметим, что кумулятивная кривая частот сыграничена сверху числом n, а кумулятивная кривая относительных частот ограничена сверху единицей.

Теоретико-вероятностные аналоги статистических распределений

Сопоставляя известные нам определения вероятности и данное выше определение относительной частоты выборки, легко заметить, что между ними имеется числовая связь. Однако следует подчеркнуть, что между этими двумя понятиями имеется и принципиальное различие. Это различие состоит в том, что вероятность события определяется до испытания, исходя из равновозможности элементарных событий, а относительная частота выборки — после испытания (отбора выборки). Обычно о равновозможности элементарных событий судят, исходя из. соображений симметрии, однородности и т. д., т. е. из теоретических соображений. Так, исходя из того, что игральная кость имеет форму куба, состоит из однородного материала, заключают, что вероятность появления какого-нибудь определенного числа очков, например 4, равна 1/6, причем такова же вероятность появления 1, 2, ».., 6 очков.

Математическая статистика

Определение же относительной частоты может быть получено только после того как испытания были фактически произведены. Так,
если при 100-кратном бросании игральной кости мы получили варианты

Математическая статистика

то относительные частоты будут

Математическая статистика

в то время как вероятность любого из указанных исходов равна Математическая статистика. Хотя численные значения этих величин и близки, они не совпадают. Однако если из теоретических соображений нам известно значение вероятности, то, как это следует из закона больших чисел, при большом объеме выборки относительная частота варианты
будет близкой к его вероятности. На практике же случаи, в которых можно определить вероятность, исходя из теоретических соображений, встречаются весьма редко. Поэтому на практике, учитывая закон больших чисел, в качестве приближенного значения вероятности случайной величины принимают относительную частоту репрезентативной выборки.

В силу такой тесной связи между понятиями вероятности и относительной частоты имеет место много аналогий между основными понятиями и теоремами теории вероятностей и математической статистики.

В математической статистике большую роль играют понятия, аналогичные понятиям математического ожидания, дисперсии, среднего квадратичного отклонения, известные нам из теории вероятностей.

Сводные числовые характеристики выборки

Как мы уже говорили выше, одной из основных задач математической статистики является оценка параметров генеральной совокупности (случайной величины) при помощи соответствующих параметров выборки. Пусть дана случайная величина X, принимающая значения Математическая статистика

Определение:

Выборочным средним Математическая статистика выборки объема n со статистическим распределением

Математическая статистика

называется «среднее взвешенное» значений признака выборки, т. е.

Математическая статистика

Если рассмотренная выборка является генеральной совокупностью объема N со статистическим распределением

Математическая статистика

то получаем генеральное среднее:

Математическая статистика

Вероятность Математическая статистика того, что случайная величина X получает значение Математическая статистика, будет Математическая статистика Вычислим математическое ожидание M(X) случайной величины X:

Математическая статистика

Таким образом,

Математическая статистика

Генеральное среднее (а следовательно, и математическое ожидание случайной величины) может быть оценено при помощи выборочной средней той или иной выборки. Точность таких оценок зависит от степени репрезентативности данной выборки.

Пример:

Вычислить генеральное среднее для генеральной совокупности, заданной таблицей 6.

Решение:

Математическая статистика

Пример:

Оценить генеральное среднее генеральной совокупности примера 1 при помощи выборочного среднего выборки

Математическая статистика

Решение:

Математическая статистика

Следовательно, можно принять Математическая статистика, что близко к истинному значению Математическая статистика (см. пример 1).

Пример:

По данным таблицы 7 оценить среднюю выработку на одного рабочего завода в отчетном году в процентах к предыдущему году (в качестве вариант берутся середины соответствующих интервалов).

Решение:

Оценим среднюю выработку при помощи выборочного среднего Математическая статистика:

Математическая статистика

Определение:

Выборочной дисперсией Математическая статистика которой выборки называется среднее взвешенное квадратов отклонений значений признака от выборочной средней Математическая статистика.

Если варианты Математическая статистика выборки объема n.
имеют частоты Математическая статистика то

Математическая статистика

Если рассматриваемая выборка является генеральной совокупностью, то получаем генеральную дисперсию Математическая статистика Пусть X — случайная величина, значения которой предоставлены генеральной совокупностью объема N со статистическим распределением

Математическая статистика

Тогда Математическая статистика

Вычислим дисперсию случайной величины X:

Математическая статистика

Множество значений случайной величины Математическая статистикапредставляет собой генеральную совокупность объема N с вариантами Математическая статистика с частотами Математическая статистика следовательно, для ее математического ожидания имеем:

Математическая статистика

Таким образом.

Математическая статистика

Генеральная дисперсия генеральной совокупности (а следовательно, и дисперсия случайной величины) может быть оценена при помощи выборочной дисперсии той или иной выборки. Точность такой оценки зависит от степени репрезентативности данной выборки.

Напомним, что дисперсия является характеристикой рассеяния значений признака вокруг своего среднего значения.

Часто рассматривается еще величина которая называется средним квадратическим отклоненнием выборки.

Пример:

Вычислить генеральную дисперсию генеральной совокупности, заданной таблицей 6.

Решение:

Из примера 1 имеем Математическая статистика. Тогда

Математическая статистика

Пример:

Оценить генеральную дисперсию генеральной совокупности, заданной таблицей 6, при помощи выборочной дисперсии выборки из примера 2.

Решение:

Из примера 2 имеем Математическая статистика.

Тогда

Математическая статистика

Следовательно, можно принять Математическая статистика, что близко к истинному значению Математическая статистика (см. пример 4),

Пример:

По данным таблицы 7 оценить дисперсию средней выработки на одного рабочего завода и среднее квадратическое отклонение.

Решение:

Из примера 3 имеем Математическая статистика. Тогда

Математическая статистика

Отсюда

Математическая статистика

Понятие об аппроксимации распределений

Пусть дано статистическое распределение частот некоторой выборки объема n случайной величины X. Пусть Математическая статистика — накопленная частота выборки. Очевидно, что Математическая статистика зависит от варианты Математическая статистика поэтому, для
простоты, обозначим ее через Математическая статистика т. е. Математическая статистика Аналогично,
относительную накопленную частоту Математическая статистикаобозначим через Математическая статистика. Ясно, что относительная частота события Математическая статистика равна Математическая статистика Обозначая через x текущую варианту, можем сказать, что Математическая статистика является функцией от x. Обозначим эту функцию через Математическая статистика:

Математическая статистика

и назовем ее функцией распределения выборки. Поскольку значения функции Математическая статистика определяются из опыта, то Математическая статистика называется эмпирической функцией распределения выборки. Функция Математическая статистикараспределения генеральной совокупности, которая может оставаться неизвестной или может быть выведена из теоретических результатов теории вероятностей, называется теоретической функцией распределения.

Из теоремы Бернулли следует, что относительная частота события Математическая статистика стремится по вероятности к вероятности Математическая статистика этого события. В силу этого числа Математическая статистика мало различаются между собой, т. е. Математическая статистика. Следовательно, эмпирическая функция Математическая статистика распределения выборки может быть
использована для приближенного представления теоретической функции распределения генеральной совокупности или соответствующей случайной величины.

Пример:

Построить эмпирическую функцию распределения по данному, распределению выборки:

Математическая статистика

Решение:

Вычислим объем выборки:

Математическая статистика

Наименьшая варианта Математическая статистика равна 2, следовательно,

Математическая статистика

Значение Математическая статистика равно 12, так как событие Математическая статистика наблюдается 12 раз. Тогда при Математическая статистика имеем

Математическая статистика

Значение Математическая статистика равно 23, так как событие Математическая статистика. наблюдается 12 + 11 = 23 раза. Тогда при Математическая статистика имеем:

Математическая статистика

Значение Математическая статистика равно 20 так как событие Математическая статистика наблюдается 12 + 11 + 3 = 26 раз. Тогда при Математическая статистика имеем

Математическая статистика

Наконец, так как Математическая статистика — наибольшая варианта, то Математическая статистика Следовательно, при X > 7 имеем:

Математическая статистика

Следовательно, искомая эмпирическая функция распределения дается формулой

Математическая статистика

График этой функции изображен на рис. 152

Таким образом, если дана генеральная совокупность (или случайная величина), закон распределения которой неизвестен, то извлекают репрезентативную выборку и вычисляют эмпирическую функцию распределения Математическая статистика для данной выборки и оценивают распре
деление генеральной совокупности Математическая статистика при помощи эмпирической функции распределения выборки Математическая статистика Иногда удобно поступить и обратным путем. Для многих распространенных случайных величин из теоретико-вероятностных соображений известен характер их

Математическая статистика

закона распределения. Многие Случайные величины, а следовательно, и генеральные совокупности, имеют нормальный закон распределения с функцией распределения

Математическая статистика

где параметры a и Математическая статистика имеют вполне конкретный вероятностный смысл: а — математическое ожидание, Математическая статистика — дисперсия случайной величины. Отметим еще, что существуют случайные величины с показательным законом распределения с функцией распределения

Математическая статистика

где а — математическое ожидание случайной величины, случайные величины с биномиальным законом распределения и др.
Допустим, что нам известен вид функции распределения генеральной совокупности, например, что генеральная совокупность имеет нормальное распределение, показательное распределение или какой-либо другой вид распределения. Рассмотрим некоторую выборку,
которая извлечена из данной генеральной совокупности.

Определяем по вариантам данной выборки значения параметров, входящих в формулу теоретической функции распределения. Заменяя найденные значения параметров в формулах функции распределения, получим конкретную функцию, которая является
аппроксимацией выборочных распределений теоретическими
распределениями. Таким образом, распределения конкретных выборок аппроксимируются теоретическими.

Совместные распределения случайных величин

1. Статистическая зависимость. Во многих случаях возникает необходимость совместного изучения двух или нескольких случайных величин. Две случайные величины могут быть независимыми, либо зависимыми, при этом зависимость может быть функциональной или статистической (во втором случае говорят еще — вероятностная, или стохастическая зависимость). В теории вероятностей и математической статистике изучаются статистические (стохастические) зависимости.

Зависимость между двумя случайными величинами называется статистической, если при изменении одной го величин изменяется закон распределения другой величины.

Пусть, например, Y — вес мужчин одного возраста, a X — их рост. Зависимость между Y и X не является функциональной, так как вес разных мужчин одного и того же роста различный, но изменение величины X ведет к изменению закона распределения величины Y — веса. Зависимость между Y и X является статистической.

Статистическая зависимость, у которой при изменении одной из величин изменяется среднее значение другой величины, называется корреляционной.

Пусть, например, Y — урожай участка, X — количество внесенных удобрений. Зависимость между Y и X не является функциональной, так как на равных участках земли при равном количестве удобрений снимают все же различный урожай. Это связано с тем, что урожай
зависит от многих случайных факторов. Тем не менее, опыт показывает, что средний урожай зависит от количества удобрений. Следовательно, случайные величины — урожай и количество внесенных удобрений — связаны корреляционной зависимостью.

Понятие о корреляции и регрессии

Рассмотрим две случайные величины Y и X. Допустим, что каждому значению X соответствует несколько значений Y, например при Математическая статистика = 2 величина Y принимает значения Математическая статистика

Среднее арифметическое значений величины Y при Математическая статистиканазывается условным средним и обозначается Математическая статистика. В нашем примере имеем

Математическая статистика

Как мы уже отметили, зависимость Y от X называется корреляционной зависимостью, если условная средняя Математическая статистикафункционально зависит от x:

Математическая статистика

Уравнение (1) называется уравнением регрессии Y на X; Математическая статистиканазывается регрессией Y на X, а ее график — линией регрессии Y на X.
Аналогично определяется корреляционная зависимость X от Y, Математическая статистика.

Различаются две основные задачи теории корреляции. Первая — установить вид функции регрессии (1) (линейная, квадратическая, показательная и т. д.). Вторая — определить величину рассеяния значений Y вокруг условного среднего Математическая статистика, т. е. оценить силу
зависимости Y от X.

3. Выборочное уравнение. Пусть X и Y — две случайные величины, связанные корреляционной зависимостью. Для отыскания уравнения этой зависимости проведено n независимых испытаний; в результате
получены n пар чисел:

Математическая статистика

Множество пар (2) является случайной выборкой из генеральной совокупности всех возможных пар (x; у) значений величин X и Y. Распределение выборки (2) называется выборочным распределением пары случайных величин X и Y. В связи с этим уравнение (1),
определенное по данным выборки (2), называется выборочным уравнением регрессии Y на X.

Нахождение уравнений выборочной регрессии методом наименьших квадратов

Будем искать выборочное уравнение регрессии

Математическая статистика

по выборке

Математическая статистика

в виде линейного уравнения — одного из самых распространенных случаев. При этом будем считать, что в данной выборке каждому значению x признака X соответствует единственное значение у признака Y. Тогда Математическая статистика, т. е. можем считать, что заданы средние
значения величины Y для каждого значения X.

Рассмотрим линейную функцию

Математическая статистика

и поставим задачу определить параметры Математическая статистика и b так, чтобы линейная функция Математическая статистика давала наилучшее приближение в смысле квадратического отклонения функции регрессии (1). Полученную линейную функцию назовем прямой линии регрессии Y на X. Угловой
коэффициент прямой линии регрессии Y на X называется выборочным коэффициентом регрессии Y на X и обозначается через Математическая статистика

Таким образом, выборочное уравнение прямой линии регрессии Y на X будем искать в виде

Математическая статистика

Если Математическая статистика a Математическая статистика — наблюдаемое значение Y, соответствующее Математическая статистика, то разности Математическая статистика. называются отклонениями значений Y. Подберем параметры Математическая статистика и b так, чтобы сумма квадратов отклонений Математическая статистика, которая равна

Математическая статистика

или

Математическая статистика

была минимальной.

Для отыскания минимума приравняем нулю соответствующие частные производные Математическая статистика

Математическая статистика

Отсюда находим:

Математическая статистика

Умножая уравнение (5) на n и (6) на — Математическая статистика получим:

Математическая статистика

Сложив полученные уравнения, имеем

Математическая статистика

Отсюда

Математическая статистика

Аналогично находим

Математическая статистика

Пример:

Найти выборочное уравнение прямой линии регрессии Y на X по данным n = 5 наблюдений:

Математическая статистика

Решение:

Составим расчетную таблицу дли вычисления Математическая статистика и b по формулам (7) и (8). В результате вычислений найдем линейную функцию регрессии:

Математическая статистика

Математическая статистика — решение заданий и задач по всем темам с вычислением

Статистический материал и его обработка

1°. Результаты наблюдений массовых явлений, случайных величин составляют статистические данные, или статистический материал. Выборкой объема n называется совокупность n случайно отобранных объектов. Множество всех объектов, из которых производится выборка, называется генеральной совокупностью (ГС).

Выборочный метод состоит в том, что на основании изучения некоторого количественного признака X у некоторой части статистической совокупности (выборки), полученной в результате случайного отбора, можно сделать вывод о характере распределения этого признака по всей статистической совокупности (генеральной совокупности).

Результаты наблюдений выборки объема n записываются, в частности, в виде статистической совокупности:

i: 1, 2, …. n — номера наблюдений, измерений,
Математическая статистика— значения наблюденной величины. При больших значениях n и различных значениях Математическая статистика необозримую статистическую совокупность подвергают специальным видам статистической обработки.

2°. Расположим значения Математическая статистика которые называются вариантами, в порядке возрастания и обозначим Математическая статистикаМатематическая статистикаВеличина R = b — а называется размахом статистической совокупности. Среди значений Математическая статистика, могут быть одинаковые. Пусть значение Математическая статистика наблюдалось Математическая статистикараз, Математическая статистика наблюдалось Математическая статистика раз, …, Математическая статистиканаблюдалось Математическая статистика раз. Тогда общий объем выборки равен

Математическая статистика

Число Математическая статистика, показывающее, сколько раз встречается варианта (значение) Математическая статистиканазывается частотой Математическая статистика, а число Математическая статистикаотносительной частотой варианты Математическая статистика

Имеем

Математическая статистика

Последовательность Математическая статистика записанная в порядке возрастания с указанием частот и (или) относительных частот, называется вариационным рядом, который может быть представлен в виде таблицы (варианты вариационного ряда различны):

Математическая статистика

Геометрическим изображением вариационного ряда является эмпирический полигон распределения, являющийся аналогом плотности распределения случайной величины X, — ломаная с вершинамиМатематическая статистика

Вариационный ряд обозрим при небольших значениях Математическая статистикаВ противном случае его (или первоначальную статистическую совокупность) подвергают интервальной обработке.

3°. Все варианты принадлежат отрезку (см. п. 2°). Пусть к некоторое (не больше 20) натуральное число. Отрезок [а; b] разобьем на к равных частей длины h =(b — a)/k. Обозначим эти промежутки следующим образом:

Математическая статистика

Через Математическая статистикаобозначим число вариант Х, попавших в интервал Математическая статистика Если некоторые значения Математическая статистика совпадают с Математическая статистикато половину их количества отнесем к левому интервалу, а половину — к правому (в случае нечетного числа таких значений одно из них можно отнести к тому или иному интервалу произвольно). Положим еще Математическая статистика Числа Математическая статистикаможно отнести также к середине Математическая статистикаинтервала, Математическая статистика Полученные данные занесем в таблицу, называемую интервальной обработкой ряда, или статистической совокупности.

Математическая статистика

Три последние строки этой таблицы составляют вариационный ряд, которым можно заменить вариационный ряд предыдущего пункта (в случае, если число его вариант велико). В качестве новых вариант можно принять середины интервалов.

Геометрическим изображением интервальной обработки служит гистограмма. Гистограммой частот называется множество прямоугольников с основаниями Математическая статистика и высотами Математическая статистикаПлощадь гистограммы равна объему выборки n.

Нормированной гистограммой называется множество прямоугольников с основаниями Математическая статистика и высотами Математическая статистикаПлощадь этой гистограммы (ступенчатой фигуры) равна 1. По гистограмме легко построить эмпирический полигон, и наоборот.

4°. Эмпирической функцией распределения выборки объема n называется функция F(x), определяющая для каждого х относительную частоту события X < х:

Математическая статистика — число вариант Математическая статистика меньших чем х.

Функция F(x) обладает свойствами (здесь Математическая статистика Математическая статистика)

1)Математическая статистика

2) F(x) = 0 при x < a, F(x) = 1 при x > b.

3) F(x) — монотонно неубывающая, непрерывная слева функция.

Пример обработки статистического материала.

Признак X — объем товарооборота (в млн. руб.) группы обследованных магазинов в течение месяца. Результаты обследования 50 магазинов следующие: 32, 17, 22, 15, 22, 17, 20, 26, 27, 32, 17, 32, 17, 22, 15, 26, 17, 22, 15, 20, 26, 32, 22, 32, 37, 22, 15, 20, 27, 26, 32, 37, 22, 20, 27, 32, 37, 22, 32, 37, 26, 32, 17, 32, 22, 15, 20, 26, 22; 32.

1) Вариационный ряд имеет вид:

Математическая статистика

2) Полигон распределения (рис. 8.1):

Математическая статистика

3) Для удобства интервальной обработки расширим интервал, на котором расположены варианты х. Положим а = 14, b = 38 и разобьем интервал (14,38) на к = 4 равных интервала. Часть совпадающих значений Математическая статистикаотнесем к левым, а часть их — к правым интервалам.

Математическая статистика

Гистограмма частот (рис. 8.2) — набор внешних прямоугольников. Нормированная гистограмма — нижняя, внутренняя.

4) Эмпирическая функция распределения и ее график (рис. 8.3):

Математическая статистика
Математическая статистика

Числовые характеристики законов распределения эмпирических величин

1°. Одна из задач математической статистики состоит в установлении закона распределения случайной величины X (генеральной совокупности) и оценке параметров этого закона.

Вид закона выбирается из каких-либо теоретических или практических соображений, а параметры следует вычислять, исходя из имеющейся выборки.

Например, для нормального закона нужно определить математическое ожидание а и среднее квадратическое отклонение Математическая статистика а для распределения Пуассона достаточно одного параметра Математическая статистика

2°. Обозначим через Математическая статистикапараметр, подлежащий определению, а через Математическая статистикаего оценку. Оценки параметров должны удовлетворять следующим условиям:

1) несмещенности — математическое ожидание оценки параметра должно совпадать с самим параметром;

2) эффективности — при данном объеме выборки оценка должна иметь наименьшую дисперсию;

3) состоятельности — предел по вероятности при Математическая статистикапоследовательности таких оценок равен искомому параметру, т.е. вероятность того, что Математическая статистикастремится к нулю при Математическая статистика.

3°. Оценка называется точечной, если она определяется лишь одним числом, и интервальной, если она определяется двумя числами — концами интервала.

Число Математическая статистиканазывается точностью оценки, если имеет место неравенство — Математическая статистикаЕсли это неравенство имеет место с некоторой вероятностью Математическая статистика, то число Математическая статистиканазывается надежностью оценки, или уровнем надежности. Наиболее употребительными уровнями надежности являются

Математическая статистика

Интервал Математическая статистикав котором (с заданным уровнем надежности) находится параметр Математическая статистика называется доверительным интервалом оценки.

4°. Выборочной средней Математическая статистиканазывается арифметическое среднее СВ X по выборочной совокупности объема n:

Математическая статистика

Выборочная средняя служит несмещенной оценкой математического ожидания признака X или генеральной совокупности.

5°. Выборочная дисперсия — среднее арифметическое квадратов отклонений наблюденных значений Математическая статистикаот выборочной средней:

Математическая статистика

Математическая статистика — смещенная дисперсия СВ X, а в качестве несмещенной оценки дисперсии Математическая статистика генеральной совокупности X принимают величину

Математическая статистика

S — несмещенная дисперсия.

6°. Мода выборки — варианта Математическая статистикас наибольшей частотой, медиана Me — варианта, делящая ряд на две равные части: если n = 2k + 1, то Математическая статистикаа если n = 2к, то Математическая статистика

7°. Начальные эмпирические моменты Мk (к = 1,2,3,4) и центральные эмпирические моменты Математическая статистикаопределяются формулами:

Математическая статистика

8°. Варианты Математическая статистика, составляющие арифметическую прогрессию, называются равноотстоящими.

Для упрощения вычислений начальных моментов равноотстоящих вариант удобно переходить к так называемым условным, или центрированным вариантам: Математическая статистика где с — новое начало отсчета, а Математическая статистика— разность (шаг) прогрессии.

Центральные моменты первых четырех порядков равноотстоящей выборки Математическая статистикавыражаются через начальные моменты Математическая статистика условных вариант по формулам:

Математическая статистика

Асимметрия выборки: Математическая статистика эксцесс: Математическая статистика

В вычислениях можно указать индексом варианту, для которой вычисляются соответствующие моменты (например, Математическая статистика)

9°. Предположим, что признак X генеральной совокупности распределен нормально со средним квадратическим отклонением Математическая статистикаИмеет место формула доверительной вероятности Математическая статистикаМатематическая статистика Тогда с надежностью Математическая статистикаможно утверждать, что математическое ожидание случайной величины X принадлежит доверительному интегралу

Математическая статистика

Значение t следует найти в табл. 1 приложения по значению функцииМатематическая статистика

Доверительный интервал с надежностью а для оценки среднего квадратического отклонения сто нормального распределения по несмещенной оценке S определяется из неравенства:

Математическая статистика

где Математическая статистикаопределяется из табл. 5 приложения, в которой приведены значения функции Математическая статистикапо доверительной вероятности Математическая статистика и объему выборки n.

10°. Если признак X распределен по биномиальному закону с относительной частотой Математическая статистикато при больших n доверительным интервалом неизвестной вероятности р с надежностью Математическая статистикабудет интервал

Математическая статистика

Задачи с решениями

Задача:

Дан статистический ряд — число дней в году, пропущенных по болезни сотрудниками лаборатории.

Математическая статистика

Определить среднее число дней на одного человека, пропущенных по болезни, и разброс этого числа около среднего.

Решение:

Определим среднее выборки объема n = 30 (k = 7) по формуле (1):

Математическая статистика

Дисперсию и среднее квадратическое отклонение вычислим по формуле (2):

Математическая статистика

Имеем

Математическая статистика

Округляя до целых, получаем, что среднее число (математическое ожидание) пропусков в году на одного человека составляет 4 дня, разброс 3 дня.

Задача:

Выборка, приведенная в следующей таблице, соответствует времени обслуживания (в минутах) покупателя магазина:

Математическая статистика

Привести прогноз времени обслуживания магазином и среднее квадратическое отклонение этого времени. Найти моду вариационного ряда.

Решение:

От интервальной таблицы переходим к вариационному ряду, заменяя интервал времени центром этого интервала:

Математическая статистика

Мода — варианта с максимальной частотой; Математическая статистика

Числа вариационного ряда не удобны для вычислений, т.к. они большие, поэтому переходим к условным вариантам с новым центром с = 48 и шагом (разностью) h = 4. Положим

Математическая статистика

Вычислим выборочное среднее и дисперсию для новой варианты. Для удобства приводим таблицу с промежуточными вычислениями.

Математическая статистика

При помощи сумм в последней строке таблицы вычислим:

Математическая статистика

Обратный переход к вариантам х осуществляется по формулам, которые следуют из формул п. 8°:

Математическая статистика

Получаем:

Математическая статистика

Прогноз обслуживания: Математическая статистикамин, разброс Математическая статистикамин.

Задача:

Случайная величина X — число семян сорняков в пробе зерна, распределена по закону Пуассона. В таблице

Математическая статистика

приведено распределение числа семян сорняков в n = 1000 пробах зерна. В первой строке — количество Математическая статистика сорняков в одной пробе, во второй — число проб, содержащих Математическая статистикасемян сорняков. Найти точечную оценку неизвестного параметра распределения Пуассона.

Решение:

Закон Пуассона имеет вид Математическая статистика где m — число испытаний, произведенных в одном опыте, Математическая статистика— число наступлений события в i-м опыте. Для закона Пуассона математическое ожидание совпадает с параметром Математическая статистика С другой стороны, несмещенной оценкой М(Х) принимается среднее выборки Математическая статистика

Вычисляем Математическая статистика по формуле п. 4°:

Математическая статистика

Ответ.

Математическая статистика

Задача:

Время работы элемента радиоустройства подчиняется закону Математическая статистика

В таблице

Математическая статистика

приведено эмпирическое распределение среднего времени работы
n = 200 элементов: Математическая статистика — среднее время работы элемента в часах, Математическая статистика — количество элементов, проработавших Математическая статистика ч. Найти Математическая статистика

Решение:

Как известно, для показательного закона математическое ожидание М(Х) равно Математическая статистика Следовательно, точечной оценкой Математическая статистикаслужит Математическая статистика Вычислим Математическая статистика

Математическая статистика

Следовательно, Математическая статистика

Ответ Математическая статистика

Задача:

Дан вариационный ряд признака X:

Математическая статистика

Найти начальные и центральные моменты первых четырех порядков признака X, а также определить асимметрию и эксцесс.

Решение:

Вычисления проводим по формулам п. 7° для Математическая статистика и п. 8° для Математическая статистикаh = 1.

Математическая статистика

Задача:

По данным выборочного обследования 7, 3, 0, 7, 2, 1, 2, 4, 5, 3 определить несмещенную выборочную дисперсию и среднее квадратическое отклонение.

Решение:

Составим сначала вариационный ряд:

Математическая статистика

Вычислим выборочное среднее Математическая статистика

Математическая статистика

Вычислим теперь выборочную дисперсию Математическая статистика

Математическая статистика

Несмещенная оценка дисперсии имеет вид Математическая статистикаМатематическая статистика

Несмещенное среднее квадратическое отклонение: Математическая статистика

Задача:

Найти с надежностью 0,99 доверительный интервал для оценки неизвестного математического ожидания нормально распределенного признака X генеральной совокупности, если
Математическая статистика = 20,5; n = 36 и Математическая статистика= 3.

Решение:

Согласно п. 9° доверительным интервалом неизвестного математического ожидания является интервал Математическая статистика, где

Математическая статистика

Определим сначала t из равенства 2Ф(t) = 0,99, т.е Ф(t) = 0,495. Из табл. 1 приложения находим Математическая статистика

Далее, Математическая статистика Наконец,

Математическая статистика
Математическая статистика

Ответ. 19,21 < а < 21,79.

Задача:

Найти доверительный интервал для оценки с надежностью 0,99 неизвестной вероятности р биномиального закона распределения, если в 400 испытаниях событие наступило 140 раз.

Решение:

Согласно п. 10° искомый доверительный интервал имеет вид:

Математическая статистика

Находим также

Математическая статистика

Наконец,

Математическая статистика

Ответ. Математическая статистика

Задача:

Из текущей продукции токарного автомата был произведен выбор 250 валов. Результаты измерений отклонения диаметра валов от номинала приведены в таблице:

Математическая статистика

Требуется:

1) найти оценки математического ожидания, дисперсии и среднего квадратического отклонения случайной величины X — отклонения диаметра вала от номинала;

2) определить доверительные интервалы неизвестного математического ожидания и неизвестного среднего квадратического отклонения случайной величины X. Предполагается, что случайная величина X имеет нормальное распределение. Доверительную вероятность принять равной 0,95.

Решение:

1) Составляем вариационный ряд, принимая в качестве вариант середины соответствующих интервалов:

Математическая статистика

В третьей строке таблицы записаны произведенияМатематическая статистика а в четвертой — произведения Математическая статистика

Последний столбец содержит суммы чисел соответствующих строк. Таким образом,

Математическая статистика

2) Согласно п.9°

Математическая статистика

Из равенства Ф(t) =Математическая статистикаи табл. 1 приложения находим
t = 1,96.

Далее,

Математическая статистика

3) Доверительный интервал для оценки Математическая статистика нормального распределения по несмещенной оценке 5 определяется из неравенства (см. п. 9°):

Математическая статистика

где Математическая статистика определяется из табл. 5 приложения, в которой приведены значения функции Математическая статистикапо доверительной вероятности Математическая статистикаи объему выборки n.

Имеем

Математическая статистика

При Математическая статистика и n = 250 в табл. 5 приложения находим
t(0,95; 250) = 0,089.

Следовательно,

Математическая статистика

Значит, Математическая статистика

Построение теоретического закона распределения и его согласование с эмпирическими данными

1°. Предположим, что выборка объема n из генеральной совокупности значений случайной величины X задана в виде вариационного ряда. Требуется определить вид теоретического закона распределения СВ X и установить, насколько этот закон согласуется с данной выборкой.

Вид теоретического закона выбирается интуитивно, исходя из вида эмпирического полигона, а его параметры вычисляются по методике, изложенной ранее, в предыдущих параграфах.

2°. Согласование теоретического закона с эмпирическими данными произведем на основании критерия Пирсона «хи квадрат», который заключается в оценке вероятности величины

Математическая статистика

где Математическая статистика — теоретическая частота варианты Математическая статистика

Если вероятность Математическая статистикавелика (больше 0,5), то расхождения между эмпирическими и теоретическими частотами считаются случайными и полученный закон принимается (не отвергается). Для вероятностей Математическая статистикаимеются специальные таблицы.

Мы будем пользоваться табл. 3 приложения. В ней приводятся критические значения Математическая статистика соответствующие данному уровню значимости а и числу степеней свободы критерия r = k — m — 1, где k — число групп выборки, m — число параметров используемого теоретического закона.

Наиболее употребительными уровнями значимости являются:

Математическая статистика

Значение Математическая статистикав таблице находится на пересечении строки r и столбца Математическая статистика.
Если Математическая статистикато теоретический закон принимается, а если Математическая статистика то закон отвергается.

Проверка гипотезы о нормальном распределении генеральной совокупности

Предположим, что выборка случайной величины X задана в виде вариационного ряда с равноотстоящими вариантами.

Правило. Для того, чтобы при данном уровне значимости проверить гипотезу о нормальном распределении генеральной совокупности, необходимо:

1) вычислить Математическая статистика
2) вычислить теоретические частоты Математическая статистикагде n — объем выборки, Математическая статистика — шаг ряда, и,

Математическая статистика

(значения даны в табл. 2 приложения);

3) вычислить значение Математическая статистика

4) в табл. 3 приложения найти значение по уровню значимости а и числу степеней свободы r = k — 3 (k — число групп выборки);

5) сравнить Математическая статистикаесли Математическая статистикаполученный закон признается верным, а если Математическая статистикаполученный закон отвергается.

Примечание. Малочисленные интервалы Математическая статистикаследует объединить, а соответствующие частоты, как эмпирические, так и теоретические — сложить.

Задачи с решениями

Задача:

Построить теоретический закон распределения генеральной совокупности СВ Х, заданной в виде выборки объема
n = 100 вариант при помощи вариационного ряда

Математическая статистика

Используя критерий Пирсона при уровне значимости Математическая статистикаустановить, согласуется ли полученный закон с данной выборкой. Найти также асимметрию и эксцесс эмпирического распределения и дать им надлежащее толкование.

Решение:

Первую рабочую таблицу (с. 349) используем для вычисления эмпирических начальных и центральных моментов данного вариационного ряда. Для этого переходим к центрированным вариантам Математическая статистика(с = 11, h = 3); в качестве центра с новых вариант можно брать моду (Мо) или медиану (Me) исходного вариационного ряда. В данном случае Математическая статистика

Математическая статистика

При помощи таблицы находим последовательно:

Математическая статистика

При помощи Математическая статистика и Математическая статистиканаходим Математическая статистикаМатематическая статистика и Математическая статистика

Построим эмпирический полигон (рис. 8.4) и, исходя из его внешнего вида, выдвигаем гипотезу: генеральная совокупность распределена по нормальному закону с параметрами

Математическая статистика

Для проверки этой гипотезы воспользуемся новой рабочей таблицей (с. 350), в которой

Математическая статистика
Математическая статистика

Математическая статистика— целое число), Математическая статистика — функция Лапласа.

Математическая статистика

Из таблицы находим Математическая статистика а при Математическая статистикаи числе степеней свободы k = 7 — 2 — 1 = 4 ( k7 — число групп выборки, m = 2 — число параметров задачи) из табл. 3 приложения имеем Математическая статистика

Следовательно, выдвинутая гипотеза о нормальном распределении генеральной совокупности не отвергается. График теоретической функции плотности изображен на рис. 8.4 пунктиром. Сравнивая теоретический и эмпирический графики, видим, что эмпирический полигон скошен вправо (что соответствует As = 0,13) и «слегка низковершинный» (что согласуется с Еk = — 0,71).

Задача:

Дан вариационный ряд случайной величины X с n = 150 вариантами:

Математическая статистика

Построить теоретический закон распределения СВ X. Используя критерий Пирсона при уровне значимости Математическая статистикаустановить, согласуется или нет построенный закон с эмпирическими данными.

Решение:

Сначала объединим малочисленные варианты, переходя к новому вариационому ряду с k = 10 различными вариантами и объемом выборки n = 150 Новый вариационный ряд имеет вид:

Математическая статистика

Построив полигон этого вариационного ряда (рис 8.5), замечаем, что он напоминает график нормального распределения, поэтому можно выдвинуть гипотезу о нормальном распределении данной СВ X. Параметры Математическая статистика и Математическая статистиказакона вычислим при помощи рабочей таблицы. В ней отражены варианты Математическая статистика, их частоты, центрированные варианты Математическая статистикагде с = 5,5 — это варианта с наибольшей частотой (мода), a h = 0,5 есть шаг равноотстоящих вариант Математическая статистика

Математическая статистика