Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Основные критерии нормальной теории и их многомерные аналоги. Информационные расстояния

↑

⇐ ПредыдущаяСтр 11 из 15Следующая ⇒

Пример 6.2. { x ₁,…, x_n } – н.о.р. , дисперсия σ² известна. Проверяется гипотеза H ₀: a = a ₀ против альтернативы H ₁: a = a ₁, a ₁- a ₀= Δ>0.

Примем за основу выборочное среднее . В случае справедливости H ₀ , поэтому статистику критерия Т выгодно построить так:

(6.1)

Если выполняется Н ₀, то - это ее центральное распределение; если выполняется Н ₁, то - нецентральное распределение. Величина называется параметром нецентральности. Решающее правило формулируется следующим образом: выбирается критическое значение Т * (рис.12.1) и

Если Т < T *, то принимается Н ₀;
Если Т T *, то принимается Н ₁.

Рис.6.1. Центральное и нецентральное распределения,

ошибки 1-го и 2-го рода

Задача 6.1. n =25, σ=2, Δ=1, α=β. Найти, чему равны α и β.

Решение. Параметр нецентральности =2.5. Поскольку α=β, то Т *= 1.25. Значит, α = β = 1- Ф(1.25) = 1- 0.89 =0.11.

Задача 6.2. n =25, σ=1, Δ=0.5, α=0.05. Найти β.

Решение. Т *= Ф^-1(1- α) = 1.65. Параметр нецентральности =2.5. Отсюда

Все задачи этого типа содержат 5 параметров. Задав любые 4 из них, можно найти значение пятого.

Пример 6.3. { x ₁,…, x_n } – н.о.р. , дисперсия σ² неизвестна. Проверяется гипотеза H ₀: a = a ₀.

Статистика Т здесь, очевидно, такая же, как в примере 6.2, но неизвестное СКО приходится заменять его оценкой:

. (6.2)

За счет дополнительного рассеяния, вызванного неопределенностью в s, центральное распределение несколько отличается от нормального. Оно называется t - распределением Стьюдента с n степенями свободы. Впрочем, при n >30 эти распределения практически неотличимы друг от друга.

В статистике T дисперсию можно оценивать не относительно a ₀, а относительно выборочного среднего :

За счет вносимого этим дополнительного рассеяния центральным распределением статистики Т оказывается распределение Стьюдента с (n -1) степенью свободы. При известной альтернативе H ₁: a = a ₁статистика Т подчиняется нецентральному распределению Стьюдента.

Для векторной выборки { X ₁,…, X_n }, где X_i – независимые случайные векторы, подчиняющиеся k - мерному нормальному закону N _k (a, Σ) при известной ковариационной матрице Σ гипотеза H ₀: a = a ₀проверяется на основе Т ²-критерия Хотеллинга:

(6.3)

Центральным для этой статистики является хи-квадрат (χ ²) распределение с n степенями свободы. При известной альтернативе H ₁: a = a ₁статистика Т ²подчиняется нецентральному распределению хи-квадрат.

При неизвестной Σ в статистику подставляется ее оценка, выборочная ковариационная матрица S = cov(X). Закон распределения статистики

(6.4)

даже в случае справедливости Н ₀ (центральное распределение) устроен достаточно сложно. Обычно используют его аппроксимацию

(6.5)

где F -распределение Фишера с параметрами v ₁, v ₂.

Пример 6.4. При проверке гипотезы Н ₀ о равенстве средних двух независимых нормальных выборок { x ₁,…, x _m } и { y ₁,…, y_n } с известными дисперсиями σ _x ² и σ _y ²естественно использовать статистику

(6.6)

Ее k -мерным аналогом является двухвыборочная статистика Хотеллинга

(6.7)

Если значения дисперсий σ _x ² и σ _y ²неизвестны, однако известно, что между собой они равны, используется двухвыборочная статистика Стьюдента

(6.8)

имеющая в качестве центрального распределение Стьюдента с (m + n -2) степенями свободы. Ее k -мерным аналогом является двухвыборочная статистика Хотеллинга

где (6.9)

Для ее центрального распределения используют аппроксимацию

(6.10)

При неизвестных и неравных дисперсиях задачу называют проблемой Беренса-Фишера. Оптимальный критерий здесь устроен крайне сложно. Статистику этого критерия и соответствующие таблицы можно найти в [2].

Геометрически в рассмотренных задачах границы критических областей и соответствующих доверительных областей - это поверхности эллипсоидов в R^k. Форма эллипсоидов в каждой задаче фиксирована, уровень значимости определяет величину правой части (свободного члена) в уравнении эллипсоида.

Значение Т² – статистик Хотеллинга удобно интерпретировать как расстояние в некоторой эллиптической псевдометрике - расстояние Махаланобиса D_M (см. разд.5). При этом формулы (6.3-6.4) определяют квадрат расстояния Махаланобиса от до вектора а ₀, (6.7, 6.9) - квадрат расстояния Махаланобиса между и . Иногда говорят о расстоянии Махаланобиса между законами распределения. Например, расстояние между N _k (a ₁, å₁) и N _k (a ₂, å₂)определяется формулой

В определении расстояния Махаланобиса часто либо опускают константу перед квадратичной формой, либо, наоборот, вводят какую-нибудь специальную константу из соображений удобства для данной конкретной задачи.

Замечание. Если записать для выборочной ковариационной матрицы S ее представление в виде S = О^T L О, то S ^-1 = О^T L^-1 О так что квадратичная форма, например, в уравнении (6.3) приобретает вид

где z_i – i- я главная компонента, σ_i² – ее дисперсия. Таким образом, Т ² представляет собой сумму статистик Стьюдента, построенных для каждой главной компоненты.

Пример 6.5. При проверке гипотезы Н ₀ о равенстве дисперсий в независимых нормальных выборках { x ₁,…, x _m } и { y ₁,…, y_n } используют статистику Фишера

или F (m -1, n -1) (6.11)

в зависимости от того, как оценивались дисперсии, где F (m, n) – распределение Фишера с параметрами (степенями свободы) m, n.

В многомерном анализе любой гипотезе может соответствовать большой набор видов альтернатив, поэтому там нет критериев, обладающих свойствами оптимальности. В качестве аналогов статистики F Фишера используют различные числовые характеристики матриц U = S ₁ S ₂^-1 или V = S ₁ (S ₁ + S ₂)^-1, где S ₁, S ₂ - выборочные ковариационные матрицы рассматриваемых выборок.

Пусть собственные числа матрицы U есть l₁, …, l _k, матрицы V - m₁, …, m _k. Наибольшее распространение имеют следующие четыре статистики:

- след Хотеллинга (или Лоули-Хотеллинга)

- след Пиллаи

- наибольший (наименьший) характеристический корень Роя

;

- статистика Уилкса (обычно рассматривают ее логарифм).

Распределения этих статистик для различных нулевых гипотез устроены чрезвычайно сложно. На практике их распределения обычно аппроксимируют с помощью F -распределения со специальным выбором числа степеней свободы. Все такие статистики можно интерпретировать как меры близости в оответствующих псевдометриках. Исторически сложилось так, что их называют информационными расстояниями.

Пример 6.6. Найти значения основных статистик многомерного анализа – информационных расстояний для двух 3-мерных выборкок, рассмотренных в разделе 2 и сохраненных в файле DT.mat.

Документ 12.1. Вычисление статистик многомерного анализа для 3-мерных выборок

load DT X Y; ax=(mean(X))’; ay=(mean(Y))’; % векторы - столбцы Sx=cov(X); Sy=cov(Y); % Расстояние Махаланобиса DM=(ax-ay)’*inv(Sx+Sy)*(ax-ay); disp(‘ Расстояние Махаланобиса ’); disp(DM); % След Хотеллинга T0=trace(Sx*inv(Sy)); disp(‘ След Хотеллинга ’); disp(T0); % Максимальный корень Роя Q=eig(Sx*inv(Sy)); q_max=max(Q); disp(‘ Максимальный корень Роя ’); disp(q_max); % Статистика Уилкса W=det(Sx*inv(Sy)); disp(‘ Статистика Уилкса ’); disp(W);

Ответ: Расстояние Махаланобиса 5.1349 След Хотеллинга 420.9978 Максимальный корень Роя 420.2474 Статистика Уилкса 0.9012

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

Познавательные статьи:

Психологические особенности спортивного соревнования

Приготовление дезинфицирующих растворов различной концентрации

Занятость населения и рынок труда

Социальный статус семьи и её типология

Последнее изменение этой страницы: 2021-03-09; просмотров: 340; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.217.86 (0.007 с.)