"Записки научных семинаров ПОМИ"
Том 486, стр. 178-189
Неасимптотический анализ статистики
Лоули--Хотеллинга для данных большой размерности
А. А. Липатьев, В. В. Ульянов
Московский государственный
университет им. М. В. Ломоносова,
ГСП-1 Москва, 119991 Россия
allipatev@cs.msu.ru
Московский государственный
университет им. М. В. Ломоносова,
ГСП-1 Москва, 119991 Россия;
Национальный исследовательский университет
Высшая школа экономики
ул. Мясницкая, д. 20,
Москва, 101000 Россия
vulyanov@cs.msu.ru
- Аннотация:
В статье
рассматривается общая линейная гипотеза, частными случаями которой
являются модель многомерного дисперсионного анализа (MANOVA) и модель
множественной линейной регрессии. В прикладных исследованиях большую
известность получили критерии Лям\-бда Уилкса (Wilks' lambda), след Пиллая
(Bartlett--Nanda--Pillai test), след Лоули--Хотеллинга (Lawley--Hotelling
test) и наибольший корень Роя (Roy maximum root test). Для первых трех
статистик известны предельные распределения в различных асимптотических
постановках. В данной статье получены вычислимые оценки скорости
сходимости нормированной статистики Лоули--Хотеллинга к стандартному
нормальному распределению при условии, что размерность данных возрастает
пропорционально объёму выборки. Приведенный результат позволяет корректно
вычислять p-значения в прикладных задачах многомерного анализа данных.
Задачи в постановке, когда число анализируемых признаков сравнимо с
объемом выборки, все чаще возникают в медицине, биологии (например,
исследования ДНК--микрочипа) и в финансовом секторе.
Библ. -- 9 назв.
- Ключевые слова: точность приближений; многомерный дисперсионный анализ; вычислимые оценки;
статистика Лоули--Хотеллинга; данные большой размерности
[computable estimates, accuracy of approximation, MANOVA, computable error bounds, Lawley--Hotelling Statistic, high dimensional data]
Полный текст(.pdf)