"Записки научных семинаров ПОМИ"
Том 408, стр. 84-101
К основам метода понижения размерности объясняющих переменных
А. В. Булинский
Московский государственный
университет им. М. В. Ломоносова,
механико-математический факультет,
кафедра теории вероятностей,
119991 Москва, Россия
bulinski@mech.math.msu.su
- Аннотация:Изучение сложных явлений вовлекает
данные высоких размерностей.
Это типично для многих медицинских и биологических
исследований, особенно в генетике и фармакологии.
Мы изучаем бинарный отклик (показывающий, например,
состояние здоровья пациента), зависящий от $n$
дискретных факторов (объясняющих переменных).
Очень важной проблемой является нахождение
среди них наиболее значимых. Цель работы --
установить необходимые и достаточные условия
сильной состоятельности определенных оценок,
использующих кросс-валидацию, для ошибки,
возникающей в алгоритме предсказания величины
отклика. Также обсуждается влияние выбора
штрафной функции. Полученные результаты дают
обоснование для хорошо известного MDR-метода,
который широко применяется при анализе генетических данных.
Библ. -- 15 назв.
- Ключевые слова: бинарный отклик, значимые факторы,
штрафная функция, кросс-валидация, MDR метод, усиленный закон больших чисел для массивов,
сильная состоятельность оценок
[Binary response variable, significant factors, penalty function,
cross-validation, MDR-method, SLLN for arrays, strong consistency of estimates]
Полный текст(.pdf)