Читать онлайн «Методы регрессионного анализа при наличии ошибок в предикторных переменных»

Автор Федоров В.В.

АКАДЕМИЯ НАУК СССР НАУЧНЫЙ СОВЕТ ПО КОМПЛЕКСНОЙ ПРОБЛЕМЕ "КИБЕРНЕТИКА" Е. И. 1ИЛИНСКАЯ, Н. Н. ТОВМАЧЕНКО, В. В. ФЩОРОВ МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА ПРИ НАЛИЧИИ ОШИБОК В ПРЕДИКТОРНЫХ ПЕРЕМЕННЫХ (Предварительная публикация) Москва-1979 В работе исследуются приближенные методы анализа регрессионных задач при наличии ошибок в предикторных переменных» В вычислительном плане эти методы тесно связаны с методом наименьших квадратов» что существенно облегчает соэдание соответствующего математического обеспечения. Асимптотически предлагаемые оценки при выполнении ряда естественных требований обладают тем же набором овойотв, что и оценки метода наименьших квадратов в случае классической регрессии при нелинейной параметризации» ВВВДЕНИЕ Предположим, что величина иГ (отклик) и переменные •* (которые в дальнейшем будут называться предикторными) связаны соотношением W"l(x>e«), (i) П<*£(&,0) - заданная функция аргументов эсел* и £б52с*7 Индекс "ии здесь и далее отмечает истинные значения соответствующих величин. Обобщения излагаемых ниже результатов на случай многомерного отклика № особых трудностей не представляет и специально рассматриваться не будет» Целью регрессионных экспериментов, изучаемых в настоящей работе является оценивание параметров в по наблюдениям над парами ( 4^ % Xi ), I ■ TJL . В реальных ситуациях, по крайней мере, одна из величин &" или Л известны исследователю с некоторой "существенной" ошибкой. Ниже будут рассматриваться следующие регрессионные модели: Классическая регрессия, Цусть исследователю известны величины Ui *ш*1 + £± , или в более привычной форме: где Bi - случайные погрешности наблюдений (детали и более общие постановки см. , например! [l] глава 4).
Величины 321, которые часто называют условиями I -го наблюдения, известны точно: либо точно фиксируются, либо точно наблюдаются. Активные регрессионные эксперименты. Предположим, что исследователь стремится провести наблюдения при условиях ^ l » 1-2 -3- но в силу тех шш иных причин (случайных по овоецу характеру) изучаемый объект оказывается в условиях obi * ^ * Ас^ причем значения Л^' * неизвестны. Таким образом, доступными для анализа являются величины Объединяя (I) и (3), соответствующую регрессионную модель можно представить в виде ' ffi * >1С"1*А>1>еи. )+Ес> (4) где и£ и и>с - известны экспериментатору, а &-^ и 8 i - случайные величины (погрешности фиксации и наблюдений соответственно) • Паооивные наблюдения. При пассивных наблюдениях условия ос с задаются "природой", а исследователь имеет возможность их наблюдать (со случайной погрешностью &i ) одновременно о iii • т#е* известны величины ft = ип +£i, uL?xL + Ai. (5) Объединяя (I) и (5), получим регрессионную модель i:WW'* Впервые достаточно четкое разделение схем активного и пассивного экспериментов было проведено, по-видимому, в работе f2j , см. также [3] , глава 29. Хотя приведенные выше три регрессионные задачи, как будет ясно из дальнейшего, содержат много общего не только в постановке, но ж в методах анализа, они имеют к некоторые принципиальные отличия (выяонение этих фактов ж есть одна из целей настоящего обзора).