Загальний і простий спосіб отримання Р. 2 із узагальнених лінійних моделей зі змішаними ефектами

Національний центр зростання і розвитку, Департамент зоології, Університет Отаго, 340 Great King Street, Данідін 9054, Нова Зеландія

метод

Відділ поведінкової екології та еволюційної генетики, Інститут орнітології Макса Планка, Еберхард-Гвінер-Штрассе, 82319 Севізен, Німеччина

Кафедра еволюційної біології, Університет Білефельда, Моргенбрід 45, 33615, Білефельд, Німеччина

Національний центр зростання і розвитку, Департамент зоології, Університет Отаго, 340 Great King Street, Данідін 9054, Нова Зеландія

Відділ поведінкової екології та еволюційної генетики, Інститут орнітології Макса Планка, Еберхард-Гвінер-Штрассе, 82319 Севізен, Німеччина

Кафедра еволюційної біології, Університет Білефельда, Моргенбрід 45, 33615, Білефельд, Німеччина

Резюме

Використання як лінійних, так і узагальнених моделей лінійних змішаних ефектів (LMM та GLMM) стало популярним не тільки в соціальних та медичних науках, але і в біологічних науках, особливо в галузі екології та еволюції. Інформаційні критерії, такі як Інформаційний критерій Akaike (AIC), зазвичай подаються як інструменти порівняння моделей для моделей із змішаним ефектом.

Презентація "пояснення дисперсії" (Р. 2) як відповідна узагальнююча статистика моделей зі змішаними ефектами, однак, рідко, хоча Р. 2 регулярно повідомляється для лінійних моделей (LM), а також узагальнених лінійних моделей (GLM). Р. 2 має надзвичайно корисну властивість забезпечувати абсолютну величину доброти придатності моделі, яка не може бути надана інформаційними критеріями. Як узагальнена статистика, яка описує величину роз'яснених дисперсій, Р. 2 також може бути кількістю біологічного інтересу.

Одна з причин недооцінки Р. 2 для моделей зі змішаними ефектами полягає в тому, що Р. 2 можна визначити різними способами. Крім того, більшість визначень Р. 2 для змішаних ефектів мають теоретичні проблеми (наприклад, зменшені або негативні Р. 2 значення у великих моделях) та/або їх використанню заважають практичні труднощі (наприклад, реалізація).

Тут ми обґрунтовуємо важливість звітності Р. 2 для моделей зі змішаними ефектами. Спочатку ми наводимо загальні визначення поняття Р. 2 для LM та GLM та обговоріть ключові проблеми, пов’язані з обчисленням Р. 2 для моделей зі змішаними ефектами. Потім ми рекомендуємо загальний і простий метод розрахунку двох типів Р. 2 (граничний та умовний Р. 2) як для LMM, так і для GLMM, які менш сприйнятливі до загальних проблем.

Цей метод ілюструється прикладами і може широко застосовуватися дослідниками в будь-яких галузях дослідження, незалежно від програмних пакетів, що використовуються для встановлення моделей зі змішаними ефектами. Запропонований метод може спростити презентацію Р. 2 для широкого кола обставин.

Вступ

Багато біологічних наборів даних мають багатошарові шари через ієрархічну природу біологічного світу, наприклад, клітини всередині особин, особини всередині популяцій, популяції всередині видів та види всередині спільнот. Тому нам потрібні статистичні методи, які явно моделюють ієрархічну структуру реальних даних. Лінійні моделі зі змішаними ефектами (LMM; їх також називають багаторівневими/ієрархічними моделями) та їх розширення, узагальнені лінійні моделі зі змішаними ефектами (GLMM) утворюють клас моделей, що включають багаторівневі ієрархії в дані. Справді, LMM та GLMM стають частиною стандартних наборів методологічних інструментів у біологічних науках (Болкер та ін. 2009), а також у соціальних та медичних науках (Gelman & Hill 2007; Congdon 2010; Snijders & Bosker 2011). Широке використання GLMM демонструє, що статистика, яка узагальнює належність моделі змішаних ефектів до даних, буде мати велике значення. На сьогоднішній день не існує такої узагальненої статистики, яка була б загальновизнаною для моделей зі змішаним ефектом.

Багато вчених традиційно використовують коефіцієнт детермінації, Р. 2 (в діапазоні від 0 до 1), як зведену статистику для кількісної оцінки належності моделей фіксованих ефектів, таких як множинні лінійні регресії, анова, анкова та узагальнені лінійні моделі (GLM). Поняття Р. 2, оскільки "пояснення відхилення" є інтуїтивним. Тому що Р. 2 є одиничним, він надзвичайно корисний як підсумковий індекс для статистичних моделей, оскільки можна об’єктивно оцінити придатність моделей та порівняти Р. 2 значення в дослідженнях подібним чином, як стандартизована статистика величини ефекту за певних обставин (наприклад, моделі з однаковими відповідями та подібним набором предикторів або іншими словами, це може бути використано для метааналізу; Nakagawa & Cuthill 2007).

У таблиці 1 ми коротко узагальнимо 12 властивостей Р. 2 (заснований на Kvålseth 1985 та Cameron & Windmeijer 1996; збірка, прийнята в Orelien & Edwards 2008), яка забезпечить читачеві добре відчуття того, що таке "традиційний" Р. 2 статистика повинна бути, а також забезпечити орієнтир для узагальнення Р. 2 до моделей зі змішаними ефектами. Узагальнююче Р. 2 від лінійних моделей (LM) до LMM та GLMM виявляється важким завданням. Ряд способів отримання Р. 2 запропоновано для змішаних моделей (наприклад, Snijders & Bosker 1994; Xu 2003; Liu, Zheng & Shen 2008; Orelien & Edwards 2008). Однак ці запропоновані методи поділяють деякі теоретичні проблеми або практичні труднощі (детально розглянуті нижче), і, отже, немає консенсусу щодо визначення Р. 2 для моделей зі змішаними ефектами з’явилося в статистичній літературі. Тому це не дивно Р. 2 рідко повідомляється як зведена статистика моделі, коли використовуються змішані моделі.

Посилання на нерухомість
Р. 2 повинен представляти добротність та мати інтуїтивне тлумачення Квалсет (1985)
Р. 2 не повинні мати одиниць; тобто безрозмірна Квалсет (1985)
Р. 2 має варіюватися від 0 до 1, де 1 являє собою ідеальну посадку Квалсет (1985)
Р. 2 має бути достатньо загальним для застосування до будь-якого типу статистичної моделі Квалсет (1985)
Р. На 2 значення не повинні впливати різні техніки припасування моделі Квалсет (1985)
Р. 2 значення з різних моделей, пристосованих до одних і тих самих даних, повинні бути безпосередньо порівнянними Квалсет (1985)
Відносна Р. 2 значення мають бути порівнянними з іншими прийнятими показниками добросовісності Квалсет (1985)
Усі залишки (позитивні та негативні) повинні зважуватися однаково Р. 2 Квалсет (1985)
Р. 2 значення завжди повинні збільшуватися, оскільки додається більше предикторів (без корекції ступеня свободи) Cameron & Windmeijer (1996)
Р. 2 значення на основі залишкової суми квадратів та на основі пояснення суми квадратів повинні збігатися Cameron & Windmeijer (1996)
Р. 2 значення та статистична значимість параметрів нахилу повинні показувати відповідність Cameron & Windmeijer (1996)
Р. 2 слід інтерпретувати з точки зору інформаційного змісту даних Cameron & Windmeijer (1996)

За відсутності Р. 2, інформаційні критерії часто використовуються та повідомляються як інструменти порівняння для змішаних моделей. Інформаційні критерії засновані на ймовірності даних, що надаються вмонтованою моделлю („ймовірність“), покараних кількістю оцінюваних параметрів моделі. Загальновживані інформаційні критерії включають інформаційний критерій Akaike (AIC) (Akaike 1973), інформаційний критерій Байєса (BIC) (Schwarz 1978) та нещодавно запропонований інформаційний критерій відхилення (DIC), (Spiegelhalter та ін. 2002; розглянуто в Claeskens & Hjort 2009; Грубер та ін. 2011 р .; Хамакер та ін. 2011). Інформаційні критерії використовуються для вибору „найкращих” чи „кращих” моделей, і вони справді корисні для вибору найбільш економних моделей із набору кандидатів (Burnham & Anderson 2002). Однак існують принаймні три важливі обмеження щодо використання інформаційних критеріїв стосовно Р. 2: (i) хоча інформаційні критерії дають оцінку відносної придатності альтернативних моделей, вони не говорять нам нічого про абсолютну придатність моделі (пор. Коефіцієнт доказовості; Burnham & Anderson 2002), (ii) інформаційні критерії не надають будь-яка інформація про дисперсію, що пояснюється моделлю (Orelien & Edwards 2008), та (iii) інформаційні критерії не можна порівнювати між різними наборами даних ні за яких обставин, оскільки вони дуже специфічні для набору даних (іншими словами, вони не є стандартизованою статистикою ефектів, яка може використовувати для метааналізу; Nakagawa & Cuthill 2007).

У цій роботі ми починаємо з надання найпоширеніших визначень Р. 2 в LM та GLM. Потім ми розглядаємо запропоновані раніше визначення Р. 2 заходи для моделей зі змішаним ефектом та обговорити проблеми та труднощі, пов'язані з цими заходами. Нарешті, ми пояснимо загальний і простий метод розрахунку дисперсії, який пояснюється LMM та GLMM, та ілюструємо його використання за допомогою модельованих екологічних наборів даних.

Визначення слова Р. 2

Ми навмисно залишили −2 у знаменнику та чисельнику, щоб („D“ означає „девіацію“) можна порівняти з рівнянням рівняння 3. Для LM (рівняння рівняння 1) статистика −2 log-ймовірності (іноді називається як девіація) дорівнює залишковій сумі квадратів на основі OLS цієї моделі (Menard 2000; див. серію формул негауссових відповідей у ​​таблиці 1 Cameron & Windmeijer 1997). Існує ще кілька визначень, заснованих на ймовірності Р. 2 (розглянуто в Cameron & Windmeijer 1997; Menard 2000), але ми не переглядаємо ці визначення, оскільки вони менш актуальні для нашого підходу нижче. Натомість ми обговоримо узагальнення Р. 2 до LMM та GLMM, а також пов'язані з цим проблеми в наступному розділі.

Поширені проблеми при узагальненні Р. 2

де рij є iго відповіді jго індивіда, хпривіт є iго значення jго особи для hй провісник, β0 - перехват, βh - нахил (коефіцієнт регресії) hй провісник, αj - індивідуально-специфічний ефект від нормального розподілу індивідуально-специфічних ефектів із середнім значенням нуля та дисперсією (між індивідуальними дисперсіями) та εegr;ij - залишок, пов'язаний з iго значення jго індивіда з нормального розподілу залишків із середнім значенням нуля та дисперсією (в межах індивідуальної дисперсії). Як видно з попередніх рівнянь, ЛММ мають за визначенням більше однієї дисперсійної складової (в даному випадку дві: і), тоді як ЛМ мають лише одну (Рівняння рівняння 1 і рівняння 2).

Друга проблема поширення та на моделі з більш ніж двома рівнями була розглянута Гелманом та Пардо (2006), які пропонують рішення для розширення до будь-якої довільної кількості рівнів (або випадкових факторів) у байєсівських рамках. Однак його загальна реалізація є досить складною, і тому ми посилаємось на оригінальну публікацію для тих, хто цікавиться цим методом.

Перша перешкода для встановлення моделей з REML стосується лише LMM, і це можна вирішити, використовуючи оцінки ML замість REML. Однак загальновідомо, що компоненти дисперсії будуть упередженими, коли моделі оснащуються ML (наприклад, Pinheiro & Bates 2000).

Що стосується другої перешкоди щодо вибору нульових моделей, здається, що обидві дозволені та прийняті в літературі (наприклад, Xu 2003; Orelien & Edwards 2008). Включення випадкових факторів у модель перехоплення, проте, безумовно, може змінити ймовірність нульової моделі, яка використовується як еталон, і, отже, вона змінюється Р. 2 значення. Це стосується важливої ​​справи. Для моделей зі змішаними ефектами, Р. 2 можна умовно розділити на два типи: маргінальний Р. 2 та умовні Р. 2 (Vonesh, Chinchilli & Pu 1996). Граничний Р. 2 стосується дисперсії, що пояснюється фіксованими факторами та умовно Р. 2 стосується дисперсії, яка пояснюється як фіксованими, так і випадковими факторами. Поки що ми концентрувались лише на колишньому, маргінальному Р. 2, але ми детальніше розглянемо розрізнення двох типів у наступному розділі.

Хоча ми не переглядаємо всі запропоновані визначення Р. 2 для моделей зі змішаними ефектами тут (див. Menard 2000; Xu 2003; Orelien & Edwards 2008; Roberts та ін. 2011), виявляється, що всі альтернативні визначення Р. 2 страждають від однієї або декількох вищезазначених проблем, і їх реалізація може бути непростою. У наступному розділі ми вводимо визначення Р. 2, який є простим і загальним як для LMM, так і для GLMM і, ймовірно, менш схильний до вищезазначених проблем, ніж запропоновані раніше визначення.