Статистичне моделювання, причинно-наслідковий висновок та соціальні науки

Самоексперимент Олексія Guузея з позбавленням сну

Олексій "Метью Уокер" Чому ми спимо "переповнений науковими та фактичними помилками" Гузей пише:

Нещодавно я [Гузей] закінчив свій 14-денний самоексперимент з позбавленням сну, і в підсумку я проаналізував дані, які я маю, лише у стандартному p, поданому в казуальному висновку, Різне

45 коментарів

Я думаю, що я отримую його запитання, але коли у вас є вибірка 1, насправді не так багато статистики, яку ви можете зробити.

Це залежить від того, що метою вашого експерименту є, ні? Якщо ви хочете показати ефект позбавлення сну в людській популяції, звичайно, його N = 1. Якщо ви хочете показати ефект у * собі * (ви * - це * населення), тоді кожен день можна зарахувати до спостереження, припускаю (хоча і не незалежне).

Я не думаю, що відеоігра є адекватним, адекватним чи розумним тестом когнітивних порушень. Я впевнений, що багато людей можуть спілкуватися з тим, що грали у відеоігри до пізньої ночі без особливих труднощів або навіть важко заснути після гри. Широко відомий час використання екрану, який негативно впливає на сон, тому як це впливає на це, незрозуміло.

Я не знаю про SAT як тест на когнітивні порушення, але якщо людина приймає його щодня, чи не є якоюсь користю від повторення?

Відеогра також є поганим проксі для реальних ситуацій, таких як експлуатація важкого обладнання або водіння. У відеоіграх нічого не йде на карту. Немає ризику зруйнувати склад, наповнений 3-поверховими стелажами, і вбити себе чи інших. Немає ризику перекинути свого Кенворта через центральну лінію і вбити себе чи інших. Отже, ніякого стресу, пов’язаного з цим ризиком, немає.

Це піднімає інше питання. Тести Алекса тривають лише кілька хвилин. Як відіграють наслідки недосипання при повторних заняттях, таких як водіння протягом тривалого періоду - 10-14 годин?

Останнє, але не менш важливе, Алекс - це експеримент N = 1, а у віці 22 років загалом не репрезентативно серед працездатного населення, на яке вплине недосипання.

Спочатку я був здивований, дізнавшись, що Олексію 22 роки, але раптом я зрозумів: він потрапив у топ демографічних показників для ризикованих аварій! Занадто смішно.

> Це піднімає інше питання. Тести Алекса тривають лише кілька хвилин.

SAT триває 3 години (з двома перервами).

Як видно на малюнку 3 (і пояснено далі в дослідженні), я приймав СБ 6 днів.

О, вибачте зараз, я бачу, що ви брали СБ 3 дні поспіль у дні 12-14.

Мені здається, що проведення когнітивного тесту на собі не є початком для отримання достовірних результатів.

"Непочатковий" трохи сильний! Однією з причин формальних самоекспериментів та формальних самовимірів є те, що люди постійно роблять неформальне самоекспериментування та неформальне самовимірювання. Я погоджуюся, що є занепокоєння щодо упередженості (я писав про це кілька років тому стосовно Сет Робертса, який, на мою думку, став надто вправним обдурити себе), але я не думаю, що це означає, що самовимірювання є безнадійним.

> але я не думаю, що це означає, що самовимірювання є безнадійним

Я думаю, це залежить від того, що ви вимірюєте. Багато в чому (наприклад, дієта, фізична активність, зріст і вага тощо) самовимірювання виявилося дуже проблематичним, але я не думаю, що це не починаюче. Я думаю, що самооцінку когнітивних результатів слід вважати непочатковою.

Причиною є те, що проблема полягає не лише у потенційному упередженні в кількісному вимірі, але на додаток до цього у вас є потенційне упередження, вбудоване в самі когнітивні завдання.

Це може бути аналогічно поздовжній оцінці взаємозв'язку дієти та ваги - де упередження може виявлятися у вимірі ваги саме по собі, але також вплив упередженості може проявлятися з часом у самій поведінці споживання їжі. Ви складаєте потенційне упередження.

Іншими словами, ви можете кількісно визначити “помилку” в деяких формах самооцінки. Ви ніколи не могли виміряти один аспект упередженості, закладений у самооцінці когнітивної діяльності (аспект ефективності, а не аспект вимірювання результатів).

Це було б непомітно.

Як ви думаєте, якби хтось інший ввів SAT, це якимось чином було б більш вагомим тестом, ніж Гузей, просто взявши його самостійно? Я не розумію, як це могло би працювати.

Я бачив різні механізми отримання упередженого результату, наприклад, докладання додаткових зусиль, щоб звернути увагу, коли це робиться втомленим, але бути більш досконалим, коли це робиться інший раз, але я не бачу принципової проблеми з проведенням тесту собі.

Я пропоную це:

"Перший принцип полягає в тому, що ви не повинні обманювати себе, і вас найпростіше обдурити".

Скажімо, у мене була теорія, згідно з якою читання вашого коментаря зробить мене дурнішим. Тож я провів когнітивний тест на собі, перш ніж прочитати ваш коментар. Потім я прочитав ваш коментар і знову зробив когнітивну оцінку.

І, звичайно, я вдруге зробив гірше, що є доказом того, що моя теорія була правильною.

Ми знаємо, що загалом дані, що повідомляються самостійно, є досить ненадійними. Соціальна бажаність - одна з проблем самозвіту. Я б припустив, що несвідоме бажання довести свою правоту є певним упередженням соціальної бажаності.

> Як ви думаєте, якби хтось інший ввів SAT, це якимось чином було б більш вагомим тестом, ніж Гузей, просто взявши його самостійно? Я не розумію, як це могло би працювати.

Я думаю, що найбільшою проблемою є його інвестиції в результат. Це не тільки те, що він сам проводить тест. Це також те, що його теорія про те, що він оцінює, базується на результатах його виступу.

Це загальна проблема, що дослідник інвестує в результат дослідження. Оцінюючи власну ефективність, ви додаєте ще один потенційний та незмірний механізм зміщення.

В основному я згоден. Крім того ...

> Те, що він не може робити, якщо він не просто обдурює себе, а активно обдурює, - це робити краще, ніж його справжні здібності, коли втомився.

“Справжні здібності” є досить рухомою метою в когнітивних оцінках.

> Отже, єдине, про що він повинен турбуватися, це те, що він буде погано працювати, коли буде відпочивати.

Я розумію вашу думку, але я також не зовсім з цим згоден. Він міг бути спонуканим робити добре, коли відпочивав, і справді спонукати робити добре, коли втомлювався. Мотивація впливає на ефективність роботи людей, якість концентрату тощо.

Можливо, частиною проблеми може бути те, що я менше вірю в дійсність (і надійність) когнітивного тестування, ніж ти.

Але якщо ви маєте на увазі те, що «когнітивні здібності» - це не річ, тож навіть визначити «справжню когнітивну здатність» в один момент часу неможливо, я погоджуюсь. Ми маємо величезний діапазон когнітивних навичок: обробка мови (яка сама по собі включає багато під-навичок), математичні здібності (так само), коротко- та довготривале пригадування пам'яті, і так далі, і так далі. Втома не могла зменшити все це точно так само, і будь-який тест буде перевіряти лише якесь середньозважене середнє підмножина цих.

Концепція будь-якого тесту полягає в тому, що існує якесь «справжнє» число, яке ви намагаєтеся виміряти, хоча ваш вимірювальний прилад може погано його зафіксувати. Альфред Біне, співавтор популярного раннього тесту на рівень інтелекту, колись чудово відповів на питання "що таке" коефіцієнт інтелекту ", відповівши" коефіцієнт інтелекту - це те, що вимірює мій тест ". Він добре знав проблеми зі збиванням усіх когнітивних здібностей в одне число.

Zeузей перевірив свою здатність грати у відеоігри (наголошує на одному зважуванні та одній підмножині когнітивних навичок) та взяти SAT (дуже різне зважування та підмножина), і не побачив ефекту ні на одній. Це не означає, що ніде ні на що не впливає. Можливо, Гюзі чудово справляється з речами, які він знає вже тоді, коли втомиться, але, наприклад, було б жахливо вивчати новий матеріал.

Є застереження щодо того, що він дізнався про себе, але я, звичайно, думаю, що він чогось навчився.

> Я розумію вашу думку, але і я не зовсім з цим згоден. Він міг бути спонуканим робити добре, коли відпочивав, і справді спонукати робити добре, коли втомлювався. Мотивація впливає на ефективність роботи людей, якість концентрату тощо.

Я вважаю, що мотивація є важливою частиною цього, і ви правильно зауважте, що дуже мотивований виступати в деяких умовах, але не інші впливає на результати. Однак, враховуючи те, що я свідомо не намагався зменшити свої показники в будь-якому стані, і, можливо, мотивація становила 80% проти 90%, ми все одно очікували б побачити якийсь ефект позбавлення сну, якщо це серйозно впливає на мою діяльність. Але ми цього не побачили, саме тому я дійшов висновку, що:

> Я вважаю, що дані SAT категорично свідчать про те, що у багатьох аспектах мого пізнання не було значного або помірного когнітивного погіршення, враховуючи, що тест включає складні (для мене) питання розуміння читання і вимагає швидкого математичного мислення. Я вважаю, що він надає майже будь-які докази щодо незначного погіршення когнітивних функцій, враховуючи те, що я в кінцевому підсумку маю вільний час в кінці кожного розділу, який я використовую для перевірки своїх відповідей, і незначне погіршення когнітивного розвитку може призвести до того, що я отримаю приблизно те саме оцінка, але залишається менше часу.

Самоекспериментування є чудовим з багатьох причин. (1) Будь-хто може це зробити; (2) якщо ви вирішите зупинитися чи щось змінити, ви можете зробити це, не заплутуючи речі для купу інших людей; (3) якщо вас цікавить, як щось вас конкретно впливає, набагато краще використовувати себе як суб'єкта, ніж намагатися кількісно визначити середній ефект на багатьох інших людей; (4) вам не потрібно отримувати дозвіл від комісії з питань етики або когось іншого.

Покійний Сет Робертс був великим шанувальником самостійних експериментів і написав про це частину книги, але, думаю, ніколи не знайшов видавця і не втратив зацікавленості. Я вважаю, що Сет недостатньо критикував власні висновки і схильний "переслідувати шум" - мені подобається той факт, що zeузі доклав певних зусиль, думаючи, як його висновки можуть ввести його в оману, і, на мою думку, Сет повинен був зробити більше. Я перестану лихословити Сета, бо він не тут, щоб боротися зі своїм кутом. Я скажу, що я захоплювався тим фактом, що (як і Гюзі) Сет придумав щось, що може покращити його життя, знайти спосіб його кількісної оцінки і мати дисципліну для втручання та кількісної оцінки його наслідків час. За іронією долі, що цікаво, чи щось, одна з головних проблем Сета була майже протилежною проблемі zeузея: його турбувала безсоння, він хотів більше спати і відчував, що погано працює, якщо йому не вистачає сну. Сет спробував втручання, наприклад, не їв нічого вранці до 3 годин після бажаного часу неспання, і дотримувався цього протягом декількох тижнів, реєструючи його наслідки, перш ніж зробити висновок про те, що це допомогло йому чи не допомогло.

Я, я зацікавлений, але рідко в дисципліні дотримуватися регулярного плану та робити необхідні записи. Але все це стає простішим завдяки технологіям. Наведіть кілька прикладів: якщо вас цікавить щось, пов’язане з фітнесом, ваш годинник може фіксувати тривалість та інтенсивність тренування (у будь-якому випадку вимірюється через пульс). А для сну, залежно від годинника, ви можете автоматично реєструвати тривалість та якість сну (вимірюється рухами під час сну). Вага може відстежувати вашу вагу. Для тих, хто нам лінується навіть дотримуватися записування такого роду речей щоразу, ці автоматизовані інструменти можуть значно полегшити самостійне експериментування.

Нарешті, я згадаю, що мені сподобалася книга "Куріння вух і крик зубів" Тревора Нортона, яка стосується самоексперементування. Це в основному лише збірка цікавих історій, насправді не так багато, що могло б стати порадою для початківців самоекспериментаторів, але це веселе читання.

Думаю, спортсмени роблять це постійно і роблять це роками.

Кожен спортсмен - це експеримент одного - я вважаю, що це цитата Пітера Коу, тренера та батька Себ Коу, з "Кращого тренування для бігунів на дистанцію" Девіда Мартіна та Пітера Коу, що було як книжка тренувань, а частково фізіологія вправ підручник. (хоча у мене немає часу на пошук книги, щоб переконатися).

Усі хороші тренування передбачають самостійні експерименти.
Крім того, я думаю, що тренери та спортсмени, природно, використовують часткове об’єднання своїх експериментів. Як спрощений приклад, якщо я впроваджую 2x20 хв @ 300w в свою програму тренувань на велосипеді щодня протягом тижня, то наступного ранку я можу зафіксувати свій HR у спокої та суб’єктивну втому. Але я б не ходив на цьому одному експерименті самостійно, тому що робочий стрес тижня може відрізнятися від наступного тижня чи щось інше. Тому я міг би спробувати ще кілька разів (якби навантаження не було жахливо), і це дало б мені певне уявлення про те, наскільки складним було тренування в середньому.