Аналіз складних даних опитування: опитування фірми Кауфмана

Анотація

Опитування фірми Кауфмана (KFS) було груповим дослідженням нових підприємств, що використовували складний зразок для збору ключових даних про динаміку суб'єктів господарювання, що належать до високих технологій, середніх технологій та жінок. Складні конструкції зразків типу, що застосовуються в KFS, як правило, мають багатокадрову вибірку, стратифікацію, коригування невідповідності та надмірної вибірки. Доведено, що кожен з цих елементів дизайну підвищує ефективність, з якою дослідники аналізують та роблять висновки з наявних даних. Однак існує також ризик того, що складний підхід до проектування вибірки може ускладнити аналіз даних через несамостійний вибір та вибір із різною ймовірністю. У цьому технічному огляді KFS ми описуємо метод відбору проб, який був використаний при панельному опитуванні. Ми досліджуємо, як не врахування вагових коефіцієнтів впливає на оцінки параметрів та результуючі стандартні помилки. Застосовуючи емпіричний підхід, ми показуємо, чому важливо враховувати стратифікацію та зважування. Цей документ демонструє важливість врахування особливостей складної конструкції обстеження в процесі аналізу даних.

аналізуючи

Це попередній перегляд вмісту передплати, увійдіть, щоб перевірити доступ.

Параметри доступу

Придбайте одну статтю

Миттєвий доступ до повної статті PDF.

Розрахунок податку буде завершено під час оформлення замовлення.

Підпишіться на журнал

Негайний онлайн-доступ до всіх випусків з 2019 року. Підписка буде автоматично поновлюватися щороку.

Розрахунок податку буде завершено під час оформлення замовлення.

Примітки

Основними одиницями відбору проб у КФС є підприємства, а не власники.

Вибірка - це перелік елементів сукупності з відповідною контактною інформацією.

«Починаючи з третього подальшого обстеження, для досягнення кращої точності було використано корекційне регулювання у шести пластах відбору проб» (П’ятий звіт про подальшу методологію KFS, 29 березня 2011 р.).

Cochran (1977) пояснює, чому стратифікація може підвищити точність оцінок щодо SRS: «Якщо кожен шар однорідний, оскільки вимірювання мало відрізняються від однієї одиниці до іншої, точну оцінку будь-якого середнього шару можна отримати з невеликого зразок у цьому шарі. Ці оцінки можна об'єднати в точну оцінку для всієї сукупності ".

Навіть прості статистичні дані, такі як середнє значення, стають нелінійними під час складного опитування.

Це позначення також застосовується до інших зразків конструкцій. Наприклад, для зразка конструкції без розшарування можна дозволити H = 1; для зразкового дизайну без кластерів ви можете дозволити м Привіт = 1 для кожного h і i.

Дослідникам, які зацікавлені в окремому вивченні високотехнологічного, середньотехнологічного або нетехнологічного бізнесу, слід уникати використання змінної страти вибірки для технології та гендерної власності, яку Mathematica використовувала для відбору вибірки KFS для розділення їх вибірки. Це пов’язано з тим, що основна галузь бізнесу підтверджувалась або оновлювалась під час кожного опитування; таким чином, змінна товщини вибірки не відображає поточну класифікацію первинної галузі для бізнесу (Farhat and Robb 2014).

У дуже рідкісних випадках, коли прошарок є субпопуляцією (домен має фіксований розмір вибірки), усунення випадків не є проблемою.

Список літератури

Aday, L. A., & Llewellyn, J. C. (2006). Розробка та проведення обстежень здоров’я: вичерпний посібник (3-е вид.). Сан-Франциско, Каліфорнія: Джоссі Басс.

Кокран, В. Г. (1977). Прийоми відбору проб (3-е вид.). Нью-Йорк, Нью-Йорк: Джон Вайлі та сини.

Фархат, Джозеф Б. та Робб, Алісія. 2014. Прикладний аналіз даних опитування з використанням Stata: дані опитування фірми Кауфмана. Доступно за адресою SSRN: http://ssrn.com/abstract=2477217

Haviland, Amelia and Savych, Bogdan (2007), Опис та аналіз нових ресурсів даних про малий бізнес. Робочий документ корпорації RAND № WR-293-1-ICJ.

Кіш, Л. (1965). Вибірка обстеження. Нью-Йорк: Джон Уайлі та сини.

Кіш, Л. (1987). Статистичний дизайн для дослідження. Нью-Йорк: John Wiley & Sons, Inc...

Кіш, Л. (1992). Зважування для нерівних пі. Журнал офіційної статистики, 8(2), 183–200.

Кіш, Л. (1995). Вибірка обстеження (Бібліотека класики Wiley, ред.). Нью-Йорк: Wiley and Sons.

Korn, E. L., & Graubard, B. I. (1995). Приклади різних зважених та незважених оцінок з вибіркового опитування. Американський статистик, 49 років, 291–295.

Лі, Е. С., і Фортофер, Р. Н. (2005). Аналіз даних складних опитувань (2-е видання). Тисяча Оукс, Каліфорнія: Мудрець.

Лор, С. Л. (2010). Вибірка: проектування та аналіз (Друге видання). Бостон: Брукс/Коул.

Марсден, П. В., & Райт, Дж. Д. (За ред.). (2010). Довідник опитувальних досліджень (друге видання). Бінглі, Великобританія: Emerald Publishing Group.

Пфефферманн Д. (1993). Роль відбірних ваг при моделюванні даних обстеження. Міжнародний статистичний огляд, 61, 317–337.

Пфефферманн Д. та Холмс Д. (1985). Міркування щодо надійності при виборі методу висновку для регресійного аналізу даних обстеження. Журнал Королівського статистичного товариства, серія A, 198, 268–278.

Вест, Б. Т., Берглунд, П., та Геєрінга, С. Г. (2008). Пильніше вивчення аналізу субпопуляції складних даних вибіркового обстеження. The Stata Journal, 8(3), 1–12.