Кодування якісних даних: Як кодувати якісні дослідження (оновлено 2020 р.)

Автор - доктор філософії Альона Меделян - Обробка природних мов та машинне навчання

кодувати

Скільки годин ви витратили, сидячи перед електронними таблицями Excel, намагаючись знайти нові ідеї з відгуків клієнтів?

Ви знаєте, що запитання з відкритим опитуванням дають вам більш практичну інформацію, ніж запитування у своїх клієнтів лише про числовий бал Net Promoter (NPS). Але коли ви ставите відкриті, вільні текстові запитання, ви отримуєте сотні (а то й тисячі) відповідей із вільним текстом.

Як ви можете перетворити весь цей текст на кількісну, застосовну інформацію про потреби та очікування ваших клієнтів? Кодуючи якісні дані.

Продовжуйте читати, щоб дізнатися:

  • Що означає кодування якісних даних (і чому це важливо)
  • Різні методи кодування якісних даних
  • Як вручну кодувати якісні дані, щоб знайти важливі теми у ваших даних

Що таке кодування в якісних дослідженнях?

Кодування - це процес маркування та упорядкування ваших якісних даних для виявлення різних тем та взаємозв’язків між ними.

Кодуючи відгуки клієнтів, ви призначаєте мітки словам або фразам, які представляють важливі (і повторювані) теми в кожній відповіді. Ці мітки можуть бути словами, фразами або цифрами; ми рекомендуємо використовувати слова або короткі фрази, оскільки їх легше запам’ятовувати, обробляти та впорядковувати.

Кодування якісних досліджень для пошуку спільних тем та концепцій є частиною тематичного аналізу, який є частиною якісного аналізу даних. Тематичний аналіз витягує теми з тексту, аналізуючи структуру слова та речення.

Що таке якісний аналіз даних?

Якісний аналіз даних - це процес вивчення та інтерпретації якісних даних, щоб зрозуміти, що вони представляють.

Якісні дані визначаються як будь-які нечислові та неструктуровані дані; Коли розглядають відгуки клієнтів, якісні дані зазвичай посилаються на будь-які дослівні або текстові відгуки, такі як відгуки, відкриті відповіді в опитуваннях, скарги, повідомлення в чаті, інтерв’ю з клієнтами, примітки до справи чи публікації в соціальних мережах.

Наприклад, показник NPS може бути суто кількісним, але коли ви запитуєте клієнтів, чому вони дали вам рейтинг, вам знадобляться якісні методи аналізу даних, щоб зрозуміти коментарі, які клієнти залишають поряд із числовими відгуками.

Види якісного аналізу даних

  1. Аналіз вмісту: Це найпоширеніший приклад якісного аналізу даних. Це стосується категоризації, позначення та тематичного аналізу якісних даних. Це може включати поєднання результатів аналізу з даними про поведінку для глибшого розуміння.
  2. Наративний аналіз: Деякі якісні дані, такі як інтерв’ю чи примітки, можуть містити історію. Наприклад, процес вибору товару, його використання, оцінка його якості та рішення придбати чи не придбати цей товар наступного разу. Наративний аналіз допомагає зрозуміти основні події та їх вплив на загальний результат.
  3. Аналіз дискурсу: Це стосується аналізу того, що люди говорять у соціальному та культурному контексті. Це особливо корисно, коли ваша увага зосереджена на побудові чи зміцненні бренду.
  4. Фреймворк-аналіз: Під час якісного аналізу даних корисно мати фреймворк. Приклад такого фреймворку є кодовий фрейм (ієрархічний набір тем, що використовуються при кодуванні якісних даних).
  5. Обґрунтована теорія: Цей метод аналізу починається з формулювання теорії навколо одного випадку даних. Тому теорія «обґрунтована» фактичними даними. Потім можуть бути розглянуті додаткові випадки, щоб перевірити, чи вони є доречними та можуть додати до початкової теорії.

Якісне програмне забезпечення для аналізу даних

Досягнення в галузі обробки природної мови та машинного навчання дали змогу автоматизувати аналіз якісних даних, зокрема аналіз змісту та фреймворку

Незважаючи на те, що ручний людський аналіз все ще популярний завдяки його сприйманій високій точності, автоматизація аналізу швидко стає кращим вибором. На відміну від ручного аналізу, який схильний до упередженості та не масштабується до обсягу якісних даних, що генеруються сьогодні, автоматизований аналіз є не тільки більш послідовним і, отже, може бути більш точним, але також може заощадити купу часу, а отже гроші.

Найбільш часто використовуваним програмним забезпеченням для автоматизованого якісного аналізу даних є програмне забезпечення для аналізу тексту, таке як Thematic.

Чому важливо кодувати якісні дані?

Кодування якісних даних полегшує інтерпретацію відгуків клієнтів. Призначення кодів словам і словосполученням у кожній відповіді допомагає зрозуміти, про що йдеться у відповіді, що, в свою чергу, допомагає краще аналізувати та узагальнювати результати всього опитування.

Дослідники використовують кодування та інші процеси якісного аналізу даних, щоб допомогти їм приймати рішення, керовані даними, на основі відгуків клієнтів. Коли ви використовуєте кодування для аналізу відгуків своїх клієнтів, ви можете кількісно визначити загальні теми мовою клієнта. Це полегшує точну інтерпретацію та аналіз задоволеності споживачів.

Автоматизоване та ручне кодування якісних даних

Методи кодування якісних даних діляться на дві категорії: автоматизоване кодування та ручне кодування.

Ви можете автоматизувати кодування своїх якісних даних за допомогою програмного забезпечення для тематичного аналізу. Програмне забезпечення для тематичного аналізу та якісного аналізу даних використовує машинне навчання, штучний інтелект (ШІ) та обробку природних мов (НЛП) для кодування ваших якісних даних та розбиття тексту на теми.

Програмне забезпечення для тематичного аналізу є автономним, що означає ...

  • Не потрібно заздалегідь встановлювати теми чи категорії.
  • Вам не потрібно тренувати алгоритм - він навчається самостійно.
  • Ви можете легко зафіксувати “невідомі невідомі”, щоб визначити теми, які ви, можливо, не бачили самостійно.

все це заощадить ваш час (і безліч зайвих головних болів) при аналізі відгуків ваших клієнтів.

Нещодавно програмне забезпечення для тематичного аналізу було віднесено до категорії Unified Data Analytics.

Що таке тематичне кодування?

Тематичне кодування, яке також називають тематичним аналізом, - це тип якісного аналізу даних, який знаходить теми в тексті, аналізуючи значення слів і структуру речень.

Наприклад, коли ви використовуєте тематичне кодування для аналізу відгуків клієнтів, ви можете дізнатися, які теми найчастіше зустрічаються у відгуках. Це допомагає зрозуміти, що саме зумовлює задоволеність споживачів точно і ефективно.

Щоб дізнатись більше про те, як програмне забезпечення тематичного аналізу допомагає вам автоматизувати процес кодування даних, перегляньте цю статтю.

Як вручну кодувати якісні дані

До кінця цього допису ми зупинимось на ручному кодуванні. У різних дослідників різні процеси, але ручне кодування зазвичай виглядає приблизно так:

  1. Виберіть, чи використовуватимете дедуктивне чи індуктивне кодування.
  2. Прочитайте свої дані, щоб зрозуміти, як це виглядає. Призначте свій перший набір кодів.
  3. Переглядайте дані рядково, щоб якомога більше кодувати. На цьому кроці ваші коди повинні стати більш детальними.
  4. Класифікуйте свої коди та з’ясуйте, як вони вписуються у вашу рамку кодування.
  5. Визначте, які теми придумують найбільше, - і дійте за ними.

Давайте розберемо це трохи далі ...

Дедуктивне кодування проти індуктивного кодування

Перш ніж розпочати якісне кодування даних, вам слід вирішити, які коди ви будете використовувати.

Що таке дедуктивне кодування?

Дедуктивне кодування означає, що ви починаєте з попередньо визначеного набору кодів, а потім присвоюєте ці коди новим якісним даним. Ці коди можуть походити з попередніх досліджень, або ви вже знаєте, які теми вас цікавлять для аналізу. Дедуктивне кодування також називають кодуванням, керованим концепцією.

Наприклад, скажімо, ви проводите опитування щодо досвіду клієнтів. Ви хочете зрозуміти проблеми, які виникають внаслідок тривалого часу очікування дзвінка, тому ви вирішите зробити “час очікування” одним із своїх кодів, перш ніж почати переглядати дані.

Дедуктивний підхід може заощадити час і допоможе гарантувати кодування ваших сфер інтересів. Але також потрібно обережно ставитися до упередженості; коли ви починаєте з заздалегідь визначених кодів, у вас є упередження щодо того, якими будуть відповіді. Переконайтесь, що ви не пропускаєте інших важливих тем, занадто сильно зосереджуючись на доведенні власної гіпотези.

Що таке індуктивне кодування?

Індуктивне кодування, також називається відкритим кодуванням, починається з нуля і створює коди на основі самих якісних даних. У вас немає встановленої кодової книги; всі коди виникають безпосередньо з відповідей опитування.

Ось як працює індуктивне кодування:

  1. Розбийте якісний набір даних на менші зразки.
  2. Прочитайте зразок даних.
  3. Створіть коди, які охоплюватимуть зразок.
  4. Перечитайте зразок і застосуйте коди.
  5. Прочитайте новий зразок даних, застосовуючи коди, створені для першого зразка.
  6. Зверніть увагу, де коди не збігаються або де вам потрібні додаткові коди.
  7. Створіть нові коди на основі другого зразка.
  8. Поверніться назад і перекодуйте всі відповіді ще раз.
  9. Повторюйте крок 5, доки ви не закодуєте всі свої дані.

Якщо ви додаєте новий код, ділите наявний код на дві або змінюєте опис коду, перегляньте, як ця зміна вплине на кодування всіх відповідей. В іншому випадку однакові відповіді в різних точках опитування можуть мати різні коди.

Звучить багато роботи, так? Індуктивне кодування - це ітераційний процес, що означає, що він займає більше часу і є більш ретельним, ніж дедуктивне кодування. Але це також дає вам більш повний, неупереджений погляд на теми у всіх ваших даних.

Класифікуйте свої коди за рамками кодування

Після того, як ви створили свої коди, вам потрібно помістити їх у рамку кодування. Рамка кодування представляє організаційну структуру тем у вашому дослідженні. Існує два типи фреймів кодування: плоскі та ієрархічні.

Плоский кадр кодування

A плоский кадр кодування присвоює однаковий рівень конкретності та важливості кожному коду. Хоча це може здатися простішим і швидшим методом ручного кодування, може бути важко організувати теми та концепції навігації, коли ви створюєте все більше і більше кодів. Також важко з’ясувати, які теми є найбільш важливими, що може уповільнити процес прийняття рішень.

Ієрархічний фрейм кодування

Ієрархічні рамки допоможе вам організувати коди на основі їх співвідношення між собою. Наприклад, ви можете впорядкувати коди, виходячи з почуттів ваших клієнтів щодо певної теми:

У цьому прикладі:

  1. Код верхнього рівня описує тему (обслуговування клієнтів)
  2. Код середнього рівня визначає, чи є позитив позитивним чи негативним
  3. Третій рівень деталізує атрибут або конкретну тему, пов’язану з темою

Ієрархічне обрамлення підтримує більший фрейм код і дозволяє впорядковувати коди на основі організаційної структури. Це також дозволяє використовувати різні рівні деталізації у кодуванні.

Незалежно від того, чи є ваші фреймові коди ієрархічними чи плоскими, ваші фреймові коди повинні бути гнучкими. Ручний аналіз даних опитування займає багато часу та зусиль; переконайтесь, що ви можете використовувати свої результати в різному контексті.

Наприклад, якщо ваше опитування запитує клієнтів про обслуговування клієнтів, ви можете використовувати лише коди, що містять відповіді про обслуговування клієнтів. Тоді ви розумієте, що ті самі відповіді на опитування мають багато коментарів щодо продукції вашої компанії. Щоб дізнатись більше про те, що люди говорять про ваші товари, можливо, вам доведеться кодувати всі відповіді з нуля! Гнучка рамка кодування охоплює різні теми та ідеї, що дозволяє повторно використовувати результати пізніше.

Поради щодо кодування якісних даних

Тепер, коли ви знаєте основи кодування ваших якісних даних, ось кілька порад щодо того, як зробити якісні дослідження максимально ефективними.

Використовуйте книгу кодів, щоб відстежувати свої коди

Коли ви кодуєте все більше і більше даних, може бути важко запам'ятати всі ваші коди з маківки. Відстеження ваших кодів у кодовій книзі допомагає вам бути організованими протягом усього процесу аналізу даних. Ваша кодова книга може бути простою, як електронна таблиця Excel або документ текстового процесора. Коли ви кодуєте нові дані, додайте нові коди до своєї кодової книги та за необхідності реорганізуйте категорії та теми.

Обов’язково відстежуйте:

  • Етикетка, що використовується для кожного коду
  • Опис концепції або теми, на яку посилається код
  • Хто спочатку його кодував
  • Дата первісного кодування або оновлення
  • Будь-які примітки щодо співвідношення коду з іншими кодами у вашому аналізі

Створюйте високоякісні коди

Ваші коди повинні робити ці 4 речі:

Групуйте відповіді на основі тем, а не формулювань

Обов’язково згрупуйте відповіді з однаковими темами під одним кодом, навіть якщо вони не використовують однакові точні формулювання. Наприклад, такий код, як "чистота", може охоплювати відповіді, включаючи слова та фрази, такі як:

  • Чистий
  • Охайний
  • Брудний
  • Запилений
  • Виглядав як смітник
  • Могли б їсти з підлоги

Наявність лише декількох кодів та ієрархічне обрамлення полегшує групування різних слів та фраз під одним кодом. Якщо у вас занадто багато кодів, особливо у плоскій рамці, ваші результати можуть стати неоднозначними, а теми можуть перекриватися. Кодування вручну також вимагає, щоб кодер запам'ятав або зміг знайти всі відповідні коди; чим більше у вас кодів, тим важче знайти ті, які вам потрібні, незалежно від того, наскільки організована ваша кодова книга.

Зробіть точність пріоритетом

Кодування якісних даних вручну означає, що когнітивні упередження кодера можуть впливати на процес кодування. Для кожного дослідження переконайтеся, що у вас є інструкції з кодування та навчання, щоб кодування було надійним, послідовним та точним.

Одного, на що слід звернути увагу, є дефініційний дрейф, який відбувається, коли дані на початку набору даних кодуються інакше, ніж матеріал, кодований пізніше. Перевірте дефініційний дрейф у всьому наборі даних і робіть нотатки з описом того, як коди змінюються в результатах.

Якщо в одній команді працює кілька кодерів, попросіть їх перевірити кодування один одного, щоб усунути когнітивні упередження.

Висновок: 6 основних виходів для кодування якісних даних

Ось 6 остаточних виходів для ручного кодування ваших якісних даних:

  1. Кодування - це процес маркування та упорядкування ваших якісних даних для ідентифікації тем. Після кодування якісних даних ви можете аналізувати їх так само, як і числові дані.
  2. Індуктивне кодування (без попередньо визначеного кодового кадру) складніше, але менш схильне до упередженості, ніж дедуктивне кодування.
  3. Рамки коду можуть бути плоскими (простішими та швидшими у використанні) або ієрархічними (потужнішими та упорядкованішими).
  4. Ваші рамки коду повинні бути достатньо гнучкими, щоб ви могли максимально використовувати свої результати та використовувати їх у різних контекстах.
  5. Створюючи коди, переконайтеся, що вони охоплюють декілька відповідей, контрастують між собою та дотримуються балансу між занадто великою і занадто малою інформацією.
  6. Послідовне кодування = точність. Встановіть процедури кодування та керівні принципи та стежте за дефіцитним зсувом у процесі якісного аналізу даних.

Найкращі практики аналізу відкритих питань

Якщо ви пройшли так далеко, вас, мабуть, зацікавить цей безкоштовний посібник: Найкращі практики аналізу відкритих питань.

Якщо у вас є запитання, ви можете набрати до нашого чат-бота, і ми зробимо все можливе, щоб зв’язатися з вами.

Тематичний

Сотні статей зосереджувались на аналізі відгуків клієнтів, аналізі даних, стратегії клієнта та методах дослідження.