Нормалізація даних метаболоміки за допомогою EigenMS

Філіальна школа математики та фізики Університету Тасманії, Хобарт, TAS, Австралія

допомогою

Дочірній інститут Мензіса Тасманії, Університет Тасманії, Хобарт, TAS, Австралія

Центральна наукова лабораторія філії, Університет Тасманії, Хобарт, TAS, Австралія

Центральна наукова лабораторія філії, Університет Тасманії, Хобарт, TAS, Австралія

Партнерський центр фізичних та аерокосмічних фізіологічних наук, Королівський коледж Лондона, Лондон, Великобританія, Підрозділ ефективності виявлення фіброзу, R&D GlaxoSmithKline, Стівенедж, Великобританія

  • Карпієвич Юлія Василівна,
  • Соня Б. Ніколич,
  • Річард Вілсон,
  • Джеймс Е. Шарман,
  • Ліндсей М. Едвардс

Цифри

Анотація

Ділянки зразків інтенсивності зразків у порядку запуску на приладі для режиму позитивних іонів. Кожна коробка представляє зразок, кожен з п’яти днів представлений різним кольором. Зниження інтенсивності вказує на втрату інтенсивності сигналу протягом кожного дня.

Втрата інтенсивності вибірки ускладнює порівняння між експериментальними групами, а також призводить до збільшення кількості відсутніх значень у наступних вибірках. Таким чином, необхідні ретельне експериментальне проектування та рандомізація порядку вибірки, щоб мінімізувати впровадження систематичних упереджень та будь-яке можливе змішування результатів. Наш досвід змушує нас рекомендувати використовувати зразки контролю якості для моніторингу роботи приладу LC-MS. Наприклад, ми впроваджували зразки контролю якості протягом експериментальних прогонів, щоб допомогти нам контролювати продуктивність приладів. Ми застосували неповний дизайн блоку, де кожен блок складався з чотирьох зразків, двох діабетів та двох контрольних зразків у рандомізованому порядку. Кожен блок був поставлений у фігурні дужки зразками контролю якості, щоб дозволити оператору контролювати експеримент та проводити системну діагностику, якщо спостерігалася різниця в інтенсивності сигналу прогонів контролю якості. У цьому дослідженні зразки контролю якості не використовувались для обробки та нормалізації даних.

Ми нормалізували дані за допомогою EigenMS. EigenMS виявив 12 систематичних тенденцій упередженості та усунув їх наслідки з даних. На рис. 2 показані графіки інтенсивності захворювань та контрольних груп до (верхньої панелі) та після (нижньої панелі) нормалізації для тих самих даних, що і на рис. 1. Зразки на рис. 2 згруповані за групами захворювань (червоний проти. зелені, зразки контролю якості не показані), і в межах кожної групи вони відображаються в порядку запуску на приладі, так що перший зразок червоним кольором був запущений безпосередньо біля першого зразка зеленим кольором тощо. Навіть при регулярному очищенні вхідного отвору ми зіткнулися з деякими втратами сигналу, що видно з тенденції до зниження середніх значень (середніх стовпчиків) бокс-ділянок. Рис. 2, нижня панель показує, що нормалізація успішно скоригована для втрати інтенсивності сигналу та будь-яких інших систематичних упереджень та розмістила засоби кожного зразка майже на прямій.

Ділянки інтенсивності до нормалізації (верхня панель) та після (нижня панель). Кожна коробка представляє зразок. Зразки згруповані за групами захворювань (червоний проти зеленого, зразки контролю якості пропущені) і знаходяться в хронологічному порядку виконання на приладі в межах кожної групи.

Тенденції SVD у вихідних (ліва панель) та нормалізованих (права панель) даних клінічних досліджень. Відсоток у верхній частині кожної підзаголовки показує відсоток зміни даних, що пояснюється кожною тенденцією. На осі х знаходиться індекс вибірки від 1 до 79, де кожне коло являє собою зразок. Зразки згруповані за групами хвороб із 39 контрольними зразками, пронумерованими 1-39, а потім 40 зразків діабету за номером 40-79. Зразки мають хронологічний порядок виконання на приладі в межах кожної групи. Значення на осі y задовольняють рівняння: R = UDV ’, де R - матриця залишків (ліва панель) і матриця нормованих інтенсивностей (права панель); стовпці V представляють тенденції, що спостерігаються в даних. Для вихідних та нормалізованих даних побудовано три тенденції, що пояснюють найбільшу кількість варіацій.

Ми побачили покращення співвідношень нормалізованої інтенсивності метаболітів до фізіологічних змінних, які ми вимірювали для кожного суб'єкта. Ми відібрали 1100 піків, які, як було встановлено, суттєво відрізняються між двома групами із скоригованим значенням p Бенджаміні-Хохберга Рисунок 4. Кореляція з даними фізіології.