Використання індексів крові для прогнозування статусів зайвої ваги: ​​підхід, що базується на екстремальних умовах навчання

Філіальний коледж фізики та електронної інформаційної інженерії, Університет Веньчжоу, Веньчжоу, Китай, Ключова лабораторія символьних обчислень та інженерії знань Міністерства освіти, Університет Цзілінь, Чанчунь, Китай

індексів

Філіальний коледж комп'ютерних наук і технологій, Університет Цзілінь, Чанчунь, Китай, Ключова лабораторія символьних обчислень та інженерії знань Міністерства освіти, Університет Цзілінь, Чанчунь, Китай

Філіальний коледж комп'ютерних наук і технологій, Університет Цзілінь, Чанчунь, Китай, Ключова лабораторія символьних обчислень та інженерії знань Міністерства освіти, Університет Цзілінь, Чанчунь, Китай

Філіальний коледж фізики та електронної інформаційної інженерії Університету Веньчжоу, Веньчжоу, Китай

Партнерський коледж фармацевтичних наук, медичний університет Веньчжоу, Веньчжоу, Китай

Аптечний фармацевтичний відділ, Перша афілійована лікарня Медичного університету Веньчжоу, Веньчжоу, Китай

Аптечний фармацевтичний відділ, Перша афілійована лікарня Медичного університету Веньчжоу, Веньчжоу, Китай

  • Хілінг Чен,
  • Бо Ян,
  • Дайу Лю,
  • Веньбінь Лю,
  • Янлун Лю,
  • Сюхуа Чжан,
  • Люфен Ху

Цифри

Анотація

Статистичний аналіз проводили за допомогою програмного забезпечення SPSS 17. ІМТ, вік, кров та біохімічні показники двох груп аналізували одностороннім тестом ANOVA для виявлення статистичних відмінностей. У таблиці 2 наведено детальний статистичний опис. Кореляцію між ІМТ з кров'ю та біохімічними показниками аналізували за допомогою тесту Спірмена. Значення р, що були менше 0,05 (рівень значущості 5%), вважали статистичною значимістю у всіх аналізах.

Методи

1. Оцінка Фішера

Оцінка Фішера [21] є одним із найбільш часто використовуваних та ефективних методів зважування контрольованих ознак. Він визначає найбільш дискримінаційні ознаки відповідно до критерію рибалки. Враховуючи набір даних з n примірників xi, yi>, де означає, що вхідний простір ознак має m ознак, а yi ∈ c> - відповідні мітки класів. Оцінку m-го ознаки можна безпосередньо виміряти наступним чином: (1) де ni позначає кількість випадків у класі i, а μ m - середнє значення класу i та загальне середнє значення, що відповідає m-му функція відповідно. і σ m означають дисперсію класу i та глобальну дисперсію, що відповідає m-й ознаці, відповідно. Відповідно до рівняння (1), більша величина оцінки означає, що m-та ознака має більшу дискримінаційну силу між різними класами.

2. Екстремальна навчальна машина (ELM)

Цей розділ містить короткий опис ELM; див. [12, 22] для отримання додаткової інформації. Враховуючи навчальний набір даних із N зразків, xi ∈ R n є вхідним вектором ознак з n ознаками, а ti ∈ R m представляє цільовий вектор із m розмірами. Вихід ELM можна записати таким чином [12]: (2) де g (x) - функція активації, k - кількість прихованих нейронів, βi - вектор ваги між i-м прихованим нейроном та вихідним шаром, wi - вектор ваги між i-м нейроном у прихованому шарі та вхідним шаром, і bi вказує на зміщення i-го нейрона у прихованому шарі, oj - цільовий вектор j-го вхідного даних. Якщо ELM може апроксимувати ці N вибірки з нульовою помилкою, ми можемо отримати. Вищевказане рівняння можна переформулювати таким чином: (3) де H [23] являє собою вихідну матрицю прихованого шару нейронної мережі: (4) β = [β1, ⋯, βk] T - матриця вихідних ваг із прихованого шар до вихідного шару, а T = [t1, ⋯, tN] T позначає вектори цільових міток. Згідно з припущенням, що [24, 25] вхідні ваги та упередженість прихованого шару одиночної нейронної мережі з прямим прихованим шаром (SLFN) можуть бути довільно надані, вихідні ваги β можуть бути аналітично визначені Муром-Пенроузом (MP) узагальнене обернене до матриці H, як показано в наступному рівнянні: (5)

Використовуючи зворотний метод MP, можна досягти ефективності узагальнення ELM із різко збільшеною швидкістю навчання [22].

3. Запропонований метод

Навчальний набір ← під-набори k-1;

Набір перевірки ← залишилася підмножина;

Поступово оцінюйте характеристики за допомогою оцінки Фішера

Навчіть класифікатор ELM на кожному підмножині ознак fi із найвищими за рейтингом характеристиками, використовуючи варіацію кількості прихованих нейронів та типу функцій активації;

Оцініть навчену модель ELM на наборі перевірки з відповідним зменшеним набором функцій;

Повернути середні показники точності класифікації ELM за j-м набором перевірки;

4. Експериментальні конструкції

4.1 Експериментальна установка.

Для перевірки запропонованого підходу ELM для порівняння використовувались найсучасніші SVM та широко використовуваний метод ANN у моделюванні надмірної ваги. Була прийнята відома нейронна мережа зворотного поширення (BPNN) з навчальним алгоритмом Левенберга-Маркварда в наборі інструментів нейронної мережі MATALAB. Код реалізації, доступний за адресою http://www3.ntu.edu.sg/home/egbhuang, був використаний для побудови моделі ELM. Для SVM було прийнято набір інструментів LIBSVM, розроблений Чангом та Ліном [26]. Метод вибору ознак оцінки Фішера був реалізований з нуля в MATALAB.

Дані масштабували до діапазону [–1, 1] перед класифікацією. Емпіричний експеримент був проведений на двоядерному процесорі AMD Athlon 64 X2 5000+ (2,6 ГГц) з 4 ГБ оперативної пам'яті під управлінням Windows 7.

4.2 Відділ даних.

К-кратний CV [27] був використаний для оцінки результатів класифікації, щоб гарантувати неупереджені результати. У літературі значення k часто встановлюється як 10. В результаті цілі вибірки даних будуть випадковим чином розділені на 10 підмножин; кожного разу дев'ять підмножин використовуються для навчання, а решта використовується як тест. Процес тривав 10 разів. Кінцевий результат обчислювали шляхом усереднення результату за всіма 10 випробуваннями. Слід зазначити, що при розбитті даних доцільніше зберігати ту саму частку зразків у кожній згині, що і всю набір даних; тому вищезазначена стратегія стратифікованого k-кратного CV використовується для аналізу в наступному експерименті.

4.3 Критерії оцінки.

Для оцінки запропонованого методу були проаналізовані загальновживані критерії оцінки, такі як точність класифікації (ACC), площа під кривою робочої характеристики приймача (AUC) [28], чутливість та специфічність. Вони визначаються таким чином: (6) (7) (8) де TP, FN, TN і FP - це кількість справжніх позитивних, помилкових негативних, справжніх негативних і помилково позитивних, відповідно. AUC є одним з найпопулярніших методів оцінки ефективності двійкового класифікатора. Досконалий класифікатор забезпечує AUC 1. Це дослідження прийняло алгоритм AUC, розроблений у [29].

Результати

1. Виконання класифікації ELM

Попередні дослідження [14, 30] показали, що активаційні функції та приховані нейрони мають більший чи менший вплив на ефективність ELM. Тому ці два фактори були досліджені в наступному експерименті. Досліджено вплив різних функцій активації на ефективність моделі ELM. Було використано п'ять функцій активації, включаючи sig, sin, hardlim, tribas та radbas. На фіг.2 показана класифікаційна точність ELM з різними функціями активації від функції різної кількості нейронів. ELM з функцією активації sig перевершує ELM з іншими функціями. Отже, функція сигмоїда була використана в подальшому аналізі експерименту.

Для визначення оптимальної кількості прихованих нейронів реєстрували точність перевірки як функцію кількості прихованих нейронів. Як показано на фіг.3, ефективність ELM є відносно стабільною зі збільшенням прихованих нейронів. Тому необхідно визначити найбільш підходящу кількість прихованих нейронів для ELM. Тому різні моделі були побудовані з різними даними прихованих нейронів 5, 20, 35, 50, 65, 80 та 95. У таблиці 3 представлені середні результати класифікації результатів 10-кратного CV з різною кількістю прихованих нейронів. Як видно з таблиці, ефективність класифікації моделей ELM варіювалась з різною кількістю прихованих нейронів. 35 прихованих нейронів досягли найвищої точності перевірки. Тому для створення навчальної моделі в наступному аналізі було обрано 35 прихованих нейронів. Після того, як була визначена функція активації та кількість прихованих нейронів, остаточна модель тренувалася для прогнозування. Випадкові вхідні ваги та упередження прихованого шару, отримані в цьому дослідженні, перераховані в Таблиці інформації S1. У таблиці 4 представлені докладні результати 10-кратного CV ELM. З таблиці видно, що модель ELM досягає високих показників із середніми результатами 90,32% ACC, 89,98% AUC, 83,95% чутливості та 96,02% специфічності.

2. Порівняння зі SVM та BPNN

Щоб перевірити ефективність моделі ELM, SVM з ядром RBF та BPNN були застосовані для порівняння у всьому просторі функцій на одному і тому ж наборі даних. Для SVM використовували техніку пошуку в сітці [31] з використанням 10-кратного CV для визначення оптимальних значень параметрів функції ядра RBF. Діапазон пов'язаних параметрів C і γ варіював між C = і γ =. Випробувано 99 комбінацій параметрів (C, γ) (Поверхня точності навчання SVM з параметрами, отриманими за допомогою пошуку сітки, наведена в Інформації S1, Рис.); значення параметра параметрів ядра RBF було обрано з найкращою точністю CV. Тоді для створення навчальної моделі була використана найкраща пара параметрів (C, γ). Щодо BPNN, використовувалася тришарова мережа BP та різні параметри кількості вузлів у прихованих шарах (5, 10, 15, 20, 25 та 30) та різних епох навчання (50, 100, 200 та 300) були випробувані як критерій зупинки навчання. Згідно з попередніми результатами моделювання, найкращий результат був отриманий із прихованими вузлами 10 та епохою навчання 200. Ці параметри параметрів використовувались для подальшого аналізу.

3. Результати класифікації на основі вибору ознак

Обговорення

Звичайні аналізи крові включають оцінку функції печінки, функції нирок, рівня ліпідів та глюкози в крові. Ці дані можуть визначити фізіологічний стан суб'єкта. Суб’єкти із надмірною вагою мають різну метаболічну активність порівняно зі здоровими, що призводить до виявлених відмінностей. Клінічне дослідження серед підліткової популяції для вивчення пов'язаних із ожирінням змін лабораторних показників підтвердило, що у пацієнтів з ожирінням систематично змінюються показники аналізу крові [32]. Ожиріння вважається систематичним, хронічним запальним станом низького рівня, який успадковується і схиляє суб'єкта до багатьох захворювань [33]. Чітке виявлення статусу зайвої ваги може мати велике клінічне значення.