ONS: онтологія для стандартизованого опису втручань та спостережних досліджень у харчуванні

Анотація

Передумови

Мультидисциплінарний характер досліджень харчування - одна з головних сильних сторін. Однак водночас це є основною перешкодою для інтеграції аналізу даних, особливо для термінологічних та семантичних інтерпретацій, до яких звикли конкретні галузі досліджень або спільноти. На сьогоднішній день ще не вистачає належної онтології для структурування та формалізації концепцій, що використовуються для опису харчових досліджень.

Результати

Ми розробили Онтологію для харчових досліджень (ONS), узгодивши вибрані вже існуючі фактичні онтології з новими класифікаціями термінології у галузі охорони здоров’я та харчування. ONS є результатом наукового консенсусу 51 дослідницьких центрів у дев'яти європейських країнах. Класи онтології та відносини часто зустрічаються під час проведення, зберігання, гармонізації, інтеграції, опису та пошуку харчових досліджень. ONS полегшує опис та специфікацію складних харчових досліджень, як показано у двох сценаріях застосування.

Висновки

ONS - це перша систематична спроба забезпечити надійну та розширювану формальну систему онтології для досліджень харчування. Інтеграція нової інформації може бути легко досягнута шляхом додавання додаткових модулів (тобто нутрігеноміки, метаболоміки, нутрікінетики та оцінки якості). ONS забезпечує уніфіковану та стандартизовану термінологію досліджень харчових продуктів як ресурс для дослідників харчування, які не обов'язково можуть бути знайомі з онтологіями та концепціями стандартизації.

Передумови

Наука про харчування людини вивчає вплив компонентів їжі на обмін речовин, здоров’я, працездатність та стійкість людей до хвороб, а також охоплює вивчення поведінки людини, пов’язаної з вибором їжі. З іншого боку, дієтологічна епідеміологія оцінює взаємозв'язок між дієтою, поживними речовинами та здоров'ям та наслідками хвороби [1]. Проте існує основний розрив між описом профілактики захворювань на основі харчування та розумінням складної мережі взаємодій, за допомогою яких харчування модулює здоров'я. Щоб заповнити цю прогалину, набір підпрограм, пов’язаних з харчуванням (наприклад, харчова біохімія, клінічне харчування, харчова епідеміологія, нутригенетика та нутріметаболоміка), надає фундаментальні дані на різних рівнях та з різних точок зору, сприяючи розширенню науки про харчування як більш систематизована і складна дисципліна [2, 3]. Оскільки дані про харчування неоднорідні за якістю та характером, комплексний розгляд усіх аспектів є складним завданням [4], навіть якщо було досягнуто значного прогресу для покращення звітування про висновки та якості даних [5] досліджень харчування [6]., що є однією з передумов інтегрованого аналізу.

Для інтеграції доказів необхідна систематична реорганізація визначень понять. В даний час визначення понять часто походять із кількох джерел, з недоліком того, що незначні варіації можуть призвести до оманливих тлумачень [7]. Оскільки в біонауці загалом, і в галузі харчової науки зокрема, на одне і те ж поняття можна посилатися за допомогою декількох синонімічних термінів, абревіатур або абревіатур [8], а також за допомогою різних мов, класифікацій термінів, таких як медичні предметні рубрики (MeSH ) [9] або тезаурус NCI [10] надають основні ресурси. Однак тезауруси або контрольовані словники біомедичної інформації не визначають взаємозв'язку між поняттями. Хоча ці зусилля можуть бути використані для стандартизації загальних описів досліджень, значний прогрес виникне завдяки використанню ресурсів, які, крім стандартизації словникового запасу, включають також зв'язки/відносини між класами, такі як онтології, спеціально пристосовані до харчових наук.

Часто біомедичні дослідники посилаються на онтології, використовуючи терміни, які більш доречно відносяться до «контрольованих словників», «тезаурусів» (тобто списку понять та їх текстових описів, часто організованих в ієрархії або систематиці), або «таксономій» (тобто ієрархія, що складається з термінів, що позначають класи, пов’язані відношеннями під- та суперкласу). Однак належна онтологія визначається як офіційне представлення знань у певній реальності (тобто певній області знань) таким чином, що різні люди - і, особливо, комп’ютери - можуть розуміти поняття, що вони містять, і дізнаватися про них реальність, яка представляється [8, 11]. Онтології складаються з визначених класів сутностей, як правило, структурованих в рамках ієрархії знань, де поняття пов'язані стандартизованими [12] семантичними зв'язками (тобто "is-a", "part-of"), формально вказуючи відносини знань, такі як узагальнення специфікацій реальність інтересу [13].

Методи

Умови для включення до ONS були зібрані серед партнерів консорціуму ENPADASI, а також із шаблонів для завантаження даних та метаданих у бази даних DASH-IN. Відповідно до принципів ливарного виробництва OBO [14], ONS був розроблений таким чином: (i) сумісний з іншими онтологіями, оскільки він був офіційно оформлений з використанням останньої мови OWL 2 Web Ontology Language [20] та специфікацій RDF [21] ] та відредагована за допомогою Protégé [22]; для перевірки узгодженості використовувався розвідник-відлюдник (http://hermit-reasoner.com/). (ii) Доступний за ліцензією Creative Commons (CC BY 4.0), опублікований на GitHub (https://github.com/enpadasi/Ontology-for-Nutritional-Studies) та на NCBO BioPortal (http: //bioportal.bioontology .org/онтології/ONS). (iii) ортогональні іншим онтологіям шляхом повторного використання існуючих термінів. Окрім забезпечення дотримання принципів ливарного виробництва OBO, ми також забезпечили, щоб ONS дотримувався все більш усталених принципів FAIR [23]. Таким чином, ONS також публікується в базі даних FAIRsharing (https://fairsharing.org/bsg-s001068).

Для поліпшення взаємодії з іншими онтологіями ONS спирається на підмножину Онтології для біомедичних досліджень (OBI) [24]. Підмножина була створена за допомогою інструменту ONTODOG [25] і складається з усіх термінів, що мають відношення до харчових досліджень, а також розширена відповідно до інфраструктури біоінформатики ENPADASI. Більше того, це забезпечило прийняття чітко визначеної та широко прийнятої структури для класів вищого та середнього рівня і головним чином дотримання Основної формальної онтології (BFO) [26] як верхньої онтології.

Додаткові відповідні онтології були використані ортогонально в ONS, як обговорювалося в результатах. Щоб забезпечити та підвищити ортогональність, усі терміни спочатку шукали за допомогою веб-служби ONTOBEE [27] та каталогізували з їх URI. Потім ONTOFOX [28] використовувався для імпорту всіх термінів із відповідними анотаціями та аксіомами (опція includeAllAnnotations). Нещодавно визначені терміни, специфічні для ONS, були позначені як “ONS_”, а потім 7-значне число. Терміни, пов’язані з описом їжі, також були включені шляхом імпорту підмножини термінів з онтології FOODON [29]. Усі проміжні файли цього процесу розробки (тобто файли шаблонів, що використовуються для веб-служб або імпортованих онтологій) зберігались у сховищі GitHub. Додатковий файл 1 містить інструкцію щодо перегляду, завантаження та внеску до ONS. Ця ж інструкція також присутня в Інтернеті на вікі-сторінці сховища GitHub (https://github.com/enpadasi/Ontology-for-Nutritional-Studies/wiki). У цьому процесі розробки були імпортовані терміни з ряду різних онтологій. У таблиці 1 подано короткий зміст класів, що були імпортовані в ONS (крім осіб), та їх онтологію походження.

Результати

Початкова онтологічна курація визначила велику кількість відповідних термінів, які слід врахувати. Потім терміни були або імпортовані з існуючих онтологій, перевизначені з існуючих концепцій, або анотовані de novo. Об’єднавши 3334 терміни, імпортовані з уже існуючих онтологій, та 100 нових визначених термінів, ONS описує як втручання, так і спостережні дослідження в харчуванні.

Основні концепції харчування

У системі ONS відповідні харчові концепції були пов’язані між собою, щоб запропонувати добре організований конспект знань в галузі охорони здоров’я та харчування. ONS узгоджує всі відповідні концепції з різних областей, визначаючи відповідні взаємозв'язки та вдосконалюючи та спрощуючи процес концептуальної організації багатьох аспектів реальних досліджень. Тут ми представляємо (рис. 1), як поняття дієти, їжі та харчових компонентів, які можна вважати центральними для онтології, спрямованої на ефективну допомогу дослідникам у стандартизованому описі поживного дослідження, яке вони проводять, були включені, визначені та підключені в ОНС.

стандартизованого

Ієрархічна структура УНС верхнього та середнього рівня, яка показує, наскільки відповідні харчові концепції пов’язані між собою. Беручи до уваги велику кількість концепцій та відносин, визначених в УНС, подальші докладні відносини тут не наведені. Терміни в зелених ящиках є специфічними для ONS, тоді як терміни в інших кольорових полях імпортуються із існуючих онтологій (тобто BFO, OBI, IAO, CHEBI, SIO, FOODON). Пунктирні стрілки представляють семантичні відношення “is_a”, тоді як суцільні стрілки - інші типи семантичних відношень

Дієта визначається як регулярний прийом їжі та пиття, прийнятий людиною чи твариною (ONS_0000080). Для цілей харчової спільноти ми далі детально розробили концепцію дієти на три підкласи: (i) Звичайна дієта визначається як регулярний курс прийому їжі та пиття, прийнятий населенням у певному географічному районі або в певному культурному встановлення або дотримання певної загальної харчової поведінки. Він також призначений як дієта, яку людина дотримуватиметься без подальшого призначення або показань, тобто вегетаріанська дієта (ONS_0000083). (ii) Призначена дієта визначається як дієта, призначена лікарем/дієтологом для задоволення конкретних харчових потреб людини (ONS_0000082). (iii) Інтервенційна дієта визначається як дієта, яку вводять під час інтервенційного дослідження. Зазвичай воно включає прийняття певного харчового втручання (ERO_0000347), призначеного як припис споживання або не споживання певної їжі, і слідує чіткому плану дослідження. Дослідження інтервенцій, як правило, порівнюють принаймні дві підгрупи популяції, одну контрольну групу, яка отримує нульове харчування, та одну або кілька тестових груп, які отримують втручання (ONS_0000081).

Харчовий компонент визначається як будь-яка речовина, яка розподіляється в харчових продуктах. Він включає матеріали, отримані з рослин або тварин, такі як вітаміни або мінерали, а також забруднювачі навколишнього середовища (CHEBI_78295, ONS_0000073). Виходячи з цього визначення, ми далі детально розробили концепцію харчових компонентів у різні підкласи: (i) Поживна речовина (ONS_0000077): Поживна речовина - це харчовий компонент, який використовується організмом для нормальних фізіологічних функцій, що гарантують виживання та ріст. Він повинен надходити в адекватних і визначених кількостях з продуктів, що вживаються в межах дієти. Гіпотрофія виникає, коли не забезпечується потрібна кількість поживних речовин. (ii) Харчовий біоактив (ONS_0000076): Харчовий біоактив - це харчовий компонент, відмінний від тих, що необхідні для задоволення основних потреб людини у харчуванні (поживних речовинах). Харчові біоактивні речовини модулюють один або кілька метаболічних процесів, що може призвести до зміцнення здоров'я. Щоденне необхідне споживання харчових біоактивних речовин ще не встановлено, і немає жодних доказів того, що недоїдання трапляється, коли не надається потрібна кількість. (iii) Забруднювач: Забруднювач - це небажаний харчовий компонент, який робить їжу більше непридатною для використання (ONS_0000075). (iv) Добавка: добавка - це компонент, що додається до їжі для її поліпшення або збереження (ONS_0000074).

Для поняття їжі можна знайти кілька визначень. Як приклад, CHEBI (CHEBI: 33290) визначає "Будь-який матеріал, який може потрапити в організм", а MESH (MeSH D005502) визначає "Будь-які речовини, що надходять в організм, що забезпечує харчування". Для цілей харчової спільноти поняття їжі було розширено, оскільки їжа визначається як складна матриця, яка споживається людиною в процесі їжі або пиття (ONS_0000079). Їжа є носієм поживних речовин, біоактивних речовин та, інколи, інших компонентів їжі. Вживання їжі через споживання їжі дотримується певної дієтичної схеми, яка визначає дієту. Поживні речовини та біоактивні речовини, що містяться в їжі, можуть бути використані організмом людини завдяки процесу травлення (ONS_0000101), всмоктуванню (ONS_0000102), метаболізму (ONS_0000103) або завдяки втручанню мікрофлори кишечника (OHMI_0000020). Поняття їжі можна розділити на наступне: (i) Сира їжа: Сира їжа - це неварена, необроблена їжа, яка споживається в природному стані (ONS_0000099); (ii) Оброблена їжа: оброблена їжа є результатом процесу домашнього або промислового приготування їжі (ONS_0000100).