Європейський інститут біоінформатики


У консорціумі GO існує ряд модельних баз даних про організм, які є авторитетним джерелом анотацій GO для відповідних видів. Ці групи також регулярно інтегрують анотації з інших джерел, включаючи GOA (багатовидовий ресурс).

біоінформатики

GOA також надає низку видоспецифічних файлів для людини, миші, щура, даніо, арабідопсиса, курки, собаки, корови, свині, диктиостелію, хробака, дріжджів та дрозофіли. Анотації в цих файлах базуються на записах у геноцентричному референсному протеомі UniProtKB (GCRP), білкових комплексах (Complex Portal) та некодуючих РНК (RNACentral). GOA інтегрує ручні анотації з усіх інших груп консорціуму GO, а також низку зовнішніх груп, що анотують, де анотований ідентифікатор продукту гена може бути зіставлений з одним із трьох ідентифікаторів, які ми підтримуємо (UniProtKB, Комплексний портал та ідентифікатори RNACentral).
На нашому FTP-сайті доступні як модельні групи організмів, так і специфічні для GOA файли.

2. Чому я не бачу анотацію в записі UniProtKB, коли вона з’являється у файлі асоціації генів?


Цьому може бути кілька причин:

A. Якщо виявляється, що ручна анотація відсутня:

Якщо анотація GO була нещодавно створена, тоді UniProtKB може ще не мати перехресних посилань на анотацію; може бути затримка часу до 3 місяців.

B. Якщо виявляється, що відсутня електронна анотація:

Якщо ви переглядаєте кураторський запис UniProtKB (тобто такий у розділі Swiss-Prot в UniProtKB), тоді тут відображаються не всі електронні анотації. Включаються лише анотації деяких методів, таких як відображення HAMAP2GO та EC2GO.

Крім того, набори анотацій GO, що відображаються в UniProtKB, фільтруються, щоб спробувати надати вичерпний, але стислий набір перехресних посилань. Щоб перейти із запису UniProtKB до браузера QuickGO (який відображатиме найсучасніший та повний набір ручних та електронних анотацій до білка), натисніть на посилання [Переглянути повну анотацію GO на QuickGO] у унизу розділу перехресних посилань GO запису UniProtKB.

Однак, якщо жодна з цих причин, як видається, не стосується вашої відсутньої анотації, повідомте нам про це, і ми проведемо розслідування!

3. Чому видоспецифічні файли та файл асоціації багатовидових генів UniProt відрізняються?


Файл асоціації генів GOA UniProt містить усі ручні та електронні анотації, призначені GOA записам UniProtKB. Цей набір даних містить анотації до понад 800 000 різних видів (https://www.ebi.ac.uk/GOA/uniprot_release) і є надлишковим для електронних анотацій, коли два різні електронні методи призначили однаковий або менш детальний термін GO.

Файли, специфічні для виду, створюються за допомогою довідкових повних наборів протеомів для визначення білкового складу файлів. Файли, що стосуються видів, можуть містити анотації як до переглянутого (Swiss-Prot), так і до непереглянутого (TrEMBL) приєднання UniProtKB. Будь-який користувач, який бажає ідентифікувати лише розглянуту (Swiss-Prot) підгрупу анотації білків UniProt, зможе продовжувати це робити, використовуючи інформацію, надану у файлі gp_information.goa_uniprot, який можна знайти тут; ftp://ftp.ebi.ac.uk/pub/databases/GO/goa/UNIPROT/gp_ .

Ми прагнемо видалити електронні анотації зі специфічних для виду файлів, створених за тією ж методикою, які передбачають однакові або менш детальні терміни GO.

4. Як мені змінити приєднання UniProt до інших ідентифікаторів, наприклад Ensembl, EMBL, ідентифікатор гена RefSeq?


UniProt надає службу картографування, яка може перетворити приєднання UniProt на приєднання з безлічі баз даних, включаючи бази даних послідовностей нуклеотидних послідовностей EMBL/Genbank/DDBJ, Ensembl, GeneID та RefSeq. і навпаки. Цю послугу можна знайти тут. Якщо вам потрібна додаткова інформація або допомога у використанні цієї послуги, ви можете надіслати електронною поштою [email protected] .

5. Які інструменти GO я можу використовувати для відображення/порівняння анотацій із обраними білками/генами?


Окрім QuickGO, консорціум GO має на своєму сайті інші інструменти, корисні для аналізу GO. Їх можна знайти тут: http://amigo.geneontology.org/amigo/software_list

6. Чи правильно вважати, що генні продукти, котрі анотуються до дитини з терміном GO, автоматично будуть вважатися частиною батьківського терміна?

Так, можна вважати це безпечним, оскільки кожен термін GO повинен слідувати правилу правильного шляху: якщо дочірній термін описує генний продукт, тоді також повинні застосовуватися всі його батьківські терміни. Отже, якщо генний продукт анотується до "активності білкової тирозинкінази", батьківські терміни, такі як "активність протеїнкінази" та "фосфорилювання пептидил-тирозину", також застосовуються до генного продукту.

7. До кого мені зв’язатися, якщо в одному з ваших файлів є помилка анотації?


Якщо ви виявили помилку анотації, надішліть електронною поштою GOA ([email protected]) із якомога детальнішою інформацією щодо відповідної анотації. Потім ми зможемо це виправити або передати базі даних, відповідальній за анотацію, щоб вони могли її виправити.

8. Як завантажити груповий набір анотацій GO? Які існують формати?


Усі анотації GOA GO до приєднань UniProtKB доступні за адресою:

Існує файл ReadMe.txt, який пояснює різні доступні файли анотацій. Ми створюємо два формати файлів, які використовуються у консорціумі GO. Файл анотації гена (GAF) - це файл, розділений табуляцією на 17 стовпців. Формат файлу відповідає специфікаціям, які вимагає Консорціум GO, і тому відображаються ідентифікатори GO, а не назви термінів GO. На додаток до формату GAF, ми також пропонуємо файл даних анотації генних продуктів (GPAD), який являє собою файл, розділений табуляцією на 12 стовпців, і є більш нормалізованим, ніж GAF. Якщо вам потрібна більш персоналізована версія файлу анотацій, наш інструмент QuickGO може дозволити вам відфільтрувати цікаві анотації та експортувати їх як файл TSV. Формат TSV також матиме як термін GO, так і ідентифікатор терміна GO, що дозволяє швидко побачити, до якого терміну GO анотовано генний продукт.

9. GO slims - що це? Як я можу зробити один?


GO slims - це скорочені версії онтологій GO, що містять терміни, що охоплюють основні аспекти кожної з трьох онтологій GO. Вони дають широкий огляд змісту онтології без деталізації конкретних дрібних термінів.

Оскільки кожна спільнота має різні потреби, члени консорціуму архівували на домашній сторінці GO різноманітні тонкі файли. Подальшу документацію та посилання на ці тонкощі можна знайти за адресою: http://www.geneontology.org/GO.slims.shtml

Інструмент QuickGO від GOA можна використовувати для доступу або модифікації тонких деталей консорціуму GO або для створення власної. Ви можете отримати доступ до цієї функції на сторінці Дослідження біології на QuickGO

10. Що означають коди доказів?


Кожна анотація, подана до GO, повинна бути віднесена до джерела - наприклад, довідкової літератури, іншої бази даних або обчислювального аналізу. Крім того, ці анотації повинні вказувати, які докази знайдені в цитованому джерелі на підтвердження зв'язку між продуктом гена та терміном GO. Якщо ви хочете знайти більш детальну інформацію про значення та використання кодів доказів, документацію можна знайти на веб-сайті GO за адресою: http://www.geneontology.org/page/guide-go-evidence-codes

11. Як я цитую GOA?


Якщо ви використовуєте будь-які дані, отримані від GOA або QuickGO у публікації, цитуйте наступний документ:

Хантлі Р.П., Софорд Т., Мутово-Мелленет П, Шипіцина А, Боніла С, Мартін М.Дж., Оно Донован С
База даних GOA: оновлення анотацій генної онтології за 2015 рік.
Нуклеїнові кислоти Res. 2015 січ .; 43: D1057-63