Поиск структуры с последовательностями метагенома: база данных Metagenomics помогает заполнить 10 процентов ранее неизвестных структур белка

Имеется близко к 15 000 семейств белков – группы семей, каковые разделяют эволюционное происхождение – в базе данных Pfam. Для практически трети (4,752) из этих семейств белков имеется по крайней мере один белок в каждой семье, у которой уже имеется экспериментально решительная структура. Для второй трети (4,886) из семейств белков сравнительные модели могли быть выстроены с определенной степенью уверенности. Для последней трети (5,211) из семейств белков в базе данных, но, не существует никакая структурная информация.

В выпуске 20 января 2017 Науки команда во главе с Дэвидом Бейкером Вашингтонского университета в сотрудничестве с исследователями в американском Университете Генома Сустава Министерства энергетики (ДОУ ДЖДЖИ), Офис ДОУ Научного Пользовательского Средства, информирует, что структурные модели были произведены для 614 либо 12 процентов семейств белков, каковые ранее не имели структурной информации в наличии. «То, что это могло быть достигнуто, применяя вычислительные способы моделирования, нисколько не был очевидные 5 лет назад», отметила команда в их статье. Это исполнение было сделано вероятным через сотрудничество, в котором сервер предсказания структуры белка лаборатории Бейкера Розетта проанализировала метагеномные последовательности, общедоступные на совокупности Integrated Microbial Genomes (IMG), которой руководит ДОУ ДЖДЖИ.«У громадного количества семейств белков (в Pfam) имеется низкое количество последовательностей», сообщило изучение первый создатель Сергей Овчинников, аспирант в лаборатории Бейкера. «Это стало причиной двум последствиям: 1) никто не беспокоился об этих семьях (так как они были мелкими); и, 2) способы коэволюции не могли быть применены, дабы изучить их.

С метагеномикой мы нашли, что кое-какие из этих закинутых семей лишь с горсткой последовательностей до сих пор, может сейчас стать столь же громадным как кое-какие самый изученные, в то время, когда информацию о метагеномике приняты во внимание! Помимо этого, мы можем предложить 3D модель представительной последовательности от семьи. Мы сохраняем надежду, что это приведёт к интересу к некоторым из этих семей».

Вооруженный последовательностями генома, исследователи как Бейкер были в состоянии выяснить комплекты аминокислот, каковые развиваются в один момент, кроме того при том, что они нигде не приятель около приятеля на развернутой цепи. Такие события предполагают, что эти аминокислоты – соседи в свернутом белке, предлагая намеки исследователей относительно структуры белка. Структурная близость может предложить функциональные отношения, и так естественный отбор, действующий на функцию, может одобрить не всего одну аминокислоту, но и все, что находится в комплекте.

Никос Кирпайдс, Прокариот ДОУ ДЖДЖИ Супер заголовок Программы, заявил, что сотрудничество между лабораторией Бейкера и ДОУ ДЖДЖИ разрешило команде придумывать сильный метод угадать структуры и структурные выравнивания. «Такие упрочнения, были ранее ограничены на семействах белков, произведенных от последовательностей, обнаруженных одиноком геноме лишь. Эти геномы включают примерно 200 миллионов последовательностей.

Как ожидалось, в то время, когда мы прибавили те отечественные информацию о метагеномике, применяя 5 миллиардов собранных последовательностей метагенома, дешёвых на отечественной базе данных IMG/M, мы смогли значительно увеличить освещение многих известных семейств белков. Упрочнения как данный в громадной степени зависят от доступности собранных последовательностей метагеномики, которая есть преимуществом, которое ДОУ ДЖДЖИ приносит к столу с отечественными отличными собраниями».

Кирпайдс сказал, что эта работа, которая кроме этого вовлекла исследователей ДОУ ДЖДЖИ Неху Варгезе и Джорджа Павлопулоса, воплощает второй вид сотрудничества, которое он желал бы видеть поощренный. «Люди приехали к нам, по причине того, что мы поддерживаем самую громадную интеграцию собранных метагеномов. Использование таких инструментов на отечественных данных снабжает хороший пример того, как более бессчётное сообщество может применять ресурсы ДЖДЖИ для открытия. Мы весьма желали бы видеть больше историй успеха как данный при помощи нового Научного требования Данных между ДЖДЖИ и Национальным энергетическим Изучением Научный Вычислительный центр (NERSC)».

Научное требование Информации о Микробиоме JGI-NERSC разрешит пользователям выполнить современное вычислительное изучение геномики и метагеномики и оказать помощь им перевести данные о последовательности, произведенную ДОУ ДЖДЖИ либо в другом месте, в биологическое открытие. Это требование предложения надеется на успех «Средств, Объединяющих Сотрудничество для Пользовательской Науки» (ФИКУС) инициатива, установленная, дабы поощрить и разрешить исследователям более легко объединить возможности и экспертные знания многократных национальных пользовательских средств в их изучение.

7 комментариев к “Поиск структуры с последовательностями метагенома: база данных Metagenomics помогает заполнить 10 процентов ранее неизвестных структур белка”

Оставьте комментарий