В геномных базах данных нашли сто тридцать две тысячи новых вирусов.

Вирусы можно увидеть в электронный микроскоп, но искать их лучше всё-таки по их нуклеиновым кислотам, по ДНК и РНК. Попав в клетку животного, растения, гриба, водоросли, бактерии, вирус размножается в ней, наполняя клетку собственным генетическим материалом (а некоторые так даже встраиваются в хозяйский геном). Если клетка погибла и разрушилась, её ДНК и РНК вместе с вирусными оказываются в почве или в воде. Поэтому, когда мы читаем нуклеиновые кислоты, извлечённые из тех или иных клеток или вообще из почвы, то с определённой вероятностью мы прочтём и какие-то вирусные последовательности.

(Иллюстрация: Rost9 / Depositphotos) 
Открыть в полном размере

При этом сейчас у нас накопилось огромное количество прочитанных последовательностей, в том числе и последовательностей РНК. Её читают для того, чтобы оценить активность тех или иных генов. Генетическая информация сначала копируется из ДНК в РНК, а потом уже РНК либо служит матрицей для синтеза белка, либо сама как-то работает – но, так или иначе, чем активнее ген, тем больше РНК на нём синтезируется. Анализируя набор РНК из тех или иных клеток, из тех или иных организмов, мы в первую очередь обращаем внимание на те последовательности, в которых мы заинтересованы; что там ещё есть в прочитанном (секвенированном) материале, остаётся неизвестным.

И вот группе исследователей, среди которых оказались сотрудники Санкт-Петербургского государственного университета, пришло в голову проанализировать РНК-последовательности, добытые из различных источников, на предмет РНК-вирусов. Как можно было их найти? РНК-вирусы хранят свои гены не в ДНК, а в РНК. Вирус высвобождает в клетку свою РНК и начинает её копировать. Эта РНК служит матрицей для синтеза вирусных белков и потом она же станет начинкой готовых вирусных частиц.

РНК-вирусов есть много разновидностей, но у них  есть общая черта – специальный фермент РНК-зависимая РНК-полимераза, которая синтезирует новую молекулу РНК на шаблоне старой. Фермент у разных вирусов опять же может отличаться в каких-то чертах, но в чём-то он у всех одинаков – в конце концов, с химической точки зрения он выполняет у них у всех одну и ту же реакцию. Поэтому в куче РНК-последовательностей РНК-вирус можно узнать по гену РНК-зависимой РНК-полимеразы, а если последовательность РНК-зависимой РНК-полимеразы идёт в комплекте с какими-то другими вирусными гена (или фрагментами генов), то можно понять, что это за вирус, известный или неизвестный, и в каком он родстве с другими вирусами.

Для поиска вирусов использовали открытые геномные базы, которые по размеру превосходят 20 петабайт и продолжают расти экспоненциально. Исследователи создали облачный вычислительный аппарат, который мог оперировать петабайтными объёмами, и проанализировали с его помощью 10,2 петабайта РНК-последовательностей из 5,8 миллионов различный биологических образцов. Так они нашли без малого 132 тысячи новых РНК-вирусов.

В некоторых случаях вирусы предстали во всей полноте своего генома, но чаще это были только фрагменты полной вирусной последовательности. Тем не менее, даже с помощью фрагментов удалось понять, какому вирусу они принадлежат – то есть какого он рода и кому приходится родственником. Так, удалось найти девять новых коронавирусов (один был в рыбе фугу, ещё один в аксолотле) и более трёхсот родственников вируса гепатита Д. Ещё нашлось более двухсот пятидесяти гигантских бактериофагов. Гигантские вирусы отличаются от остальных своими размерами, причём как физическими размерами, так и объёмом генетической информации – предполагается, что они могут заимствовать гены у своих хозяев и переносить их другим хозяевам. Гигантские вирусы до сих пор находили преимущественно в водорослях, амёбах и других мельчайших эукариотах, но и у бактерий свои вирусы-гиганты тоже есть.

Цифра в 132 тысячи кажется огромной, но на самом деле считается, что неизвестных вирусов насчитываются триллионы, так что искателям вирусов предстоит ещё масса работы. Стоит ли уточнять, что информация о вирусах лишней не бывает: чем больше мы будем о них знать, тем лучше сможем реагировать на будущие эпидемии, и тем лучше будем понимать экологию бактерий и водорослей, на которых без преувеличения держится вся экосистема Земли.

Полностью результаты исследований опубликованы в Nature.