Как ГМО спасает планету и почему люди этому мешают. Анна Иванова
Чтение книги онлайн.
Читать онлайн книгу Как ГМО спасает планету и почему люди этому мешают - Анна Иванова страница 10
Вторая подсказка для биоинформатиков также основана на статистике и во многом следует из факта существования принципа предпочтения кодонов. Представьте, что перед вами фото многолюдной улицы неизвестного вам города. Вы бы хотели понять, где именно сделано это фото. Оценив, какой оттенок кожи и разрез глаз вы видите на фото чаще, вы можете сделать первые выводы. Если добавить к признакам, какую одежду предпочитают люди с фото, можно скорректировать свои выводы. Добавим далее то, какая архитектура преимущественно попала на снимок, и вуаля – наш прогноз стал достаточно хорошим даже для снимка крупного портового города, каковые известны своей смесью национальностей, культур и архитектур. Примерно так же мы можем посмотреть и на геном. Сначала оценить, как часто в нем встречаются определенные буквы. Чаще всего измеряют долю букв Г и Ц (этот параметр получил название ГЦ-состав) или долю букв А и Т (АТ-состав) на геном или на определенный фрагмент генома. Уже по такому простому, казалось бы, параметру можно неплохо различать между собой различные организмы. Например, в человеческом геноме доля букв Г и Ц составляет в среднем 41 % (есть отдельные специфические регионы в геноме, которые содержат значительно больше или меньше, но среднее для большей его части такое)[33], а в геноме бабочки монарха (Danaus plexippus) ГЦ-контент равен 31,6 %[34].
Затем можно изучить различные двухбуквенные сочетания. Например, сколько раз в геноме (или определенном регионе генома) найдется сочетание АГ, или АТ, или ЦЦ. Потом вычислить частоту вхождения различных троек. Например, как много в геноме сочетаний ЦЦЦ, ГГГ или АГА. После перейти к четверкам и определить, скажем, процент вхождения сочетаний ААГГ и ЦЦГА. Затем к пятеркам… Таким образом мы сформируем индивидуальный портрет генома из признаков частоты вхождения в него различных подстрок. Такой же портрет мы можем получить для каждого отдельного региона в этом геноме. А потом наложить два портрета друг на друга и сделать выводы о том, вписывается ли рассматриваемый фрагмент в картину всего генома. Если ответ «да», вероятно, все в нем «родное». Если ответ «нет», можно предположить, что там есть ген, который был перенесен
32
Также агробактериальные вставки в таком случае можно найти и молекулярно-биологическими методами. –
33
International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome. Nature 409, 860–921 (2001). https://doi.org/10.1038/35057062
34
Cong, Q., Shen, J., Li, W., Borek, D., Otwinowski, Z., & Grishin, N. V. (2017). The first complete genomes of Metalmarks and the classification of butterfly families. Genomics, 109(5–6), 485–493. doi:10.1016/j.ygeno.2017.07.006. https://www.sciencedirect.com/science/article/pii/S0888754317300642