Математические модели в естественнонаучном образовании. Том II. Денис Владимирович Соломатин
Чтение книги онлайн.
Читать онлайн книгу Математические модели в естественнонаучном образовании. Том II - Денис Владимирович Соломатин страница 17
5.4.6. Если приведены последовательности для 3 терминальных таксонов, то информативных сайтов быть не может. Объясните, почему это так, и почему это не имеет значения.
5.4.7. Основания на определенном участке в выровненных последовательностях из разных таксонов образуют закономерность. Например, при сравнении
последовательностей на участке шаблонная запись (ATTGA) означает, что A появляется на этом участке в последовательности первого таксона, T во второй, T в третьей, G в четвертой и A в пятой.а. Объясните, почему при сравнении последовательностей для
таксонов может появиться возможных шаблона.б. Некоторые шаблоны неинформативны. Простыми примерами являются четыре паттерна, показывающие одно и то же основание во всех последовательностях. Объясните, почему существуют
неинформативных паттернов, все последовательности которых совпадают, кроме одной.в. Сколько всего существует неинформативных шаблонов, в которых 2 основания появляются один раз, а все остальные совпадают?
г. Сколько существует неинформативных шаблонов, в которых 3 основания появляется один раз, а все остальные согласованы?
д. Объедините свои ответы, чтобы рассчитать количество информативных шаблонов для
таксонов. Являются ли большинство шаблонов информативными для больших ?5.4.8. Компьютерная программа, вычисляющая оценки экономии, может работать следующим образом: сначала сравните последовательности и подсчитайте количество сайтов
для каждого появляющегося информативного шаблона. Затем для данного дерева вычислите оценки экономии и .5.4.9. Показатели экономичности можно рассчитать еще эффективнее, используя тот факт, что несколько разных шаблонов всегда дают одинаковую оценку. Например, при сопоставлении 4 таксонов шаблоны (ATTA) и (CAAC) будут иметь одинаковую оценку.
а. Используя это наблюдение для 4 таксонов определите, сколько различных информативных таблиц должно быть рассмотрено, чтобы получить оценку экономии для всех возможных комбинаций?
б. Повторите часть (а) для 5 таксонов.
5.4.10. Используйте метод максимальной экономии для построения некорневого дерева для моделируемых последовательностей a1, a2, a3 и a4 в файле данных seqdata.mat. Сначала поместите последовательности в строки массива командой a=[a1;a2;a3;a4]. Затем найдите информативные сайты самостоятельно запрограммированной функцией infosites=informative(a). Наконец, извлеките информативные сайты с помощью команды ainfo=a(:,infosites).
а. Каков процент информативных сайтов?
б. Сколько различных деревьев следует проанализировать, чтобы найти самое экономное, относящееся к четырем таксонам?