
При вычислении суммарных различий по совокупности признаков, в простейшем случае дистанция
характеризует долю признаков, по которым различаются сравниваемые группы, в общей совокупности
исследованных признаков. Эта доля является оценкой минимального возможного числа филогенетических
событий, разделяющих группы; в генофилетике ей иногда даѐтся временная интерпретация (см. 6.1.4). Эти
трактовки корректны при допущениях независимости эволюции соответствующих морфоструктур и
минимального числа реверсий и параллелизмов (модель минимальной эволюции, см. 4.1.1). В некоторых
случаях также принимается одинаковость скоростей их эволюции. В той мере, в какой эти допущения не
верны, оценка филогенетической дистанции с помощью того или иного коэффициента является смещѐнной.
Последнее формулируется как проблема неаддитивности — неполного соответствия двух категорий
дистанций: филогенетической и оценивающей еѐ вычисленной по признакам. Реверсии и параллелизмы
делают оценку заниженной, филетические координации — завышенной. Поскольку эти параметры эволюции
могут комбинироваться в разных сочетаниях, «поведение» оценивающей функции, вообще говоря, мало
предсказуемо. В терминах той же статистики это значит, что у неѐ достаточно большая варианса, дающая
широкий доверительный интервал.
Следует иметь в виду, что абсолютные численные значения дистанций не имеют непосредственной
филогенетической интерпретации: они зависят от количества признаков, способа их кодировки и т.п.
Понимание этого необходимо для того, чтобы корректно сравнивать результаты количественного анализа и
интерпретировать их в терминах времени и/или скорости эволюции.
Между исходными дистанциями и дистанциями на дереве должно соблюдаться определѐнное соответствие
формальных свойств, обеспечивающее корректность представления матрицы исходных дистанций в форме
дерева. Эти свойства задаются набором аксиом, которые определяют дистанцию как метрику,
ультраметрику, псевдометрику и т.д. (Sneath, Sokal, 1973).
Принципиальное значение имеет аксиома, задающая соотношения между длинами рѐбер, связывающих на
дереве группы А, B, C, D. В простейшем случае, когда рассматривается только топология дерева
(кладограмма), топологическая дистанция является ультраметрикой, для неѐ эта аксиома имеет вид: d
AC
max (d
AB
, d
BC
). Патристическая дистанция является метрикой, задаѐтся аксиомой неравенства треугольников:
d
AC
(d
AB
+ d
BC
); в случае строго аддитивного дерева (филограмма) она описывается иной аксиомой: d
AB
+
d
CD
max (d
AC
+ d
BD
, d
AD
+ d
BC
).
Имеет значение также аксиома, утверждающая, что если А В, то d
АВ
0. Она отражает то очевидное
обстоятельство, что рѐбра филогенетического дерева не могут быть отрицательной длины.
Для того, чтобы сходственные отношения между группами, заданные совокупностью исходных дистанций,
были адекватно «переведены» в дерево, они должны соответствовать этим аксиомам. Таковы, например
популярные евклидова и Манхэттен-дистанции, которые вычисляются как сумма различий по совокупности
признаков. При переводе матрицы значений любой из этих дистанций в дерево последнее даѐт несмещѐнную
или минимально смещѐнную оценку структуры фенетического паттерна.
Этому требованию отвечают далеко не все оценки филогенетической дистанции, используемые в
нумерической филетике (Пасеков, 1983; Swofford et al., 1996). Так, требованиям первой аксиомы не
соответствуют дистанции, получаемые посредством вышеупомянутых «косвенных» экспериментов. Вторую
из аксиом нарушает алгоритм, при котором длины ветвей дерева вычисляются по методу наименьших
квадратов: часть ветвей получается отрицательной длины (впрочем, это проблема алгоритма, а не самих
дистанций). Обеим аксиомам не соответствуют некоторые популярные генетические дистанции (например,
дистанция Неи): они относятся к группе так называемых угловых дистанций, по статистическим свойствам
аналогичных коэффициенту корреляции.
Дерево, получаемое при использовании такого рода «некорректных» дистанций, даѐт смещѐнную оценку
структуры сходственных отношений, что, очевидно, влечѐт за собой и искажѐнное представление о
кладогенезе. Так, появление на дереве ветвей отрицательной длины (одной из причин является
вышеупомянутая неаддитивность), с точки зрения филогенетики, — совершенная бессмыслица, не
имеющая никакой биологической интерпретации. Поэтому такие оценки филогенетической дистанции
лучше не использовать вовсе, заменяя их по возможности другими. Так, вместо дистанции Неи можно
использовать основанную на ней дистанцию Роджерса, которая сходна с евклидовой и является метрикой.
Общим недостатком использования дистанций в филогенетических реконструкциях является то, что они не
позволяют учитывать вклад каждого признака в структуру кладистических отношений и манипулировать
признаками по ходу реконструкции. Кроме того, это затрудняет или делает невозможным включение в
анализ организмов с неизвестным значением модальностей некоторых признаков.
9.3. Критерии оптимальности деревьев