Fylogenetische onafhankelijke contrasten

Fylogenetische onafhankelijke contrasten (Engels: phylogenetic independant contrasts, PIC) is een statistische methode die wordt toegepast in de evolutionaire biologie om rekening te houden met verwantschap tijdens het vergelijken van eigenschappen/ kenmerken tussen verschillende soorten.

Achtergrond

Onder normale omstandigheden worden correlaties tussen eigenschappen bepaald onder de statistische aannamen dat datapunten onafhankelijk zijn van elkaar. Maar omdat verschillende soorten verwant zijn aan elkaar word deze aannamen geschonden, hierdoor kunnen verschillende statistische testen onjuiste relaties tussen eigenschappen produceren waardoor foutieve conclusies over correlaties getrokken kunnen worden. In 1985 introduceerde Joseph Felsenstein de PIC-methode als oplossing voor dit probleem.[1] Deze methode maakt gebruik van fylogenetische informatie om de gegevens zodanig te transformeren dat de datapunten statistisch onafhankelijk worden en daardoor gebruikt kunnen worden voor een variatie aan statistische testen.

Principe

De PIC-methode maakt gebruikt van de topologie en taklengtes van een fylogenetische boom om de traitwaardes van de toppen van de boom om te zetten in een verzameling van statistische onafhankelijke gegevens (of “contrasten”). Elk contrast geeft het verschil weer tussen twee zustertaxa gewogen aan de taklengte tussen de twee taxa. Vervolgens worden de knopen (Engels: nodes) van de boom een nieuw gemiddelde toegewezen op basis van de twee afgesplitste zustertaxa. Dit proces wordt vervolgens herhaald van elke clade tot aan de stam van de fylogenetische boom. Op deze manier ontstaat een set van N−1 onafhankelijke contrasten (waarbij N het aantal soorten is). Deze contrasten kunnen vervolgens worden gebruikt in statistische analyses, zoals regressieanalyse.

Toepassing en analyse

De meest gebruikte toepassing voor PIC is het correleren van twee eigenschappen van meerdere organismen om te bepalen of een evolutionaire verandering in een eigenschap gecorreleerd is met een andere. Omdat de methode uitgaat van geen verwachte verandering in de onderzochte eigenschappen wordt in de regressieanalyses de regressielijn doorgaans door het nulpunt gedwongen. De helling van de regressielijn geeft de sterkte en richting van de correlatie weer terwijl de p-waarde de statistische significantie aanduidt zoals in een conventionele regressieanalyse.

Beperkingen en aannamen

Alhoewel PIC het probleem van onafhankelijke datapunten grotendeels oplost is het nog steeds beperkt door de aannames die de methode maakt. De belangrijkste aanname van de methode is dat voor de verandering van de traits over evolutionaire tijd word uitgegaan van het Brownian motion model. Als de aanname van Brownian motion geschonden word dan zijn de contrasten niet meer te standaardiseren aan de taklengtes, wel zijn er nog mogelijkheden om alternatieve modellen te gebruiken in dit geval, zoals phylogenetic generalized least squares (PGLS). Ook zijn intrinsieke problemen aanwezig onafhankelijk van de gebruikte methode, zo heeft deze methode een complete fylogenie nodig en kan ze niet omgaan met bomen die een polytomie bevatte. Dit houdt in dat naarmate de fylogenetische resolutie en het onderscheidingsvermogen afneemt ook de betrouwbaarheid van de PIC-analyse afneemt.