Note publique d'information : Depuis leur domestication, les animaux de ferme ont montré une grande diversification
phénotypique. Ils représentent ainsi un modèle pour l'étude de la sélection. De plus,
la détection des traces de sélection dans ce type d'espèce peut donner des résultats
importants pour l'agronomie, en identifiant des régions du génome associées aux caractères
agronomiques ou à la résistance aux maladies. Des données donnant accès à l'information
génotypique de populations permettent d'effectuer des études de détection de traces
de sélection pan génomiques. Dans ce contexte, les tests de détection de sélection
existants doivent relever deux nouveaux défis : avec le nombre croissant de marqueurs
typés, la corrélation entre eux augmente, ce qui doit être pris en compte. D'autre
part, les tests utilisés se basent sur la comparaison de deux populations. Considérer
plus de deux populations devrait permettre d'augmenter la puissance de détection,
mais nécessite que les corrélations entre les populations générées par leur évolution
conjointe soient prises en compte. J'ai proposé deux tests statistiques pour détecter
la sélection en utilisant des données génétiques denses collectées dans plusieurs
populations. Le premier est basé sur la différentiation haplotypique entre populations
et utilise des données individuelles. Le deuxième cumule des signaux de tests simple
marqueur en utilisant la théorie du score local et ne nécessite que des données populationnelles.
Par simulations et application à des données réelles, j'ai montré que la puissance
de détection augmente par rapport à d'autres tests. L'analyse de jeux de données chez
le mouton et la caille permet de proposer des gènes candidats.
Note publique d'information : Since initial domestication by Humans, farm animal species have experienced great
phenotype diversification and thus represent an interesting model for the study of
natural and artificial selection. Besides, the detection of selection signatures in
these species can have substantial agronomic outcomes, pointing out genomic regions
related to production traits or resistance to diseases. Many datasets giving access
to genome wide genotypic information have become available enabling to scan entire
genomes for signatures of selection. Many tests designed to detect positive selection
are challenged by at least one of the following problems. First, as the number of
available markers increases, so do their correlations which need to be taken into
account. Second, many tests have been designed to compare populations only pairwise.
Considering more than two populations simultaneously should increase the power to
detect selected regions, but necessitates to account for correlations between them
arising from their shared history. I proposed two statistical tests for the detection
of positive selection signatures using dense genetic data collected from multiple
populations. One is based on haplotypic differentiation between populations, requiring
genetic data at the individual level. The second one consists in cumulating single
marker signals using local score theory, requiring data at the population level. Through
simulated and real datasets, I showed that these tests increased the detection power
compared to other existing tests in many cases. Applied to two data sets in sheep
and quail, they also point out biologically relevant candidate genes under selection.