Ce manuscrit expose le travail de recherche effectu? dans le cadre de ma th?se de doctorat et qui s'int?resse au traitement automatique de la langue Arabe. Il d?crit d'abord l'outil con?u pour la construction de corpus de l'Arabe; cet outil permet de recueillir automatiquement une liste de site, extrait leur contenu et le normalise. Le corpus ainsi constitu? peut ?tre utilis? dans diverses applications de TAL et plus particuli?rement dans le calcul de mod?les statistiques. Il pr?sente ensuite les exp?rimentations men?es en terme de mod?lisation statistique et qui ont pour objectif de trouver comment mod?liser le mieux la langue Arabe . Le manque de donn?es m'a conduit ? entreprendre d'autres solutions sans pour cela augment? la taille du corpus. J'ai proc?d? ? une segmentation des mots du corpus afin d'augmenter sa viabilit? statistique. une meilleure performance en terme de perplexit? normalis?e fut constat?e. Finalement, ce livre expose les r?sultats d'une ?tude comparative des mod?les statistiques de l'Arabe et ceux d'autres langues ? savoir le Fran?ais, l'Anglais, le Grec, le Portugais et le Finnois.