Le document présente la programmation parallèle sur GPU avec CUDA, détaillant les différences entre GPU et CPU, ainsi que l'architecture et les performances des GPU. Il décrit également la structure d'un programme CUDA, l'organisation des threads, et fournit un exemple de multiplication de matrices utilisant CUDA. En conclusion, il met en avant les avantages et inconvénients de l'utilisation de CUDA dans les domaines scientifique et industriel.