Документ описывает использование графических ускорителей для решения неграфических задач, таких как дискретное косинус преобразование и метод внедренного атома, с применением технологий MPI и OpenCL. Приведены результаты ускорения при использовании кластеров GPU, достигающего 407 раз по сравнению с использованием одного ускорителя. Обсуждаются архитектура GPU и методы программирования, включая CUDA и SIMT.