NVIDIA cuDSS
NVIDIA cuDSS (预览版) 是经过优化的第一代 GPU 加速的直接稀疏求解器库,用于求解具有超稀疏矩阵的线性系统。直接稀疏求解器是数值计算的重要组成部分,适用于自动驾驶和过程模拟等实时应用,在这些应用中,日益复杂和高吞吐量需要强大的直接求解器。
主要特性
GPU 加速的求解器
充分利用 CPU 的顺序计算和 GPU 的并行计算,cuDSS 同时利用 CPU 和 GPU 来解决稀疏矩阵每行只有几个非零元素。与仅使用 CPU 的求解器相比,性能显著提升。
核心功能支持
cuDSS 可求解单 GPU、多 GPU 和多节点平台上的稀疏线性系统,包括在具有多个系统的情况下对重构的支持,以及不同的重排序和矩阵类型。无论矩阵大小如何,cuDSS 的构建都是稳定的。
已针对 NVIDIA GPU 进行优化
cuDSS 支持所有 NVIDIA GPUs,Pascal 和更新版本,允许您在各种由 NVIDIA 提供支持的平台上集成直接稀疏求解器。cuDSS 还受益于 Grace Hopper 超级芯片j架构。
cuDSS 性能
与基于 CPU 的直接稀疏求解器相比,cuDSS 能够实现显著的性能提升。

资源
准备好开始使用 cuDSS 了吗?