Models / Libraries / Frameworks

2025年 8月 13日

借助 CUDA-QX 0.4 简化量子错误纠正和应用程序开发

随着量子处理器单元 (QPU) 制造商和算法开发者致力于打造大规模、商业上可行的量子超级计算机，他们越来越专注于量子纠错 (QEC) 。

2 MIN READ

2025年 8月 13日

利用 Wheel Variant 简化 CUDA 加速 Python 的安装和打包工作流程

如果您曾经安装过 NVIDIA GPU 加速的 Python 软件包，您可能遇到过这样的场景：导航到 pytorch.org、jax.dev、

4 MIN READ

2025年 8月 11日

如何在交互式模拟中即时渲染现实世界场景

将现实世界环境转变为交互式仿真不再需要花费数天或数周的时间。借助 NVIDIA Omniverse NuRec 和…

2 MIN READ

2025年 8月 7日

黑客如何利用 AI 解决问题的能力

随着多模态 AI 模型从感知发展到推理，甚至开始自主行动，新的攻击面也随之出现。这些威胁不仅针对输入或输出，还利用了 AI 系统如何处理、

2 MIN READ

2025年 8月 7日

在单个 NVIDIA Grace Hopper 超级芯片上使用 XGBoost 3.0 训练 TB 级数据集

梯度提升决策树 (GBDT) 驱动着从实时欺诈过滤到 PB 级需求预测的各种功能。由于其先进的准确性、

2 MIN READ

2025年 8月 5日

NVIDIA 从云到边缘加速 OpenAI gpt-oss 模型部署，在 NVIDIA GB200 NVL72 上实现 150 万 TPS 推理

自 2016 年推出 NVIDIA DGX 以来，NVIDIA 与 OpenAI 便开始共同推动 AI 技术的边界。

1 MIN READ

2025年 8月 4日

GPU 架构支持导航：面向 NVIDIA CUDA 开发者的指南

如果您最近使用 NVIDIA CUDA 编译器 (NVCC) 开发 NVIDIA GPU 应用，您可能会遇到以下警告消息：这究竟意味着什么，

1 MIN READ

2025年 8月 1日

7 种可即时加速 Python 数据科学工作流程的插入式替代方案

您已经经历过。您编写了完美的 Python 脚本，在示例 CSV 上对其进行了测试，一切都很完美。但是，

2 MIN READ

2025年 7月 29日

使用全新 NVIDIA Llama Nemotron Super v1.5 构建更加准确、高效的 AI 智能体

AI 智能体现在已经能够解决多步骤问题、编写生产级代码并在多个领域担任通用助手。但要充分发挥其潜力，

1 MIN READ

2025年 7月 24日

使用 Torch-TensorRT 将扩散模型的 PyTorch 推理速度翻倍

NVIDIA TensorRT 是一个 AI 推理库，用于优化机器学习模型，以便在 NVIDIA GPU 上部署。

2 MIN READ

2025年 7月 17日

大规模特征工程：利用 NVIDIA CUDA-X 数据科学优化半导体制造的机器学习模型

在上一篇博文中，我们介绍了芯片制造和运营中的预测建模设置，重点介绍了数据集不平衡等常见挑战，以及对更细致的评估指标的需求。

2 MIN READ

2025年 7月 16日

CUTLASS：基于张量和空间微核处理多维数据的原理抽象

在生成式 AI 时代，充分发挥 GPU 的潜力对于训练更好的模型和大规模服务用户至关重要。通常，

4 MIN READ

2025年 7月 16日

CUTLASS 3.x：用于 GEMM 内核设计的正交、可重用和组合抽象

GPU 上的 GEMM 优化是一个模块化问题。高性能实现需要指定超参数，例如图块形状、数学和复制指令以及线程束专用方案。

3 MIN READ

2025年 7月 14日

借助 NVIDIA Riva TTS 增强多语种类似人类的语音和语音克隆

虽然语音 AI 用于构建数字助理和语音智能体，但其影响远远超出这些应用。文本转语音 (TTS) 和自动语音识别 (ASR)…

3 MIN READ

2025年 7月 14日

借助 NCCL 2.27 实现快速推理和弹性训练

随着 AI 工作负载的扩展，快速可靠的 GPU 通信变得至关重要，这不仅适用于训练，而且越来越适用于大规模推理。

3 MIN READ

2025年 7月 11日

使用 NVIDIA Earth-2 预测两周以上的天气

能够预测极端天气事件至关重要，因为此类条件变得更加常见且更具破坏性。次季节性气候预测 (预测未来两周或两周以上的天气)…

2 MIN READ