Mehran Maghoumi

Mehran Maghoumi 是 NVIDIA 的高级深度学习开发者倡导者,专注于生成式 AI 和 NeMo 框架生态系统。在此之前,他是 NVIDIA 的高级深度学习工程师,专注于 NVIDIA DRIVE 平台环绕摄像头系统中的停车空间感知。他拥有中佛罗里达大学计算机科学博士学位。

Posts by Mehran Maghoumi

生成式人工智能/大语言模型

使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM

您是否曾想构建自己的推理模型,但认为它过于复杂或需要大量资源?再想想。借助 NVIDIA 强大的工具和数据集, 4 MIN READ
生成式人工智能/大语言模型

借助统一的 NVIDIA NIM 工作流简化 LLM 部署和 AI 推理

将大语言模型 (LLM) 集成到真实用户与之大规模交互的生产环境中,是任何 AI 工作流中最重要的部分。这不仅仅是让模型运行, 3 MIN READ
生成式人工智能/大语言模型

使用 DeepSeek-R1 NIM 构建具有专家推理功能的 AI 智能体

AI 智能体 正在通过实现流程自动化、优化决策制定和简化操作来改变业务运营。其有效性取决于专家推理,从而实现更明智的规划和高效执行。 2 MIN READ
数据科学

借助 NVIDIA NeMo Curator 简化域自适应预训练的数据处理

大语言模型(LLMs)的领域自适应预训练(DAPT)是构建特定领域模型的重要步骤。与现成的开放或商用模型相比, 6 MIN READ
数据科学

利用 NVIDIA NeMo Curator 整理用于 LLM 参数高效微调的自定义数据集

在最近的一篇博文中,我们讨论了如何使用 NVIDIA NeMo Curator 整理自定义数据集, 3 MIN READ
数据科学

利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集

数据管护是预训练和持续训练模型的第一步,也可以说是最重要的一步,对于 大型语言模型 (LLM) 和小型语言模型 (SLM) 都至关重要。 3 MIN READ