Yonggan Fu

Yonggan Fu は、NVIDIA Research に参加予定の研究者であり、現在はジョージア工科大学博士課程の学生として、Yingyan (Celine) Lin 博士の指導を受けています。研究では、言語モデルとビジョン モデルのための効率的で堅牢な AI アルゴリズムの開発に注力しています。

Posts by Yonggan Fu

Generative AI

Hymba ハイブリッド ヘッド アーキテクチャが小規模言語モデルのパフォーマンスを向上

Hymba 1.5B は、同様の規模である最先端のオープンソース モデルと比べ、良好なパフォーマンスを発揮し、同等のサイズの Transformer モデルで比較すると、Hymba はより高いスループットを発揮し、キャッシュを保存するために必要なメモリが 10 分の 1 で済みます。 4 MIN READ