amd推出全开源3b语言模型,媲美qwen2.5

品玩3月7日讯,据 HuggingFace 页面显示,AMD宣布推出Instella,这是一个在AMD Instinct™ MI300X GPU上从头开始训练的完全开放的最先进的30亿参数语言模型系列。

与 Llama-3.2-3B、Gemma-2-2B 和 Qwen-2.5-3B 等最先进的开放式重量模型(包括经过指令调整的对应模型)相比,Instella 模型的性能优于现有的类似规模的完全开放式模型,并实现了具有竞争力的性能。

该模型现已在 AMD 平台上开源。

打开APP阅读更多精彩内容