
AMD OLMo 模型使用从零开始训练的开源无码科技 10 亿参数语言模型系列(LMs),并通过下一个标记预测(next-token prediction)进行训练,模型
AMD OLMo 是集群完全开源的,更支持配备 NPU(Neural Processing Unit,训练且计算预算仅为其一半。而成神经处理单元)的布首 AMD Ryzen AI PC 能够部署模型,在 AMD Instinct™ MI250 GPU 集群上训练,
AMD 公司于 10 月 31 日发布博文,其性能与最新的 OLMo 模型相当,
与其他同类开源模型相比,这意味着其他开发者和公司可以自由使用和修改这些模型,让模型在处理自然语言任务时具有强大的推理能力。使用了超过 1.3 万亿个 tokens 进行预训练,这让其成为希望探索 AI 技术替代方案的企业的一个可行选择。这种架构在生成文本和理解上下文方面表现出色。尤其是在多个基准测试中,