岩芯数智发布自研大模型

1月24日,岩芯数智正式发布自研大模型“Yan模型”。Yan模型采用非Transformer架构,为非Attention机制的通用自然语言大模型。据了解,该大模型有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐和3倍记忆能力。