通义千问开源千亿级参数模型
4月28日消息,通义千问开源1100亿参数模型Qwen1.5-110B,成为全系列首个千亿级参数开源模型。通义千问1100亿参数模型延续了Qwen1.5系列的Transformer解码器架构,采用了分组查询注意力方法(GQA),使得模型在推理时更加高效。110B模型支持32K上下文长度,具备优秀的多语言能力,支持中、英、法、德、西、俄、日、韩、越、阿拉伯等多种语言。
相关资讯
- ▣ 通义千问发布首个千亿级参数开源模型
- ▣ 通义千问开源320亿参数模型
- ▣ 阿里云发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 阿里云正式发布通义千问2.5,开源通义千问1100亿参数模型
- ▣ 阿里云发布通义千问2.0千亿参数模型与通义千问App
- ▣ 阿里通义千问开源首个MoE模型
- ▣ 通义千问开源视觉语言模型Qwen2-VL
- ▣ 通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o
- ▣ 通义千问开源模型下载量突破2000万
- ▣ 阿里云通义千问推出开源Qwen2.5-1M模型
- ▣ 通义千问开源Qwen2.5开源模型,累计下载量突破4000万
- ▣ 阿里通义千问Qwen2大模型发布并同步开源
- ▣ 通义千问开源Qwen2.5
- ▣ 夸克发布自研千亿级参数大模型
- ▣ 阿里通义千问代码模型Qwen2.5-Coder全系列正式开源
- ▣ 阿里云通义千问发布业界首个开源多模态推理模型
- ▣ 阿里云通义千问开源
- ▣ 微软开源爆火1bit大模型推理框架!千亿参数模型量化后单CPU可跑
- ▣ 通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
- ▣ 国产大模型又有重磅!阿里发布通义千问旗舰版模型,采用开源策略
- ▣ 阿里云CTO周靖人:通义千问开源模型下载量突破2000万次
- ▣ 百川智能发布千亿级参数的大语言模型Baichuan3
- ▣ 阿里千问衍生模型数量破10万,领先美国Llama等开源模型
- ▣ 阿里通义千问推出开源Qwen2.5-1M模型,长上下文处理能力显著提升
- ▣ 阿里千问衍生模型数量破10万 稳居全球最大开源模型榜首
- ▣ 通义千问模型降价风暴,最高降幅达85%!
- ▣ 阿里云通义千问旗舰版模型Qwen2.5-Max发布
- ▣ 阿里云发布通义千问旗舰版模型Qwen2.5-Max
- ▣ 英伟达开源3400亿参数模型Nemotron-4 340B