定价仅为GPT-4百分之一! 幻方量化推“高性价比”大模型 量化私募打响AI界价格战?

21世纪经济报道记者张梓桐 上海报道

量化私募机构正在高调入局大模型领域。

近日,幻方公司推出了第二代MoE模型DeepSeek-V2,并开源了技术报告和模型权重,该模型引入了MLA架构和自研Sparse结构DeepSeekMoE,以236B总参数、21B激活,实际部署在8卡H800机器上,输入吞吐量超过每秒10万tokens输出超过每秒5万tokens。

目前DeepSeek-V2 API定价为:每百万token输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一水平。SemiAnalysis给出了“性价比高到难以置信”的评价。据该机构计算,在其算力服务力利用率最高的情况下,DeepSeek每台服务器每小时收益可达35.4美元,毛利率在70%以上。

事实上,金融机构对AI大模型的布局有着天然的业务逻辑,在经过移动互联多年积累后,金融业在行业垂直类大模型落地所需的三大支柱:算法、算力、数据中相较其他行业都有独特优势。

“以投研、投顾等与投资决策相关的场景为例,传统的投研和投顾模式更多依赖于行业专家和投资顾问自身的知识经验和能力水平,个体差异度可能会比较大,而大模型经过海量底层数据的搜集、梳理、学习后,其分析结果或将在全面性、准确性、 时效性等方面赋能传统模式,但我们也注意到,由于相关监管不明确,以及数据安全、数据隐私等问题,在这些场景的应用仍需谨慎。”毕马威中国资产管理业主管合伙人王国蓓在接受21世纪经济报道记者采访时说道。

AI新征程

幻方量化是一家依靠人工智能技术进行量化投资的对冲基金公司及科技公司,成立于2008年,专注于人工智能在量化投资领域的应用。

2023年4月14日其官方微信公众号发表的一篇名为《幻方新征程》的文章中,幻方量化宣布将集中资源和力量,全力投身于人工智能技术,并成立了新的独立研究组织,专注于探索AGI(人工通用智能,Artificial General Intelligence)的本质。并强调“渴望同行之人,一起攀登”。

但彼时幻方量化的高调动作也遭到市场的质疑。但幻方量化董事总经理陆政哲表示,“我用中文重申一下:AGI不是用来炒股的,有大得多的用处和大得多的价值。”

从技术路径来看,DeepSeek-V2基于高效且轻量级的框架HAI-LLM进行训练,采用16-way zero-bubble pipeline并行、8-way专家并行和ZeRO-1数据并行。鉴于DeepSeek-V2的激活参数相对较少,并且重新计算部分算子以节省激活内存,无需张量并行即可训练,因此DeepSeek-V2减少了通信开销。

并且,DeepSeek-V2完全开源,可免费上用,开源模型支持128K上下文,对话官网/API支持32K上下文(约24000个token),还兼容OpenAI API接口。

值得注意的是,幻方大模型的横空出世也再次验证了市场对于MoE大模型的期待。MoE大模型即Mixture of Experts大模型,是一种基于分治思想的深度学习模型。它将整个模型划分为多个子模型(或称专家),每个子模型负责处理一部分任务。在推理时,根据输入数据的特性,选择最合适的子模型进行处理。这种架构使得MoE大模型能够同时兼顾模型的复杂性和效率,实现高性能和高效率的统一。

金融机构拥抱AI

目前来看,AI+金融产业链分为上游(基础层)、中游(技术层)和下游(应用层)。上游提供基础性支持,中游提供核心技术和解决方案,下游则广泛应用于金融业务领域。

据Mordor Intelligence的报告预测,全球人工智能金融科技市场规模预计到2024年将达到440.8亿美元,并预计在2029年将增长到508.7亿美元,预测期内(2024-2029年)的复合年增长率为2.91%。

“因为与金融机构多业务场景的密切结合,以及产品能力在海量高质金融业务数据助力下得到快速提升,金融机器学习产品成为市场主要拉力之一。”一家正在尝试布局AI应用的私募基金合伙人告诉21世纪经济报道记者。

他表示,目前,AI在量化交易领域的应用越来越广泛,通过算法交易提高交易效率,减少人为错误,并能够快速适应市场变化;另一方面,在投资研究自动化环节,AI可以自动收集和整理投资相关的信息和数据,减少研究人员的重复性工作,使他们能够专注于更高价值的分析和决策。

“此外,金融机构也在利用AI分析市场情绪,通过分析投资者行为和市场反馈,预测市场动向。助力金融机构遵守监管要求,通过自动化分析交易模式和行为,检测异常交易行为,防止欺诈和洗钱等非法活动。”

但与此同时,王国蓓表示,在落地过程中,大模型技术财富管理领域面临的主要挑战集中于数据质量、数据安全、隐私保护、合规表达、事实一致性等方面,为解决这些挑战,机构首先需要进行大量数据治理、夯实数据基础等工作,且需要在语料安全、模型安全、模型评估等方面设立完善的安全机制,确保大模型生成内容的安全合规并符合监管要求。