☰

Anthropic大模型测评首超GPT-4

据外媒Ars Technica报道，在大模型评估排行榜Chatbot Arena上，AI创企Anthropic的Claude 3 Opus大模型首次超越OpenAI的GPT-4。Chatbot Arena由大型模型系统组织（LMSYS ORG）运营，由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学的学生和教师合作运作。这是GPT-4自从2023年5月10日左右被纳入Chatbot Arena以来首次在该榜单上被超越。

本文源自金融界AI电报

相关资讯

▣ Anthropic发布“GPT-4 对手”Claude 2大语言模型
▣ 百川智能发布超千亿大模型Baichuan 3，中文评测超越GPT-4
▣ 智源最新模型评测：百度文心大模型4.0登顶闭源榜超GPT-4o等
▣ 通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o
▣ 超越GPT-4，OpenAI前高管发布"最强"大模型
李彦宏：文心大模型4.0在中文已超过GPT-4
▣ 大模型权威测试被曝翻车！偏袒GPT-4等闭源模型，提示词区别对待
▣ 超越GPT-4V，苹果多模态大模型上新！
▣ UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男
Anthropic釋出新款聊天機器人服務模型Claude 3.5 Sonnet 標榜性能超越OpenAI的GPT-4o
▣ 快手：快意通用大语言模型能力已超GPT-3.5 营销能力齐平GPT-4
▣ 微软 GPT 模型可信度综合评估：GPT-4 通常比 GPT-3.5 更值得信赖，但也有例外
▣ 87 GB 大模型种子，GPT-4 缩小版，超越GPT3.5，在线体验
▣ OpenAI宣布发布GPT-4 Turbo模型
▣ 法律 AI 公司 EvenUp 获 1.35 亿美元，模型超 GPT-4
▣ 对标 OpenAI GPT-4，MiniMax 国内首个 MoE 大语言模型全量上线
▣ Anthropic旗下大模型公开测试新功能，可模拟人机交互方式
▣ 李彦宏：文心大模型4.0在中文上已经超过了GPT-4
▣ 哪吒L车型首次OTA升级，应用大模型NETA GPT
▣ 字节“开盒”OpenAI所有大模型，揭秘GPT-3到GPT-4进化路径
▣ 科大讯飞宣布星火大模型4.0发布，整体性能超GPT-4 Turbo
▣ 微软Bing Chat接入GPT-4 Turbo模型
▣ OpenAI o1模型问世，比 GPT-4 还强！
OpenAI推出新版嵌入模型、新版GPT-4 Turbo預覽模型再度調降GPT-3.5 Turbo模型使用費用
▣ OpenAI发布会：GPT-4 Turbo模型、GPT应用商店等登场
▣ AI周报| 大模型测不出9.11和9.9哪个大；OpenAI发布轻量化模型GPT-4o mini
▣ 性能超越 GPT-4 Turbo！「商汤日日新」大升级，国产大模型超市开张了
▣ 谷歌放大招：推出AI模型Gemini挑战GPT-4
▣ 首个AI大模型高考全卷评测结果发布

DMCA | PRIVACY | s@wa01.com