Anthropic 的 Claude:使用指南与竞品对比全解析
尽管它可能不像谷歌、微软和 OpenAI 的竞品那样占据众多头条,但 Anthropic 的 Claude 并不比其前沿模型同行逊色。
事实上,最新版本 Claude 3.5 Sonnet 在众多行业基准测试中已被证实不输给 Gemini 和 ChatGPT。在本指南中,您将了解 Claude 是什么,它最擅长做什么,以及如何充分利用这个低调但有能力的聊天机器人。
与 Gemini、Copilot 和 ChatGPT 一样,Claude 是一个大型语言模型(LLM),它依靠算法,依据其庞大的训练材料语料库来预测句子中的下一个词。
Claude 与其他模型的不同之处在于,它经过训练和调适,以遵循 73 点的“宪法 AI”框架,旨在使 AI 的响应既有用又无害。Claude 首先通过监督学习方法进行训练,在这种方法中,模型会针对给定的提示生成回应,然后评估该回应与它的“宪法”的契合程度,最后对后续回应进行修改。然后,Anthropic 并非依靠人类来进行强化学习阶段,而是运用该 AI 评估数据集来训练偏好模型,帮助微调 Claude,以始终输出符合其宪法原则的响应。
Anthropic 于 2023 年 3 月发布了 Claude 的首次迭代版本,并在四个月后的 2023 年 7 月迅速将其更新为 Claude 2。这些早期版本在编码、数学和推理能力方面相当有限。这种情况随着 2024 年 3 月 Claude 3.0 系列——Haiku、Sonnet 和 Opus 的发布而发生了改变。
“对于绝大多数工作负载而言,Sonnet 比 Claude 2 和 Claude 2.1 快两倍,并且具有更高的智能水平,”Anthropic 在Claude 3 公告帖中写道。“它在需要快速响应的任务中表现出色,如知识检索或销售自动化。”
Opus 占据榜首的位置是短暂的。2024 年 6 月,Anthropic 推出了更强大的 Claude 3.5 模型。Claude 3.5 Sonnet“运行速度是 Claude 3 Opus 的两倍,”Anthropic 当时写道,这使其成为“诸如对上下文敏感的客户支持和协调多步骤工作流程等复杂任务”的理想之选。它也普遍优于 GPT-4o、Gemini 1.5 和 Meta 的 Llama-400B 模型。
十月份,Anthropic 发布了 3.5 Sonnet 的一个略有改进的版本,称作 Claude 3.5 Sonnet(新),同时还推出了新的 Claude 3.5 Haiku 模型。
虽然 ChatGPT 和 Gemini 被设计成能够回答各类广泛主题的问题,并且通过语音交互来达成,但 Claude 却在编码、数学和复杂推理任务上表现出众。
Anthropic 把 Claude 的最新版本称作其“迄今为止最强大的视觉模型”。而且它称 3.5 Sonnet 能够执行各类基于视觉的任务,比如从模糊的照片中解读文字或者解释图表及其他视觉内容。
Claude 也是首个在聊天对话本身之外提供专用协作空间的 LLM 聊天机器人。“The Artifacts 功能”于 2024 年 9 月初次登场,充当一个实时预览窗口,还允许用户创建“一个动态的工作空间,他们能够实时查看、编辑并基于 Claude 的创作来构建,将 AI 生成的内容无缝融入他们的项目和工作流程中”,Anthropic 团队宣称。
OpenAI 此后也给其聊天机器人引入了类似的功能,不过目前仅对 Plus 和 Enterprise 订阅用户开放。
克劳德 3.5 十四行诗相较于其主要对手 ChatGPT 具有诸多优势。例如,克劳德为用户提供了更大的上下文窗口(200,000 个字符对 128,000 个),使用户能够制定更细致和详细的提示。克劳德的宪法式人工智能架构意味着它被调整为提供准确的答案,而非富有创意的答案。这个聊天机器人还能够出色地总结研究论文,依据上传的数据生成报告,并将复杂的数学和科学问题拆解为易于遵循的分步说明。
虽说它或许没法给您写首诗,不过在生成可验证且能重现的回应上表现优异,特别是新推出的分析工具。 该公司把它描述成“一个内置的代码沙箱,Claude 能够在里面进行复杂的数学运算、分析数据,还能在分享答案前对不同想法进行反复琢磨。”“处理信息和运行代码的能力意味着您会得到更准确的答案。”
另一方面,有好多其他聊天机器人能做的事儿,Claude 却做不了。例如,Claude 没有提供与 OpenAI 的高级语音模式相当的功能,所以您只能坚持使用文本和图像提示。该人工智能也无法生成图像,就像 ChatGPT 与 Dall-E 3 那样。
Claude 的发展并非不存在自找麻烦的戏剧性情况。 Proof News 于 7 月的一份报告确凿地指控 Anthropic(连同 Nvidia、Apple 以及 Salesforce)使用了从超过 48,000 个频道(包含 MrBeast、Marquees Brownlee 和 Pew Die Pie)抓取的 173,536 个 YouTube 视频字幕的数据集来训练其大型语言模型。