Hinton、李飞飞支持的NLP明星创企,今获1.25 亿美元B轮融资

大数据文摘转载自数据实战派

整个AI领域现正处于某种程度“融资冷静期”,但依然有明星公司为新一轮的大爆发筹到资金弹药。

近日,总部位于加拿大多伦多的NLP公司Cohere,宣布了 1.25 亿美元 B 轮融资。本轮融资由 Tiger Global 领投, Radical Ventures 、 Index Ventures 和 Section 32 参投。

Cohere公司表示,这些资金将用于公司全方面的扩展,包括发展团队并增加计算能力来训练大型语言模型(large language model)。

最新的这轮融资使 Cohere 迄今筹集的总资金超过 1.7 亿美元。与此同时,Cohere 还宣布 Bill MacCartney 已加入担任工程和机器学习副总裁。在加入 Cohere 之前,Bill 是 Apple 的高管,领导一个 120 多名科学家和工程师组成的团队开发用于预测用户意图和行为的模型。

“Cohere 能够解决 NLP 技术广泛采用的最困难的障碍之一:易用性”,Bill MacCartney 说。

他口中的这种易用性,正是近年来以GPT-3为代表的LLMs落地所面临的一大挑战。这些在包含巨大数据量的大规模数据集上训练而得的“参数怪兽”,小到简单的短讯大到复杂的金融模型都可以较好地生成。但是,一个LLMs背后,很有可能是非跨国大型公司所能消化的人力、物力、时间成本。

毫无疑问,这是一个相当高进入门槛的领域。

而Cohere的创始团队想要降低这个门槛。

正如Cohere CEO Aidan Gomez 所说:“许多人难以方便访问这些高质量的自然语言模型。我们想要做的是让所有人都可以访问,否则这些技术就得不到真正利用……我们第一次向市场推出了一种实用、可访问且安全的有效 NLP 解决方案。

Aidan Gomez 曾是Google Brain 的研究人员,也是著名论文《Attention is all you need》的作者之一。这篇论文提出了名声大噪的Transformer架构,也是谷歌著名算法BERT(BERT在11项NLP任务中实现突破,堪称2018年最重磅的AI进展)中最重要的部分。

2021年,Aidan Gomez和 Nick Fross离开Google Brain创立了这家公司。而Cohere本身的核心NLP模型也是源自Transformer,能够阅读数亿页文本并学会理解语言的含义、情感和语气直至语法、语义和上下文。

除了初始人之外,整个Cohere还有不少来自顶尖高校的技术人员。它的官网介绍上xiezhe“我们有的来自全球顶尖的实验室和高校,但有的辍学了,或者根本没有上过学。”

图丨Cohere 团队成员

这样的强技术基因,也为这家公司吸引到一批赫赫有名的早期投资者。据报道,这个名单中就包括图灵奖得主 Geoffrey Hinton、GAN 之父 Ian Goodfellow、Uber 首席科学家 Raquel Urtasun、英伟达多伦多研究实验室主任 Sanja Fidler 以及斯坦福大学教授李飞飞等。

事实上,Cohere和它提供的API接口服务很容易让我们联想另一个热门大模型,那就是GPT-3。

GPT-3问世的时候,也展示了前所未有的文本生成能力,并同样经过大量互联网文本的训练,目前,其开发团队OpenAI同样通过通过 API形式提供GPT-3的使用入口。

而Cohere CEO Gomez认为,自家模型和GPT-3二者的主要不同在于,GPT-3 是一种生成模型,旨在根据用户提供的提示创建出从左到右移动的文本,可以视作一台自动写作机器。

但自然语言处理有着诸多应用场景,文本生成只是其中的方向之一,Cohere 强大之处在于它是一个全栈式的NLP平台,除了文本生成之外,在情感分类、问答和文本分类等方向也可以施展拳脚。

其首页就展示了3大应用方向:

1、开发复杂的聊天机器人——使用 Cohere 的世界级机器学习模型来了解客户查询的含义并为最先进的聊天机器人提供动力。提高理解能力,构建更加个性化的用户体验。

2、写得比以往任何时候都快——只需一次 API 调用即可生成原始内容,无论是产品描述、SEO 优化的广告文案还是长篇博客内容。为作者提供增强内容引擎所需的工具。

3、超越关键字搜索——按关键字搜索并不总是能检索到客户需要的数据。使用 Cohere 平台快速构建强大的语义搜索引擎,返回相关结果。

图丨Cohere 和GPT-3的收费模式对比

在过去八个月中,Cohere经历了显着增长,包括自 A 系列融资以来,员工人数也翻了一番,平台用户增加了 800% 以上,与google cloud的稳定合作等。这个团队仍在继续为平台添加新功能,例如允许用户根据他们的特定需求微调 BERT 模型。

目前来看,Cohere 良好的发展势头,标志着 NLP 应用新时代的到来。

至少其投资方是充满信心的——“理解人类语言是人工智能的下一个前沿领域,Cohere 有效地将易于使用的 API 打包在一起,允许任何开发人员在 Cohere 的 LLM 基础上构建应用,并根据他们的特定需求进行定制化的微调。就像语言渗透到我们生活的方方面面一样,NLP 的应用也应该遍布数字世界中的各个角落”,Tiger Global 合伙人 John Curtius 说。