王小川:有信心年底发布国内最好的语言大模型

文/闫妍

“从ChatGPT—3.5发布到现在,4个月像过了两年一样。”王小川感概,每天扑面而来的新进展、新突破,都感觉无比兴奋。

前一天,他凌晨4点才睡下,为筹备新公司的首次发声。4月10日,搜狐网络大厦二层,王小川正式官宣入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能,要做的事情是打造中国版的Open AI基础大模型及颠覆性上层应用。

王小川讲,“有信心在年底发布国内最好的语言大模型。”“我很看好搜索、多模态、教育和医疗等方面的增强,希望能够帮助大众轻松普惠获得知识和专业服务。”

开年以来,在中国做类ChatGPT产品,组建中国版OpenAI,这个无与伦比的“性感故事”,引燃了互联网大厂和科技大佬的创业热情。自2月份王小川表达了回归创业做AI大模型的意愿后,这位同时拥有深厚技术背景和管理经验的科技大佬,就在这场AI 2.0“诸神之战”中备受瞩目。

ChatGPT让王小川看到了一个更广阔的未来。但这次让他回归创业最动心的是,能和一群有理想的人,用极致的技术驱动创造出颠覆性的智能产品。项目初期,不仅顶级高校、顶级资本都在向他抛来橄榄枝,过去搜狗时代吸引不来的AI人才,如今都在向他聚拢。

王小川向本站科技《态℃》栏目透露,公司早前已获得5000万美元启动资金,主要来自他本人以及业内好友的个人支持。“预计在4月底将打造一只50人规模的精英团队,这里面有AI大拿主动申请参与组队,甚至直接带资进组,下半个月我还会去趟美国薅人,快速对齐世界领先水平。”

他相信通用人工智能时代已经开启。“生活在二十一世纪初是如此幸运,波澜壮阔的互联网革命还没有谢幕,通用人工智能时代又呼啸而来。”

“王小川式速度”

Q:公司名字为什么定下“百川智能”?

王小川:百川本意是众多的河流汇集奔赴海洋,象征着众多数据、行业知识汇聚成为一个强大的智能体系,生生不息。因为大模型其实就是以语言为核心,把天下知识都汇聚并进行学习的一个过程。

Q:而且把自己的名字也押进去了?

王小川:是的。启动资金目前是朋友们在支持,一些老团队也回来了。你可以理解“百川”既是跟世界连接,也是跟我之前的团队和资源深度地连接在一起。

Q:公司目前融资情况如何?

王小川:2月份我有这个想法的时候,就有好多朋友找过来说支持,要投资钱进来。当时除了自己投钱还拉了几个朋友,大概启动资金有5000万美金,前期足够了,面向机构的融资会再近期启动。

Q:公司目前的整体进展如何?

王小川:搜索是距离大模型特别近的业务,我们已经有了一个500亿的参数的模型在训练了,目前评价和进展效果都非常好。同事们都很兴奋。跟清华的老师们去聊的时候,他们很惊讶我们的进展。

Q:百川智能创始团队构成是怎样的?听说你在招搜狗旧部回来?

王小川:我的合伙人茹立云,以前是搜狗COO,跟我一块配合了15年。团队大概搜狗的人占了一半,剩下是来自百度、华为、微软、字节、腾讯等公司以及其他创业公司核心成员在内的数十位顶尖AI人才,月底将打造一只50人规模的精英团队。

Q:国内能做语言大模型的人才很有限,国内大厂和大模型创业团队都在争抢,在人才方面要怎么去竞争?

王小川:我的观点是,不能靠拼团队,去收几个公司,然后拼在一块。这个东西是资本喜欢听的故事,就是去把明星(企业)拼在一起。但其实一个公司就是一个生命,需要把它们深度的融合,基因的交融,硬要去拼的话,其实新团队的速度反而会变得很慢。

我想在早期启动的过程中,技术人才要发挥非常重要的作用。我在搜狗期间,参与共建了清华大学天工智能计算研究院,推动搜狗和清华大学等学术机构合作。所以这次创业,公司也得到清华相关院系及多位院士和教授的支持,建立合作突破通用人工智能基础科学问题,并吸引清华人才加入。

中国在AI人才这块的积累,跟美国还是会有一些差距。我可能下半个月就到美国去了,也得去薅人。我们的人才团队在国内来看一定是相对好的,但你要继续追赶世界的水平,得往后走,得速度快,需要引进人才快速对齐世界领先水平。

“年底做出对标GPT-3.5的大模型”

Q:大概什么时候能够追上GPT-3.5水平?

王小川:追上ChatGPT 3.5水平,我觉得今年内可能就能够实现,但对于ChatGPT-4或者ChatGPT-5,我认为可能需要3年左右的时间,应该不会低于两年。

Q:现在大概每个大厂都会做一个这样的产品,对比大厂你们的优势是什么?

王小川:我觉得大厂做这件事的话,很容易是为他自己的业务目标服务,你让他们提一个创新性的东西,一个从没见过的东西,从上到下都很难去做一个决定,惯性很难改变,所以大厂很难做出大的变革,反而机会是在创新公司。

另外一个就是人才,反而创新公司能够从股权等维度去激励,大家形成一股绳,大厂的人才还是挺分散的,其实很难形成合力。大模型就是需要时间长一点,认真一点,钱不是唯一重要的,好多大公司反而被自己复杂的人事困住了。

Q:中美最近新发大模型的公司,谷歌、百度、360等,其实都是有搜索背景的,是不是搜索公司去做这件事天然有一些优势?

王小川:因为今天首先是语言模型,搜索公司做语言确实有先天优势。而且搜索公司的经验是比较完整的,从数据清洗、转化成模型,到最后上线提供服务、甚至在数据安全这一块的经验,都是基本功,我们都干过,所以学起来也很快。

Q:AI大模型方向,既有微软、Google、Meta、百度等科技巨头你追我赶,也不断有新的挑战者入局,现在这种竞速,每个大厂都在发类似的产品,等你们的产品到年底发布,这件事会不会就不那么“性感了”?

王小川:我只说我年底会发国内最好的语言大模型,并不代表中间我没有其他计划,不代表我们中间没有产品发出来。今年内对于搜索增强,在几个垂直领域里面,可能会让用户体验到新的知识服务。

Q:算力会不会成为“卡脖子”的问题?

王小川:对于我们来说,都不会有太大问题。而且在几年后,我跟中国做芯片的几个大佬聊,他们都觉得会做出一个突破,其实特别有信心。

Q:这次创业和之前做搜狗CEO,在心态上发生了什么变化?

王小川:我最近也在做这个反思,以前搜狗做CEO的时候,我们的人才很充分了,我们的事情想得很清楚了,我们事也干得很漂亮,不断传递的是完美的状态。

但从我创业时发现不是这样,你还有很多不足的地方,并且要保持这种认知,就是我们现在还有各种不足需要大家帮忙,这样的一个心态。我自己其实从搜狗出来以后,包括这段时间,都做了这样的一个调整,我觉得对自己来说是挺进步的一件事情。

Q:目前还有很多企业家也开始进行AI方向的创业,在这一波AI创业浪潮中,要具备什么样的特质才能走到终局,成为最后的赢家?

王小川:首先,(创业团队的)一号位得懂技术,因为接下来技术还会快速地变化迭代,一号位一定是对技术本身有充分的认识、有远见的;其次,需要能组织规模不小的团队,能够管理相对复杂的技术团队;另外,最后还是要做产品服务的,要具备产品商业化的能力,这也会有很大的帮助。