天哪!!Databricks竟然这样。。。

本文首发微信公众号:飞总聊IT

昨天Snowflake刚开完会,CEO和黄仁勋互相一起聊天,黄仁勋说,我会保证给你要的GPU的。

今天早上美国股市一开盘,Snowflake一直猛涨。

结果,没过多久,就开始从高点一路往下跌。

原来Databricks的Data+AI的keynote开始了。

为什么Databricks一开会,Snowflake就开跌呢?

Databricks开场先出王炸,搞了一个LakehouseIQ的东西,也就是Databricks基于自己的数据库创建的大语言模型。

我们还记得吧,前两天Databricks。

这家被收购的公司,就是帮助企业用自己的数据从头训练自己的大语言模型的创业公司。

估计Databricks是最近才收购,但是早就开始训练自己的大语言模型了。

Databricks展示了自己的LakehouseIQ的各种整合,其中有个例子,用英语问欧洲的销售情况。

但是公司并没有欧洲这个分类,只有东欧西欧两个分类。LakehouseIQ很快就给出了正确的SQL。

当然LakehouseIQ能干的东西很多。起码demo看起来很牛逼。

这就比Snowflake那边和黄仁勋讨论显卡要几块,能不能发货高级多了。

后面Databricks又起飞地展示了怎么样用LakehouseIQ去debug。以及怎么样用MosaicML的平台训练自己的大模型,花费多少。还有改进后的MLFlow怎么样去评估不同的大语言模型之间到底哪个更牛逼等功能。

当然,Databricks还引入了自己的Vector search的东西,也就是说Databricks用自己的Lakehouse搞了个VectorDB,姑且这样判断吧。

所以,Snowflake的股价那是伴随着Databricks的keynote一路往下跌,实在是自己太不行了,Databricks明显是有备而来。

当然Databricks除了有很多大语言模型的东西以外,还加了不少自己的东西。

其中Delta Lake这个扶不起的阿斗迎来了3.0。这个3.0可以理解成为大乱炖。什么意思呢?就是Delta Lake在生成自己的metadata的同时也生成Iceberg和Hudi的。

这样一来,一张表既可以当成是Delta Lake的表,也可以当做是Iceberg的表,我是你,但你还是你。这听起来好像确实很牛逼。

不过我个人对这个做法存疑。因为Iceberg现在有一些功能,比如说merge on read,是Delta Lake没有的,所以虽然我可以是你,但是其实我只能是那个你的一部分,很多你的功能我并不能真的提供。

我说Delta Lake既然已经错过了最好的时期了,不如加入Iceberg的社区算了。你好我好大家好,何必玩我是你,但你只是你的游戏呢?

Databricks还介绍了自己的Unity Catalog的新进展,以及开始展示自己的Data Marketplace和Native APP Store。后者确实是动作慢了一点。

Snowflake有Native APP Store已经很久了,Databricks今天终于推出来了。

不管怎么样吧,晚来了也比没来要强。只不过所有的native APP到底哪家强,这个问题还真的不好说。

我还忽略了一些非常技术的部分。比如说首席架构师和cofounder带着大家重新温习数据库论文,给大家解释Databricks可以怎么样通过机器学习突破极限,做出最牛逼的数据仓库来等等。

不管怎么样吧。评价一下,Databricks在大语言模型上的手脚,真的是很快,这一点不得不刮目相看了。

应该说,除了微软以外,这是我见到的手脚最快的一家公司了,谷歌都似乎还差了一点。至于做数据库的公司里,那更是独树一帜。

大语言模型整的快,那现在400多亿的估值也就有了继续吹牛逼的空间了,弄不好Databricks还能够再涨一波。

这方面不得不说,Snowflake确实是慢了不止一拍。

所以,Databricks牛逼了一把,Snowflake感觉不太好看了。

最后,再宣传一下飞总的ChatGPT朋友圈。飞总的朋友圈聚焦在大模型的技术和商业上,欢迎志同道合的人一起加入学习研究。