AI周报|OpenAI被曝解散“超级智能对齐”团队;多家美国AI创业公司开启裁员

OpenAI发布GPT4-o,推出适用macOS的桌面级应用

当地时间5月13日,OpenAI通过直播展示了产品更新,发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI还与苹果走到一起,推出了适用于macOS的桌面级应用。

点评:GPT-4o的多模态能力颇受关注,其具备视觉能力,可通过手机摄像头“看到”画面并描述,可在“看到”电脑桌面并解答问题,还可以充当实时翻译、辨别人的脸部表情。此外,包括OpenAI推出macOS桌面级应用在内,业内近期对大模型落地端侧多有期待。OpenAI发布的多个演示视频中,GPT-4o运行在电脑和手机上,这或许意味着,OpenAI下一步会着力推动大模型在端侧应用。

谷歌发布十几款产品对阵OpenAI

北京时间5月15日凌晨,谷歌在2024年I/O开发者大会上一次性掏出十几款产品的更新对阵前一天举办发布会的OpenAI,重磅级的发布包括轻量化的模型Gemini 1.5 Flash、AI通用智能体Project Astra、强大的AI搜索、视频生成模型Veo、第六代TPU Trillium等,Gemini 1.5 Pro的上下文窗口也从100万tokens升级到200万。

谷歌此次的视觉识别和语音交互产品Project Astra被认为是正面交战GPT-4o。Astra项目展示了多模态理解和实时对话能力。在谷歌演示的视频中可以看到,通过摄像头,这个AI助手能完成帮忙理解屏幕中的代码、找眼镜在哪里这样的工作,也可以通过画面理解"薛定谔的猫"这样的概念。

点评:在两个小时的主题演讲里,据Gemini统计,"AI"被提及了121次,谷歌官网同步发布了11篇AI相关的博客介绍此次更新。这场不见硝烟的战争,谷歌看起来全力以赴了。值得玩味的是,在谷歌发布会后, OpenAI CEO奥尔特曼(Sam Altman)在X上发文表示,“我努力不去过多思考我们的竞争对手,但我无法不去思考OpenAI和谷歌之间的美学差异。”这被行业解读为在暗讽谷歌。

OpenAI内斗风波关键人物离职

OpenAI联合创始人兼首席科学家伊利亚·苏茨克沃(Ilya Sutskever)当地时间周二在社交媒体上宣布,他决定离开工作近十年的OpenAI。未来他将有自己的项目要做,并会在适当时候分享细节。OpenAI CEO奥尔特曼很快在社交媒体上表示:"苏茨克沃和OpenAI即将分道扬镳,我非常难过。如果没有他,OpenAI就不会有今天。"

点评:苏茨克沃在去年底OpenAI内斗风波中扮演关键角色,他参与董事会投票解雇了奥尔特曼,随后又支持奥尔特曼回归公司。虽然内斗风波表面上平息了,但苏茨克沃在OpenAI的处境仍显尴尬。外界认为,OpenAI内部对AI的发展有两种态度,保守派强调安全和OpenAI的基本价值观,苏茨克沃是保守派代表人物,以奥尔特曼为代表的另一派更强调加快发展和商业化。苏茨克沃离开后,或许OpenAI在商业化上会更加坚定。

OpenAI被曝解散“超级智能对齐”团队

5月18日凌晨,OpenAI安全主管、“超级智能对齐团队”负责人Jan Leike在社交平台宣布离开OpenAI。这也是继OpenAI联合创始人兼首席科学家伊利亚·苏茨克沃辞职之后又一名高管辞职。Jan Leike在社交平台X上公开透露,与OpenAI高层在公司的核心优先事项上存在长期分歧,最终双方的分歧已经严重到无法调和的地步。团队在推动其研究项目和争取计算资源时遇到了重大阻碍,缺乏资源会严重影响研究的进度和质量。

随后OpenAI证实,由Ilya和Jan Leike共同领导的“超级智能对齐团队”已经解散。此后,该团队的研究工作将被整合到OpenAI的其他研究小组中。去年7月,OpenAI宣布成立一个新的研究团队“超级对齐”,要用AI监督AI的方式,解决超智能“AI对齐”问题。“AI对齐”的意思是,要求AI系统的目标要和人类的价值观与利益相一致。

点评:一度几乎导致OpenAI分崩离析的宫斗事件终于尘埃落定。AI风险团队解散是OpenAI内部最近出现动荡的又一证据,也再次引发了人们对该公司在开发AI产品时如何平衡效率与安全的质疑。针对这一消息,马斯克评价道, “这显示安全并不是OpenAI的首要任务”。 OpenAI CEO奥尔特曼发文肯定了Jan Leike在OpenAI的贡献和领导能力,并表示,未来几天内会发表一篇更长的文章,来阐述OpenAI对于产品安全的规划和所做的事情。

多家美国AI创业公司开启裁员

5月17日,美国旧金山AI编程独角兽Replit宣布了一次重大裁员,CEO Amjad Masad 在社交平台发布了一封电子邮件,他透露,将有30名员工被裁掉,占员工总数的20%。Masad 表示,这一决定是在 Replit 为更好地服务企业客户而进行的战略调整的一部分。尽管公司目前财务状况良好,但为了实现更大的发展潜力,公司决定缩小团队规模,以便更加专注和高效地推动创新和市场扩展。据悉,Replit已从a16z以及Coatue筹集了超过2.2亿美元的资金,最新估值超过10亿美元。

除Replit外,还有多家美国生成式AI创企被曝陷入资金短缺危机。大语言模型创企Reka AI被曝可能以10亿美元被数据存储和分析公司Snowflake收购,此前面临卖身乃至倒闭危机的AI独角兽企业Stability AI,则正在争取一笔“救命钱”。

点评:市场观点认为,科技巨头下场竞争是加剧初创企业危机的直接原因。随着科技巨头们不断推出各种免费或付费的生成式AI服务,企业客户们放缓或减少了对商业软件的支出,这让本来资金就并不充裕的AI初创公司们面临更大的竞争压力,要在这场关于AI的“烧钱游戏”中活下来并不容易。

字节挑起大模型价格战

5月15日,字节跳动发布豆包大模型。火山引擎总裁谭待披露豆包大模型的商业化价格——豆包主力模型在企业市场的定价为0.0008元/千Tokens,即0.8厘的价格可处理1500多个汉字,较行业平均价格便宜99.3%。市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。至于为什么要做降价这个市场动作,谭待表示,目前接触的很多客户都在做大模型方面的尝试,但创新这件事的风险度很高,尤其在AI领域,因此需要将成本降低,带动大家更广泛地使用起来。

点评:大模型算力贵、价格高阻碍了落地应用,业界已在推动大模型商业化价格逐步降低。OpenAI近期发布的GPT-4o价格为GPT-4 Turbo的一半,智谱入门级产品GLM-3 Turbo模型调用价格下调80%。不过,在大模型应用还未大规模落地的情况下,单是打价格战能否刺激市场需求,目前还难下定论。

腾讯混元大模型逐步推动开源

5月14日,腾讯混元文生图模型Hunyuan-Dit升级并开源,参数量15亿。随后,腾讯宣布将在今年第三季度开源文生文模型,包括Hunyuan-S、Hunyuan-M和Hunyuan-L,分别用于手机端、PC端、云或数据中心部署。关于混元逐步开源的原因,腾讯混元模型应用负责人张锋告诉第一财经记者,大模型应用很多场景需要私有化,这种情况下只提供API(接口)不太能满足需求。此外,腾讯相关负责人还透露算力成本有所降低,腾讯使用自研Angel训练推理平台,调度异构卡集群,万亿大模型推理成本比开源减少70%。

点评:国内科技大厂开闭源路线已分化,华为、百度均未推出开源模型,其中百度坚持走闭源路线,而腾讯和阿里的大模型都走开源和闭源并行路径。目前,开闭源路线胜负未定。此外,随着GPT-4o调低价格、字节跳动推出低于行业均价的大模型,近期大模型算力成本下降也成为业内关注的话题。腾讯之外,字节跳动也在通过优化模型结构、混合调度云计算算力等方式降低算力成本。推理算力下降成为大势所趋。

腾讯股价重回400港元大关

5月16日盘中,腾讯控股上涨近5%,股价涨至401港元/股,创一年内最高。腾讯5月14日盘后发布了2024年第一季度财报,显示第一季度收入1595.01亿元,同比增长6%,净利润(Non-IFRS)502.65亿元,同比增长54%。腾讯管理层在业绩说明会上表示,公司有微信这样的平台,用户量多且用户参与度高,引进AI科技实现更多可能性。

点评:5月以来,腾讯股价屡创一年内新高,相比2022年2月超450亿港元/股的上一个高点则仍有距离。2021年以来,在游戏强监管、互联网反垄断监管、大股东减持等背景下,腾讯股价持续波动,腾讯也在调整自身业务,推进降本增效,并在微信等优势业务板块寻找增长机会、接入生成式AI。今年第一季度,对视频号等业务的拓展推高了腾讯整体毛利表现。此外,此轮腾讯股价回升,也有4月底以来港股行情反弹的背景。

百度智能云一季度营收47亿元,生成式AI贡献收入比例6.9%

百度发布2024年第一季度业绩。财报显示,该季度百度总营收315亿元人民币,同比增长1%,归属百度的净利润为54.48亿元,同比减少6%。财报后的电话会中,李彦宏表示,百度智能云在本季度营收达47亿元,同比增长12%,生成式AI贡献的收入比例达6.9%,占比逐步扩大。李彦宏还表示,搜索最有可能成为AI时代的“杀手”应用,而百度搜索的AI重构工作仍处于早期阶段。

点评:百度是国内"百模大战"中最早入局者之一。作为国内搜索引擎龙头,百度如何用大模型重构搜索备受关注。不过,搜索引擎能否成为AI时代的“杀手”应用,还很难下定论。目前的AI搜索产品更像是搜索引擎与大模型问答能力的糅合,还没有完全颠覆搜索引擎的形态,大模型智能涌现后也还未改变搜索引擎格局。未来,打败传统搜索引擎的不一定是AI引擎,或许是智能助手等其他产品形态。

宇树发布Unitree G1人形机器人:定价9.9万元

5月13日,人形机器人公司宇树科技发布了其最新人形机器人产品——Unitree G1人形智能体,AI化身,售价仅9.9万元起,目前已经在电商平台上线。

在宇树科技发布的产品视频里,这款机器人能够像人类一样用机械双臂灵活地完成一系列动作。官方数据显示,这款机器人身高约127厘米,体重约35公斤,具有超越常人的灵活性。其小跑速度大于2m/s,拥有广阔的关节运动空间,23至43个关节,最大关节扭矩达到120N.m,可进行高难度的动态动作,如动态站起、坐下折叠、舞棍等。G1还可选配Dex3-1力控灵巧手,通过力位混合控制,这使得G1能够模拟人手的精准操作能力,对各种物体进行精确控制。

点评:目前限制人形机器人行业发展的一大阻碍就是成本,宇树科技此次推出的9.9万元的机器人无疑能更大程度推动落地。对于成本是如何下降的,宇树科技方面答复记者表示,宇树在过去的四足机器人产品上,积累了很多机器人降成本的经验,所以下降较快。过往的机器人设计经验以及机器人量产经验,带来了效率提升。

MiniMax 上线AI应用“海螺AI”

5月15日,明星大模型公司MiniMax宣布上架C端产品“海螺AI”,支持输入200k的上下文长度,1秒内处理近3万字的文本,进行书籍、长篇报告、学术论文等长篇内容的阅读、分析和文本写作。MiniMax发文表示,海螺AI可以辅助学生、职场新人、自由工作者、创作者等各类人群,作为一个外挂大脑和人生搭子,帮助化解信息过载和高速运转带来的压力。

目前这款产品在官网以及应用端APP上线。据了解,海螺AI接入了MiniMax自研的多模态大模型,包括万亿参数MoE大语言模型abab6.5,语音大模型和图像大模型。

点评:进入2024年,各家大模型企业都在争相推出AI应用产品,追求落地。不久前MiniMax 创始人闫俊杰接受采访时表示,资源排在前列的中国大模型创业公司很难在资源占有量上领先对手一个量级,“拐点只可能来自技术、产品或者是商业化效率的领先。”

逐际动力完成新一轮战略融资,阿里参投

5月17日,通用机器人初创公司逐际动力完成新一轮战略融资,杭州灏月企业管理有限公司参与了本轮投资,双方表示将共同推动以通用人形机器人为代表的具身智能的发展,开拓可商业化落地的应用场景。

杭州灏月是阿里巴巴(中国)网络技术有限公司的一致行动人公司,成立于2023年10月,淘宝中国持股约57%,浙江天猫技术有限公司持股约36%。

点评:在大模型加持下,机器人企业也迎来了春天。此前阿里已投资了一圈大模型企业,现在其目标也开始转向机器人了。逐际动力成立于2022年,总部位于深圳,聚焦做通用机器人,产品包括全尺寸人形机器人、四轮足机器人、双足机器人及相关解决方案,落地应用聚焦在智能制造、工业巡检、物流配送、特种作业、家庭服务等B2B和B2C领域。创始人张巍博士是南方科技大学长聘教授。在成立逐际动力之前,曾任美国俄亥俄州立大学长聘教授。