硅谷爆发AI人才荒!马斯克自曝xAI挖走特斯拉CV负责人,OpenAI偷用百万小时油管视频训GPT-4丨AIGC大事日报

1、OpenAI改进微调API 扩展定制模型训练计划

2、OpenAI或违规使用YouTube视频数据训练GPT-4

3、ChatGPT商业产品付费用户达60万

4、阿尔特曼参与创办的AI公司正洽谈10亿美元融资

5、马斯克的xAI公司洽谈30亿美元融资

6、马斯克的xAI设法从特斯拉挖工程师

7、马斯克将提高特斯拉AI工程师薪酬

8、通义千问开源320亿参数模型

9、谷歌计划对AI驱动的搜索引擎收费

10、谷歌推出Gemma 1.1版本 多轮对话质量提高

11、假冒Midjourney页面获百万人关注

12、长视频生成模型StreamingT2V发布

13、AI视频理解模型MiniGPT4-Video发布

14、斯坦福团队推出端侧可跑的Octopus v2模型

15、Cohere推出RAG优化的大模型Command R+

16、Lambda以英伟达芯片作为抵押获5亿美元贷款

17、英伟达与印尼电信公司将投建2亿美元的AI中心

18、Meta修改深度伪造内容管理规则

19、曝Meta的AI图像生成器存在种族偏见

20、图像网站考虑授权130亿照片和视频训练AI

21、比利时AI创企完成4200万美元融资

22、信雅达大模型智能问答产品发布

23、美国和欧盟就AI安全和治理达成合作

24、华盛顿法官禁止使用AI增强视频作为案件证据

25、以军被曝用AI生成杀戮名单狂轰滥炸加沙

26、 调查显示AI正在削减工人数量

1、OpenAI改进微调API 扩展定制模型训练计划

根据OpenAI官网,OpenAI于4月4日推出微调API新功能,并宣布扩展“自定义模型”的计划,以帮助企业客户开发更强大的定制生成式AI模型。为了让开发人员能够更好地控制模型微调,OpenAI推出了基于Epoch的检查点创建、模型比较、第三方集成、全面的验证指标、超参数配置、微调仪表板改进等功能。同时,OpenAI将去年11月推出的自定义模型计划扩展,宣布其辅助微调产品成为定制模型计划的一部分。

指南地址:https://platform.openai.com/docs/guides/fine-tuning

2、OpenAI或违规使用YouTube视频数据训练GPT-4

据《纽约时报》4月6日报道,随着2021年底OpenAI面临数据供应问题,研究人员创建了一款名为Whisper的语音识别工具,用以将YouTube视频转录为对话文本,最终转录了超100万小时的YouTube视频,用于训练GPT-4。YouTube禁止将其视频用于“独立”于该视频平台的应用程序,OpenAI的做法可能违反了YouTube的规则。《纽约时报》记者认为,OpenAI、谷歌和Meta在寻求在线信息来训练最新的AI系统时,都存在无视公司政策及规避版权法的行为。

3、ChatGPT商业产品付费用户达60万

据《华尔街日报》4月5日报道,OpenAI首席运营官布拉德·莱特凯普(Brad Lightcap)近期透露,已有60万用户正在为ChatGPT商业产品付费,也就是ChatGPT Enterprise或ChatGPT Team。据称,92%的财富500强公司正在以某种形式使用ChatGPT,每周有1亿人积极使用ChatGPT。

4、阿尔特曼参与创办的AI公司正洽谈10亿美元融资

据外媒The Information 4月5日报道,由前苹果首席设计师乔纳森·艾维(Jony Ive)和OpenAI首席执行官萨姆·阿尔特曼(Sam Altman)创立的一家神秘AI公司近期已开始与风险投资领域的一些知名人士进行融资谈判。一位参与该过程的人士表示,该公司已经与Emerson Collective和Thrive Capital讨论了交易,计划筹集最多10亿美元资金。

5、马斯克的xAI公司洽谈30亿美元融资

据《华尔街日报》4月5日报道,与埃隆·马斯克(Elon Musk)关系密切的投资者近期正在商谈帮助他的AI公司xAI在一轮融资中筹集30亿美元,这将使该公司估值达到180亿美元。

6、马斯克的xAI设法从特斯拉挖工程师

据外媒The Information 4月3日报道,当埃隆·马斯克(Elon Musk)建立他的AI创企xAI时,他不得不与大型科技巨头和许多其他初创公司争夺人才。不过,他近期已设法从特斯拉挖来了几名有前途的工程师,比如特斯拉机器学习科学家伊桑·奈特(Ethan Knight)在3月份跳槽到了xAI。伊桑是前特斯拉计算机视觉的负责人,之前曾考虑加入OpenAI,也是过去12个月内第三位加入xAI的特斯拉工程师。

7、马斯克将提高特斯拉AI工程师薪酬

据外媒The Information 4月4日报道,特斯拉首席执行官埃隆·马斯克 (Elon Musk) 周四透露,特斯拉将提高其AI团队工程师的薪酬,这表明他正在应对OpenAI等公司日益激烈的人才竞争。

8、通义千问开源320亿参数模型

阿里云通义千问今日开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡,例如相比14B模型,32B在智能体场景下能力更强;相比72B,32B的推理成本更低。迄今通义千问共开源了7款大语言模型,在海内外开源社区累计下载量突破300万。

基础能力方面,通义千问320亿参数模型在MMLU、GSM8K、HumanEval、BBH等多个测评中表现优异,性能接近通义千问720亿参数模型,远超其他300亿级参数模型;Chat模型方面,Qwen1.5-32B-Chat模型在MT-Bench评测得分超过8分,与Qwen1.5-72B-Chat之间的差距相对较小;多语言能力方面,通义千问团队选取了12种语言,在考试、理解、数学及翻译等多个领域做了测评,Qwen1.5-32B的多语言能力只略逊于通义千问720亿参数模型。

9、谷歌计划对AI驱动的搜索引擎收费

据路透社4月3日报道,谷歌正在考虑对其AI驱动的搜索引擎的高级功能收费,包括将AI驱动的搜索功能纳入其高级订阅服务等,该服务已经在Gmail和Docs中提供了新的Gemini AI助手的访问权限。

10、谷歌推出Gemma 1.1版本 多轮对话质量提高

根据Hugging Face网站,谷歌于4月6日推出了开源模型Gemma的新版本Gemma 1.1,包括7B和2B两个版本。Gemma 1.1使用新的RLHF方法进行训练,在质量、编码能力、真实性、指令遵循和多轮对话质量方面取得了显着的进步。谷歌还修复了多轮对话中的一个错误,并确保模型响应并不总是以“Sure”开头。

Hugging Face地址:https://huggingface.co/google/gemma-1.1-7b-it

11、假冒Midjourney页面获百万人关注

据外媒BleepingComputer报道,近期有黑客正在利用Facebook广告和劫持页面来推广虚假AI服务,例如Midjourney、OpenAI的Sora、GPT-5以及DALL-E,以窃取密码的恶意软件袭击毫无戒心的用户。其中,一个冒充Midjourney的恶意Facebook页面聚集了120万粉丝,并在最终被删除之前保持活跃近一年,该页面于2024年3月8日被关闭。

12、长视频生成模型StreamingT2V发布

根据GitHub网站,UT奥斯丁等机构于4月5日发布了视频生成模型StreamingT2V的代码和模型。此前3月22日,团队在arXiv上发表论文,提出了一种AI视频生成技术StreamingT2V,可以生成高度一致、长度可扩展的视频。据介绍,StreamingT2V能够生成1200帧、时长120秒的长视频,且理论上可以生成无限长的视频。

GitHub地址:https://github.com/Picsart-AI-Research/StreamingT2V

论文地址:https://arxiv.org/abs/2403.14773

13、AI视频理解模型MiniGPT4-Video发布

根据arXiv网站,KAUST和哈佛大学研究团队在4月4日发表的论文中提出MiniGPT4-Video框架,一个专为视频理解而设计的多模态大模型。该模型能够处理时间视觉和文本数据,使其能够熟练地理解视频的复杂性。MiniGPT4-video不仅考虑视觉内容,还集成了文本对话,允许模型有效地回答涉及视觉和文本组件的查询。据称,该模型优于现有的最先进的方法,在MSVD、MSRVTT、TGIF和TVQA基准测试上分别获得4.22%、1.13%、20.82%和13.1%的成绩,模型和代码已公开。

论文地址:https://arxiv.org/pdf/2404.03413.pdf

GitHub地址:https://vision-cair.github.io/MiniGPT4-video/

14、斯坦福团队推出端侧可跑的Octopus v2模型

根据arXiv网站,斯坦福团队研究人员于4月2日推出端侧可运行的Octopus v2模型。基于新方法,具有20亿个参数的Octopus v2模型能够在准确性和延迟方面超越GPT-4的性能,并将上下文长度减少95%。与具有基于RAG的函数调用机制的Llama-7B相比,该方法的速度提高了35倍。

论文地址:https://arxiv.org/pdf/2404.01744.pdf

15、Cohere推出RAG优化的大模型Command R+

根据AI独角兽Cohere官网,Cohere于4月4日推出Command R+,一种先进的高级检索增强生成 (RAG)优化的大语言模型,也是该公司目前最强大、可扩展的大型语言模型。该模型具有128k tokens上下文窗口,提供RAG并被加入引用以减少幻觉,支持10种主要语言多语言覆盖,支持全球业务运营,并可用于自动化复杂业务流程。Command R+系列现已在微软Azure上提供,并且很快将向其他云提供商提供。

官方地址:https://txt.cohere.com/command-r-plus-microsoft-azure/

16、Lambda以英伟达芯片作为抵押获5亿美元贷款

据路透社4月4日报道,美国智能云厂商Lambda近期已从包括麦格理集团(Macquarie Group)在内的贷方获得了5亿美元的贷款,其将提供英伟达芯片作为抵押品。

17、英伟达与印尼电信公司将投建2亿美元的AI中心

据路透社4月4日报道,英伟达和印度尼西亚电信公司PT Indosat Ooredoo Hutchison计划于2024年在中爪哇建立一个AI中心,价值2亿美元。该AI中心可能由电信基础设施或人力资源中心组成,并将位于梭罗市。

18、Meta修改深度伪造内容管理规则

据路透社4月5日报道,Meta周五宣布修改相关数字媒体政策,准备测试其监管AI技术生成的欺骗性内容的能力。新方法将改变公司对操纵内容的处理方式,从专注于删除特定帖子转向保持内容不变,同时向观众提供有关其制作方式的信息。

19、曝Meta的AI图像生成器存在种族偏见

据外媒The Verge 4月4日报道,记者近期多次尝试使用“亚洲男人和白人朋友”、“亚洲男人和白人妻子”、“亚洲女人和白人丈夫”等提示词来创建图像,Meta的AI图像生成器都无法胜任。对此该记者认为,AI系统的生成不准确问题反映了其创建者、培​​训者及其使用的数据集存在偏见。

20、图像网站考虑授权130亿照片和视频训练AI

据路透社4月5日报道,老牌图像托管网站Photobucket近期正在与多家科技公司进行谈判,以授权Photobucket的130亿张照片和视频用于训练生成式AI模型。公司考虑每张照片5美分到1美元之间的价格,每个视频超过1美元的价格,价格因买家和所寻求的图像类型而异。

21、比利时AI创企完成4200万美元融资

据外媒TechCrunch 4月5日报道,比利时AI初创公司Robovision近期完成4200万美元A轮融资,由比利时农业科技投资者Astanor Ventures和Target Global共同领投,使企估值达到1.8亿美元。Robovision聚焦打造一个“无代码”计算机视觉AI平台,在不需要软件开发人员或数据科学家参与的条件下,助客户使用其平台上传数据、标记数据、测试模型并将其部署到生产中。

22、信雅达大模型智能问答产品发布

根据信雅达科技股份有限公司官方公众号,信雅达运营智能知识助手“小雅”于4月3日发布。作为信雅达数字化运营条线全新推出的大模型智能问答产品,“小雅”是一款专为商业银行打造的办公辅助工具,基于信雅达“雅问知识湖”,结合银行金融知识库,提供专业问答服务。

23、美国和欧盟就AI安全和治理达成合作

根据欧盟官网,欧盟和美国4月5日发表联合声明确认加强AI领域合作。该协议主要涵盖AI安全和治理领域,同时双方还打算在许多其他技术问题上进行广泛合作,例如制定数字身份标准以及对平台施加压力以捍卫人权。

24、华盛顿法官禁止使用AI增强视频作为案件证据

据外媒NBC News 4月3日报道,华盛顿州一名负责监督三重谋杀案的法官在近期的裁决中禁止使用AI增强的视频作为证据,专家称该裁决可能是美国刑事法院的首例。法庭文件显示,一名男子被指控于2021年在西雅图地区一家酒吧外开枪,造成三人死亡、两人受伤,该男子的律师曾试图引入经过机器学习软件增强的手机视频。文件称,增强后的图像“不准确、具有误导性且不可靠”。

25、以军被曝用AI生成杀戮名单狂轰滥炸加沙

财联社4月5日电,以色列媒体《+972》杂志(注:+972为以色列的国际区号)4月3日发表一篇题为《“薰衣草”:人工智能机器指挥以色列在加沙狂轰滥炸》的文章,援引六名以色列现任情报官员的信源,曝光了以军在本轮巴以冲突中使用一款自主开发、名为“薰衣草(Lavender)”的人工智能程序,生成“杀戮名单”。报道称,在本轮冲突、特别是冲突早期,以军就是凭借这份由人工智能生成的、最多时包含了多达37000人的“杀戮名单”,在加沙地带狂轰滥炸。

26、 调查显示AI正在削减工人数量

据路透社4月5日报道,人力资源提供商Adecco近期在一份基于对全球2000家大公司高管的调查的报告中提到,约41%的高管预计由于AI技术的发展,公司员工队伍将减少。AI将导致许多公司在未来五年内雇用更少的员工。不过,尽管Adecco调查的大多数高级管理人员都表示AI是游戏规则的改变者,但大多数人表示他们在采用该技术方面尚未取得足够的进展。