奋进的海淀,崭新的人工智能全景赋能第一城|甲子光年
海淀的人工智能新事。
作者|王艺
编辑|王博
海淀一直是科技创新的代名词。
的确,这里诞生过我国第一家民营高科技企业、第一个国家级高新技术产业开发区、第一个国家自主创新示范区。
从改革开放后诞生的“电子一条街”,到科创企业扎堆的“中关村科技园”,到“中关村国家自主创新示范区”,再到如今的“国际科技创新中心”和覆盖海淀全区域的“中关村科学城”,“中国科技创新发展看海淀”绝对不是一句夸大的话。
《人民日报》刊登《“中关村电子一条街”调查报告》,图片来源:「甲子光年」于海淀街道摄影展拍摄
但是,如同消费者面对一个知名品牌,第一时间想到很多过往的经典产品,而忽略最新产品一样,现在很多人提到海淀,在赞叹之余,也会思考:海淀在科技创新方面,有什么新举措?
近年来,海淀区重点发展人工智能、量子信息、商业航天等前沿技术,其中尤以人工智能的发展最为迅猛和亮眼。海淀区不仅积极为人工智能产业的发展积极提供政策、资金和算力支持,更是在生态建设和样板工程上不断发力,积极推动人工智能的应用落地和场景创新。
8月19日下午,在2024北京人工智能生态大会上,海淀区发布了《中关村科学城人工智能全景赋能行动计划(2024-2026年)》,这一计划的内容可被概括为“主阵地”“主平台”和“主引擎”,海淀区要率先在全国建成首个人工智能创新街区、首个人工智能应用加速器,将中关村科学城打造成人工智能全景赋能第一城。
同时,海淀区还定下了目标,力争到2026年,产出100个标杆行业模型产品,涌现100个示范引领典型案例,形成千家企业千亿集群,引领带动万亿经济发展新局面。
海淀区不仅有五道口大模型往事,还有人工智能生态新事。
1.领航者的底气
北京西郊泉水丰富,是历史上重要的地表水源地。海淀也因水而生,因水而聚。
历史上,海淀是北京通往居庸关古道的必经之地,是从金中都北上的第一站。晚唐和辽金时期,燕京地区常用“淀”称呼湖泊;到了元朝,元大都地区将宽广的水面称为“海”。海淀由于有农田和水系,饮食供应方便,并且距城二十里,是商旅休息的理想地点,因此被称为“海店”。
而元大都修建之后,通往清河镇的道路变得更加重要,“海店”逐渐失去了交通地位,而以水源而称的“海淀”一名流传了下来。
古文有云,“水主智,其性聪,其质善”。或许也正是因为水的灵性和智性,几百年来,海淀颇受达官贵人和文人墨客的喜爱。近代以来,海淀更是成为了中国科技的摇篮。
由于众多知名高校和科研机构在此集聚,可以说,新中国成立后,海淀就成为了北京乃至全国的“智力中心”,上世纪八十年代后,海淀更是因为政策,成为了高新技术发展的重要策源地——1984年,海淀区提出建设“两区一基地”,这其中的“一区”就是智力密集的新技术产业开发区。
此后,海淀区的高新技术产业开始了蓬勃发展:1988年,北京市第一个新技术产业开发试验区在海淀中关村成立;1999年,国务院批复北京市政府和科学技术部《关于实施科教兴国战略加快建设中关村科技园区的请示》,同意建设中关村科技园区;2009年,中关村国家自主创新示范区开始建设;2011年,《中关村科学城发展规划》发布,中关村科学城建设全面提速;2016年开始,中关村进入建设国际科技创新中心时期,不断吸引和集聚国际化的顶尖人才,加快建设世界领先的科技园区。
中关村地区的发展,图片来源:「甲子光年」于海淀街道摄影展拍摄
于是,在海淀这片土地上,不仅诞生了中国的互联网,更是诞生了第一家民营科技企业、第一家不核定经营范围的企业、第一家无形资产占注册资本100%的企业、第一家有限合伙投资机构……从上世纪八九十年代的联想、北大方正、清华同方,到二十一世纪前两个十年的百度、小米、美团、字节跳动、快手,再到最近几年的商汤、旷视、寒武纪、百川智能、智谱华章、零一万物等,一个又一个创新企业在海淀和中关村走向全国、走向世界。海淀区成为了名副其实的“国际科技创新中心”,中关村也因此有了“中国硅谷”的称号。
中国互联网诞生、发展在海淀,图片来源:「甲子光年」于中国互联网大会拍摄
而人工智能,作为新一轮科技革命和产业变革的核心驱动力和国家战略的重要组成部分,是海淀最为重视、也发展最好的产业之一。
早在2000—2014年北京市人工智能产业规模较小且较为零散的时候,海淀区就已初步具备产业集聚的苗头;2015—2016年,北京市人工智能企业数量开始井喷,围绕海淀区向外积极拓展。互联网周刊评选的2016“中国人工智能TOP 100”中,就有一半来自北京中关村。
2017年,中关村科技园区管理委员会发布了北京首个人工智能政策——《中关村国家自主创新示范区人工智能产业创新政策》;2018年11月,北京市科学技术委员会发布了北京智源行动计划,和海淀区政府共同推动成立了北京智源人工智能研究院;2019年5月,海淀区发布了《关于加快中关村科学城人工智能创新引领发展的十五条措施》,旨在强化原始创新能力提升,集中支持关键技术源头创新,鼓励发展早期和长期投资;同年,海淀区人工智能产业集群入选国家战略性新兴产业集群,并在2023年获评优秀等级。截至2022年底,海淀区人工智能产业以1.41万件授权发明专利居于榜首,占北京市人工智能产业授权发明专利的64.89%。
而在大模型时代到来之后,海淀更是发挥“敢为人先、先行先试”的精神,紧跟时代潮流和科技发展趋势,在人工智能领域进行了更为全面深入的布局:2023年6月,海淀区政府印发《关于加快中关村科学城人工智能大模型创新发展的若干措施》通知,在大模型软硬件技术体系、公共算力、数据要素供给、人才引育与国际合作、产业重塑等五个方面给予了支持;2023年9月,海淀区发布了《中关村科学城通用人工智能创新引领发展实施方案(2023—2025年)》,指出要加强人工智能原始创新和前沿研究、推动人工智能大模型创新体系发展、构建通用人工智能活跃创新生态。
2024年,海淀积极打造全国人工智能产业高地——海淀区委书记张革亲自带队走访了清华大学、北京航空航天大学、中国人民大学、北京大学、北京林业大学和北京邮电大学等高校,签署了多起合作备忘录;海淀还积极探索人工智能数据开放共享监管沙箱试点,以中关村人工智能大模型产业集聚区及科学城北区重点产业园区为载体打造数据基础制度先行区;此外,在今年的中关村论坛上,海淀率先发布了全球首个人工智能街区的概念,在53平方公里的城市空间内按照“三横、两纵、一带”的格局规划了人工智能街区,全力建设集成通用人工智能技术的城市智能体,并且率先在五道口和大钟寺两个街区打造了智能体样板间。
在北京人工智能生态大会的现场,海淀区委书记张革表示:“海淀区是北京国际科创中心核心区,是科技创新出发地,原始创新策源地,自主创新主阵地。教育、科技、人才资源高度密集是鲜明的特点和独特的优势。区域内聚集了37所高校,12个新型研发机构,52个全国重点实验室,106个国家科研机构,超1300家人工智能企业,汇聚了1.23万名人工智能的学者和产业者,101位AI 2000全球顶尖学者,其中有人工智能领域全国重点实验室14家,新型研发机构3家,获批人工智能本科专业的高校有21所。原始创新基础雄厚,人才智力资源集中,研发突破能力强劲,产品迭代升级活跃,成为人工智能产业发展的最佳之地。”
作为国内人工智能领域创新基础最好、人才资源最集中、研发实力最强、产品迭代最活跃的地区,发展人工智能,不仅是海淀区的核心使命和责任担当,更是推动区域经济转型升级、引领未来科技发展的重要引擎。
2.先行者的实践
“十四五”规划提出,中国经济由高速增长转向高质量发展的过程中,数字经济要发挥重要作用。而在发展数字经济的过程中,人工智能起到了重要的“领头羊”作用。
尽管人工智能可极大促进数字经济的发展,但在具体的实施过程中,仍然面临着“落地难”的问题:
首先是缺乏数据,深度学习需要大量数据进行训练,以达到最佳拟合度。虽然理论上通过大量数据训练的算法没问题,但在实际应用中,机器训练的高成本已成为业界共识。公开信息显示,准备训练数据就占据了AI项目开发的80%工作量,而获取足量可标注的训练数据又成本高昂;此外,由于信息安全和工作量等因素,许多定制化的AI项目难以获取足够的标注数据,特别是在某些垂直应用场景中,数据稀缺,导致无法进行有效的模型训练,降低数据准备成本成为AI商业落地最需要解决的难题。
其次是模型性能不足。速度不仅是决定模型训练时间长短的关键因素,也是影响模型实时性能的关键因素。在一些需要实时响应的场景中,如自动驾驶、智能客服等,如果模型推理速度不够快,将无法满足实际应用的需求。这对算力和模型的迭代优化提出了要求。
第三是缺乏具体的行业知识。人工智能作为一项技术,是“生产力”,需要结合具体的场景,才能发挥其最大的价值。不同行业有其特殊的知识体系和业务逻辑,在特定领域如医药、新能源等行业,构建专业知识图谱和智能问答系统面临技术挑战,需要深度融合行业专业知识与AI技术。然而,当下技术和业务之间的壁垒仍然高筑,技术人才不懂业务、业务人才不懂技术的现象普遍存在。如何将通用大模型有效地适配到特定行业,实现从技术到业务价值的转化,仍然面临诸多挑战。
解决这些问题,除了需要学界、业界不断努力,突破技术瓶颈、促进数据流通与信息共享外,也需要有一个“先行者”的引领。
中国工程院院士、中国工程院原副院长邬贺铨在大会上指出,“AI本身就是新质生产力的引擎,如果把数据的作用更好的发挥出来,我们可以更好的在产业上应用。但是,我们的数据量现在还不够,开放的语料也不够,数据基础制度也还在在建设。在缺人才,缺技术,缺数据的情况下,有很多中小企业对AI应用还处在观望之中,不会用AI;以及由于担心网络安全和泄密、担心跨境流通数据违规、担心AI生产线难掌控,不敢用AI;还有人觉得生存是当务之急,靠AI不能救急,不愿用AI。因此,我们要营造AI生态还需要政府扶持,要加强制度跟AI平台的建设,推动重点领域的试点和模式创新。”
在大会上,中关村科学城管理委员会副主任、海淀区人民政府副区长唐超发布了《中关村科学城人工智能全景赋能行动计划(2024-2026年)》(下文简称《全景赋能行动计划》),表示要加快探索人工智能和千行百业的双向赋能路径,率先在全国建成首个人工智能创新街区,率先在全国建成首个人工智能应用加速器,将中关村科学城打造成为人工智能全景赋能之城。
同时,海淀区还立下了雄心壮志,表示到2026年,力争产出100个标杆行业模型产品,涌现100个示范引领典型案例,形成千家企业千亿集群引领带动万亿经济发展新局面。
为了达成这一目标,海淀区做了三个方面的计划和部署:
一是建设创新应用加速器。海淀区表示将支持各行业优势主体组织形成创新应用联合体,依托联合体建设人工智能创新应用加速器,面向未来催生一批民生、科研和产业领域的新产品、新场景、新服务,进而提高从技术研发到产品落地和商业应用的效率和成功率。在加速器之外,海淀区还将打造未来场景共创空间、建设国际应用开源平台、强化创新应用加速服务,并构建高效的供应链体系,在方方面面保障人工智能从技术向应用的转化;
二是实施应用示范工程。海淀区面向国家重大战略实施和重点领域安全能力建设,遴选了实践基础好、应用价值高、推广潜力大、示范效应强的十大重点场景,推进应用示范工程建设。这十大重点场景包括具身智能、医药健康、自动驾驶、智能制造、科学研究、教育教学、政务服务、文化旅游、智慧金融和城市运行,也就是说,海淀要在这几个领域率先实现人工智能的应用落地,进而以点带面、带动人工智能在全行业的落地;
三是优化应用创新要素。围绕制度创新、算力供给、数据要素、人才引进、专利保护这五个方面,海淀区分别推出了优化措施——不仅围绕医疗、自动驾驶、机器人等领域,支持人工智能产业首台(套)创新产品的应用,更是积极整合跨架构、跨服务商、跨域算力资源、构建多元异构算力的跨域调度平台;海淀区还积极推动数据运营平台的建设、加强人才引进和人才交流、并助力创新主体积极参与人工智能标准研制。
《全景赋能行动计划》的发布,意味着大模型将走出实验室、真正实现与产业的接轨和应用的落地,也意味着越来越多行业都将受益于人工智能这一新时代的“水电煤”,实现提质增效、迸发更多的活力和创新。曾经传统的行业或许将不再传统,而千亿市值的龙头企业和万亿规模的产业集群,或许也将率先诞生在海淀。
而最近,有不少海淀的企业已经在人工智能的场景应用上初露锋芒。在大会上,中关村数字经济产业联盟发布了《人工智能+场景实践典型案例》报告。
报告列举了京能信息、中国移动、用友网络、广联达等30家公司在各个细分领域的人工智能实践,比如京东方通过裸眼3D显示生成平台带来了更生动的显示体验,京能信息将人工智能技术应用在智能办公领域,中国移动推出了“看店助手智能体”,用友网络也推出了公共资源交易行业垂类大模型。
图源:中数联盟《人工智能+场景实践典型案例》报告
“这些优秀案例企业作为人工智能应用场景的开拓者和技术赋能的佼佼者,通过持续的技术创新与应用示范,不仅解决了行业痛点,提升了生产效率与服务质量,还带动了相关产业链的协同发展,为人工智能产业的繁荣注入了强劲动力。”在发布报告时,中数联盟轮值理事长、华为北京总经理张东亚表示。
在政策环境、技术创新与应用示范之外,要发展人工智能,产业协同也不可或缺。
政策环境为人工智能的发展提供稳定的制度保障;技术创新则是推动人工智能不断进步的核心动力;而产业协同则有助于形成强大的产业链,实现技术与市场的深度融合。只有构建起这样一个良性循环的生态体系,人工智能才能真正发挥出其巨大的潜力,为社会进步和人类福祉作出更大贡献。
在政策环境的支持下,海淀不少企业都开启了人工智能产业生态的共建:
华为成立了北京昇腾创新中心,已经联合200多家企业伙伴,围绕8大行业、孵化了350多个行业场景解决方案;智谱华章CEO张鹏也介绍,智谱AI不仅在华为昇腾平台上训练出了更高性能的CodeGeeX4模型,对比同等规模参数的模型实现了20%训练效率的提升,更是和昇腾合作,联合打造了人工智能公共算力平台。
图源:北京人工智能生态大会 「甲子光年」拍摄
在华为与智谱共建的这套生态体系下,一些人工智能的产业实践正在生根发芽: 比如中国工商银行构建了以智能中枢为基础、灵活组装知识检索、数据分析、文档编写、智能搜索等专项核心能力的“1+X”金融行业大模型,京东集团将AI大模型应用于数字城市的构建上,为城市的轨道交通运营等提供服务;昆仑智算推出了昆仑训推融合一体机和AI Lab体验社区;清昴智能推出了面向基座模型的AI模型推理优化工具链MLGuider,该工具链基于模型、分布式、编译联合优化,可以提升GPU对目标负载的计算效率和通信效率。
此外,中国移动研究院、百川智能、第四范式、蚂蚁集团旗下数字蚂力也在大会上分享了自己的人工智能应用落地实践。
值得一提的是,除了案例报告中的企业,海淀区的几家明星科技企业,在此次大会上也有新动作:
以潞晨科技为例,他们与华为携手合作,共同推出了潞晨昇腾超级工作站LLM Studio,该工作站包含潞晨昇腾训推一体机和潞晨昇腾办公一体机两部分:潞晨昇腾讯推一体机以其无缝迁移的特性,显著提升了大模型的训练效率,降低了企业的AI大模型部署门槛;潞晨昇腾办公一体机则提供0门槛的迁移方案,实现了企业从其他硬件过渡到昇腾平台的无缝衔接,让企业能够更加轻松的拥抱AI,加速数字化转型的步伐,显著降低了迁移的经济和技术成本。
中科闻歌发布了其最新成果——优雅大模型3.0,该模型具备15种以上图、视频编目和高阶语义检索能力,准确率达 90%以上。模型多智能体总参数超过 40B,全面赋能包括素材清洗、故事文案生成、文生数字人、视频生成、智能运镜、智能剪辑以及专业化成片等内容创作的各个环节,可将专业化视频内容创作的成本降低80%,实现了多模态大模型的无中生有、有中生优、视频创作全链路应用。
针对日益猖獗的AI换脸、AI诈骗、AI造假等问题,瑞莱智慧同样发布了生成式人工智能内容检测一体机,这是全国首个用于识别AIGC合成内容的一体机,可以鉴别文生图、文生视频伪造的图像视频。采取软硬件协同优化的方式,能够短时间处理大量文件信息,可以满足监管机构和媒体等特定群体对真假信息鉴别的需求。
无论是潞晨科技、中科闻歌、瑞莱智慧,还是华为、京东、中国移动、百川智能,这些企业通过不断探索与尝试,为后来者提供了宝贵的经验和可借鉴的路径,有效降低了后续跟进者的试错成本,加速了人工智能技术在各行业的渗透与应用进程。
3.创新者的破局
如果说2023年中国人工智能产业的关键词是“百模大战”,那么2024年中国人工智能产业的关键词一定是“应用落地”。
纵观中国的大模型和具身智能企业,2024上半年的成果可谓“百花齐放”:百度的文心大模型在能源、汽车、政务、交通、金融等十余个行业率先实现了落地;科大讯飞将大模型“搬上”了智能硬件,讯飞学习机、智能办公本、翻译机等产品的销量高速增长;通义大模型正在落地西安的机场、矿区和景区,企业培训、数字营销、跨境电商等场景都在基于通义大模型实现提效;微亿智造的AI外观质检机器已经在工厂替换了2000多名质检工人,在效率不比人差的同时,还能24小时运转……
尽管已经有企业在探索人工智能的落地实践,但这多是智能化投入时间长、资金实力强的大企业。这些企业不仅有较强的数字化基础,而且算力储备充足、训练数据完备、算法人才充裕,模型厂商也愿意为这些少数头部企业提供贴身驻场的定制化服务。
然而,市场上存在的更多是体量较小、智能化投入晚、起步慢、资金实力有限的中小企业,尽管它们也有做数字化转型的需求,但是由于控制成本、精力有限等原因的限制,导致模型厂商无暇顾及他们的需求。
缺算力、缺数据、缺算法人才的中小企业,真的就没办法搭上人工智能和大模型这趟列车了吗?
并非如此。中小企业不仅是创新和活力之源,更是我国民营经济的重要组成部分;他们所需要的,只是一个帮助他们做数字化转型和大模型落地的第三方。在美国,这个第三方往往是企业,而在中国,这个第三方是政府。
为了帮助中小企业在内的千行百业都能落地大模型、顺利进行数字化转型,海淀区在产业政策、关键要素供给、空间、资本、人才等方面共同发力,试图打造一个创新、开放、共享的人工智能产业生态:
在产业政策上,海淀区在2024年4月发布了《海淀区支持科技中小企业创新发展的若干措施》(“科技中小企业15条”),在技术创新、知识产权、企业落地、全球化、降低融资贷款成本等各方面给予了扶持,自2024年起,将每年设置专项资金,支持不少于500家中小企业,带动新增落地企业不少于100家,并根据实施情况不断调整优化。同时,海淀还提出了到2026年新增培育单项冠军、隐形冠军、独角兽和上市企业30家,专精特新“小巨人”企业200家、专精特新中小企业1500家,形成具有海淀特色的中小企业梯度集群,引导中小企业专精特新发展取得显著成效的目标;
在关键要素供给上,算力方面,海淀区正在积极打造北京人工智能公共算力平台,已向多家区内重点创新主体提供算力服务,计划到年底部署10000P算力;数据方面,海淀区正在积极推动北京人工智能模型语料中心建 设,现在已经有超过140个高质量数据集向大模型企业提供,同时还正在积极推 进北京数据基础制度先行区建设;
在空间上,海淀区规划了以中关村知春路、学院路以及周边39平方公里为核心区和引领区的中关村人工智能大模型产业集聚区,首批打造了五道口、北大西门、中关村西区、清华科技园4个特色产业园,建筑面积达67万平方米,主要聚焦核心技术研发、创新人才培养,完善创新生态等多个方面;目前,海淀坐拥108家国家级众创空间、24家国家级科技型企业孵化器、各类创业孵化机构总数达179家。其中的9家孵化器,获评北京首批标杆范例;
在资本上,在今年1月总规模为100亿的北京市人工智能产业投资基金的基础上,海淀区还推动设立了50亿元规模以人工智能为重点的科技成长二期基金,聚焦人工智能领域加大投资力度。
“目前,海淀区有人工智能企业大概1300家,覆盖了从算力层、工具层、模型层、应用层,整个产业链的环节,在海淀区通过国家网信办备案的57款大模型中,有43款大模型是属于垂类大模型,涉及到医疗、教育、交通等多个领域。海淀区还围绕着优势领域,积极布局人工智能的应用,已经开放了在教育、医疗、政务、文旅等多个公共领域的应用场景,并且发布了《具身智能、人工智能+教育三年行动方案》。此外,海淀区还与驻区的18家央企和大模型企业深度对接,推动大模型应用赋能产业升级。” 在大会上,中关村科学城管委会副主任、海淀区副区长唐超表示。
流水不争先,争的是滔滔不绝。在海淀区政府打造的创新生态下,即使是资源匮乏的中小企业,也能顺利搭上人工智能的快车,实现数字化转型与行业的提质增效。
新技术在催生新的产业变迁的同时,也会构建一个新的价值链,人工智能产业同样如此,从单点爆发到各行业的全方位突破,人工智能所创造的价值将是指数级的。从全国第一个AI大模型聚集区,到如今的“人工智能创新街区”、“人工智能产业高地”和“人工智能全景赋能第一城”,海淀一直在为人工智能产业的发展筑石铺路,人工智能也成为了海淀最亮眼的名片之一。
海淀人工智能新事,未完待续。
(封面图来源:海淀区)