☰

迈向AI 2.0 仰赖基础科研突破

热门话题

ChatGPT诞生已经多时，中国产学界竞相发展，为何中外高等院校难以首先诞生大模型，大陆同济大学电脑系副主任何良华教授兼认为，学界很难出现ChatGPT这样的模型，主要是算力和数据的问题。北京清华大学人工智慧研究院常务副院长孙茂松指出，中国乃至全球发展大模型，最终的突破关键，还是在基础科学的突破。

大陆《第一财经》报导，何良华8月24日在2023世界人工智慧大会（WAIC）青年优秀论文奖颁奖仪式暨青年科学家论坛上说，大模型非常吃算力，大学也难以去购买大量的算力。而有了算力之后，要把参数训练得比较成熟，需要海量的数据，但是学界是拿不到这么多数据。除了这两个问题，还和学界自身的需求有关。

「我们都期望在理论上做一些创新。比如我的学生如果跟我说现在需要几千张卡（算力）来做一个事情，我所有的经费给他也不够，课题也难以立项。因为它既不是应用，又不是理论，找不到这样一笔经费，研究只能中断。」

大陆科技部人工智慧发展研究中心5月底发布《中国人工智慧大模型地图研究报告》显示，当前大陆10亿参数规模以上的大模型已发布79个。

《第一财经》报导，不久前浦江基础科学发展论坛上，孙茂松教授指出，中国乃至全球发展大模型最终的突破关键，是基础科学的突破。

他说，对于大模型，当前的问题在于并不清楚OpenAI的机理是如何运作的，就连推出ChatGPT的OpenAI公司执行长阿特曼也表示，虽然做出了GPT，但也不清楚发生的原理，「实际上就是对这个机理还不清楚」。

孙茂松认为，现有的人工智慧模型已经能做到说话通顺，但这个问题的内在实现逻辑仍然十分复杂。如果弄清楚了大模型里的规律、ChatGPT背后的机理，就有可能克服现有人工智慧大模型的局限性，建立下一代人工智慧的理论和模型。

和团队率先在中国发布具备ChatGPT能力语言模型MOSS的复旦大学电脑学院教授邱锡鹏表示，大模型更顶尖的研究机构在业界，这是不可回避的事实。从DeepMind再到OpenAI，都是如此。美国很多著名大学，从研究实力上看，已经落后于这些顶级研究机构。

相关资讯