新创GeNopsys为AI资料中心打造高效能 低耗能全光交换网路系统
阳明交大杨启瑞教授与田伯隆教授之新创GeNopsys研发团队于OCP 2023 正式发表DOVINSY系统。图/业者提供
AI爆炸性的发展促成了新一代的工业革命,并在资料中心领域掀起了一波波的技术改革浪潮。AI模型超乎常态的急速增长伴随着极其庞大的计算资料量及伺服器间资料交换量,对现存的处理器和网路系统技术造成了前所未有的冲击和挑战。当众多研发目光专注于提供强大的伺服器(CPU, GPU)之余,在2023年OCP (Open Compute Project) 高峰会中多个重量级公司(Google, Marvell, Broadcom, Nvidia…)异口同声指出,作为提供大量伺服器互联并交换资料的网路系统俨然成为新的严重贫颈 (The network is new bottleneck)。”The network is the computer”不再只是口号,而是AI发展迫在眉睫待解决的关键技术。
今年甫从国立阳明交通大学退休的杨启瑞教授、以及电机工程系田伯隆教授于今年创办了美商公司GeNopsys Technologies, Inc. (台湾分公司-美商构光科技股份有限公司) https://genopsys-tech.com. 该公司以累积超过20年的研发经验投入在光交换网路系统,并于2023 OCP发表了领先国际的结合SDN智慧控制的DWDM全光交换资料中心网路系统- DOVINSY。该全光交换网路系统突破传统电交换系统的限制,具备超低能耗、超低延迟、以及极大频宽且高扩充性等绝对优势,为要求低延迟及高传输频宽的AI资料中心提供绝佳的网路解决方案。
目前市场上提供AI资料中心网路有两个主要方案: 传统Ethernet及NVIDIA/Infiniband。传统Ethernet 存在负载不平衡,以及流量壅塞的效能问题。而infiniBand网路利用更强的CPU/DPU虽然延迟低,但属特殊规格无法与通用网路相容,而且比Ethernet更为耗电,价格非常昂贵。GeNopsys团队在2015年即发觉Ethernet网路的效能问题会产生极大的延迟(tail latency),严重影响HPC此类需求高度平行运算应用的效能。因此团队开始将研发多年的光交换网路技术引入资料中心。2017年并获得台达电公司的资金挹注进行5年的大型产学合作计划。且于2019年时成功完成国际第一套结合光、电、软体、韧体及智慧控制技术垂直整合的创新光交换网路系统雏型系统,OPTUNS。该系统并在OCP 2019以及OFC 2019向国际发表,获得产业界大量的关注。历经了COVID期间持续的精进和研发,GeNopsys团队在2023年获得国内外等多方单位的投资成立新创公司。并在短短九个月内成功研发全新的光交换网路系统DOVINSY,具备更高频宽(每个DWDM波长100G),扩充性更大(架构可支援500-700个机柜),并同样达到极低传输延迟(< 10us)及高度节能( 节省 85%电力消耗),以更符合目前AI资料中心的需求。其效能远超越市场上电交换的网路系统。目前系统的软硬体开发和测试已经完成,并开始要进入商用测试阶段。预计一年后可进行产品销售。
创办人杨教授三十多年前从世界网路技术先驱的美国Bell Labs 回到母校国立阳明交通大学,持续贡献所学并深耕在网路技术的研发,特别在后面20多年与共同创办人田伯隆教授全力投入在光通讯网路领域。并坚持所有研究都要建构实际的雏型系统, 发掘理论所看不到的关键问题。国立阳明交通大学拥有非常自由且宏观的学术风气,并积极提供各项丰沛的资源,才能让该团队能够累积宝贵的研发能量,并和产业界进行密切的实质合作,奠定了该新创公司的雄厚基础。而台达电公司深具远见及研发资金的奥援也是该公司成立的一大助力。此产学合作的案例是将学术研发转化成实质产品极为成功的范例。