来源:云天励飞公众号
日前,联盟常务副主席陈宁旗下云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目。根据项目规划,公司将基于自研国产AI推理加速卡,参与建设AI推理算力集群,并推动DeepSeek等国产大模型在相关应用场景中的适配与部署,为政务和产业数字化应用提供算力基础设施支持。
面向大模型应用构建推理算力基础设施本次项目建设的AI推理算力集群将围绕大模型推理任务需求进行系统设计。
在大模型推理过程中,不同计算阶段对系统资源的需求存在差异。当前业界普遍采用“Prefill–Decode分离”的推理架构,通过针对不同阶段的资源配置优化,提高整体系统运行效率。
在该架构下,Prefill阶段主要负责长上下文理解和计算,对算力和带宽需求较高;Decode阶段则持续生成Token,对系统延迟更加敏感。项目建设过程中,将结合不同阶段的特点进行算力资源配置和系统优化。
同时,随着模型上下文长度不断增加,大量中间状态需要以KV Cache形式存储。围绕这一特点,项目在系统设计中对计算、存储与网络之间的协同进行了优化,以提升数据访问效率和整体系统性能。
在网络架构方面,系统将采用统一高速互联架构,通过400G光网络构建集群物理层网络,实现节点之间的高带宽、低延迟通信,并支持从单节点数十卡规模扩展至千卡级集群规模,以满足不同规模AI应用需求。项目整体建设完成后,将形成面向大模型推理任务的算力基础设施,为相关应用场景提供稳定的算力支撑。
持续推进AI推理芯片与算力系统技术研发根据项目规划,本次AI推理算力集群将分三期建设,并将采用云天励飞自研的国产AI推理加速卡。一期项目将部署云天励飞 X6000 推理加速卡;未来将率先搭载公司最新一代芯片产品。
在AI推理芯片研发方面,云天励飞正持续推进面向不同推理阶段的技术布局。根据公司战略规划,未来将逐步推出针对Prefill阶段优化的芯片产品,以及面向Decode阶段低延迟需求的推理芯片,并通过系统级协同优化进一步提升整体推理效率。其中,公司首款面向长上下文推理场景优化的Prefill芯片DeepVerse100预计将在年内完成流片,并计划在相关算力系统中开展部署。
在长期技术规划方面,公司提出“1001计划”,即以“百亿Token一分钱”为长期目标,通过芯片架构与算力系统协同优化,持续推动大模型推理成本下降。未来,公司将继续推进AI推理芯片相关技术研发,推动人工智能技术在更多行业中的普惠落地。
免责声明:凡本网注明“来源:XXX(非粤港澳大湾区企业家联盟官网)”的作品,均转载自其他媒体,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
