4.2亿！云天励飞开门红，中标湛江AI推理千卡集群项目

发布时间：2026.03.16

来源：云天励飞公众号

日前，联盟常务副主席陈宁旗下云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设项目。根据项目规划，公司将基于自研国产AI推理加速卡，参与建设AI推理算力集群，并推动DeepSeek等国产大模型在相关应用场景中的适配与部署，为政务和产业数字化应用提供算力基础设施支持。

面向大模型应用构建推理算力基础设施本次项目建设的AI推理算力集群将围绕大模型推理任务需求进行系统设计。

在大模型推理过程中，不同计算阶段对系统资源的需求存在差异。当前业界普遍采用“Prefill–Decode分离”的推理架构，通过针对不同阶段的资源配置优化，提高整体系统运行效率。

在该架构下，Prefill阶段主要负责长上下文理解和计算，对算力和带宽需求较高；Decode阶段则持续生成Token，对系统延迟更加敏感。项目建设过程中，将结合不同阶段的特点进行算力资源配置和系统优化。

同时，随着模型上下文长度不断增加，大量中间状态需要以KV Cache形式存储。围绕这一特点，项目在系统设计中对计算、存储与网络之间的协同进行了优化，以提升数据访问效率和整体系统性能。

在网络架构方面，系统将采用统一高速互联架构，通过400G光网络构建集群物理层网络，实现节点之间的高带宽、低延迟通信，并支持从单节点数十卡规模扩展至千卡级集群规模，以满足不同规模AI应用需求。项目整体建设完成后，将形成面向大模型推理任务的算力基础设施，为相关应用场景提供稳定的算力支撑。

持续推进AI推理芯片与算力系统技术研发根据项目规划，本次AI推理算力集群将分三期建设，并将采用云天励飞自研的国产AI推理加速卡。一期项目将部署云天励飞 X6000 推理加速卡；未来将率先搭载公司最新一代芯片产品。

在AI推理芯片研发方面，云天励飞正持续推进面向不同推理阶段的技术布局。根据公司战略规划，未来将逐步推出针对Prefill阶段优化的芯片产品，以及面向Decode阶段低延迟需求的推理芯片，并通过系统级协同优化进一步提升整体推理效率。其中，公司首款面向长上下文推理场景优化的Prefill芯片DeepVerse100预计将在年内完成流片，并计划在相关算力系统中开展部署。

在长期技术规划方面，公司提出“1001计划”，即以“百亿Token一分钱”为长期目标，通过芯片架构与算力系统协同优化，持续推动大模型推理成本下降。未来，公司将继续推进AI推理芯片相关技术研发，推动人工智能技术在更多行业中的普惠落地。

免责声明：凡本网注明“来源：XXX(非粤港澳大湾区企业家联盟官网)”的作品，均转载自其他媒体，目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

水滴保荣获“守护消费者金融安全优秀案例”奖

胡德兆委员2026两会行 | 产学研融合是锻造新质生产力的核心引擎

4.2亿！云天励飞开门红，中标湛江AI推理千卡集群项目