大模型带来了巨大的AI算力需求✿ღღ,同时也对传统以CPU为中心的计算机架构(ACC)提出了前所未有的挑战✿ღღ。早在今年2月✿ღღ,致力于计算机体系结构创新的容芯致远就首次提出了以GPU为中心重新设计AI计算机系统✿ღღ,打破传统AI计算面临成本✿ღღ、效率✿ღღ、灵活性的“不可能三角”难题✿ღღ,引发业界关注✿ღღ。
5月9日拉斯维加斯网站✿ღღ,容芯致远联合中国开放指令生态(RISC-V)联盟在北京宣布成立RISC-V国产智算体系结构创新专业组✿ღღ,现场300多人参与会议✿ღღ。容芯致远一举发布5款采用AGC架构设计的智算新品✿ღღ,从支持双卡到支持20卡不等✿ღღ,成为全球首家单机全面适配DeepSeek各模型尺寸产品的企业✿ღღ。
其中✿ღღ,入门级的K2支持双卡✿ღღ,体积小巧✿ღღ、超静音(噪音低于55分贝)✿ღღ,预置DeepSeek 32B模型服务✿ღღ、推理环境及RAG环境✿ღღ,非常适合办公场景部署✿ღღ;旗舰级的K20单机可支持20卡✿ღღ,通过创新的张量并行技术✿ღღ,完美运行满血版 DeepSeek 671B全量模型✿ღღ。较于传统方案则需要4台8卡机器组网✿ღღ,技术复杂拉斯维加斯网站✿ღღ、成本高✿ღღ、运维难度大✿ღღ。K20基于独立全信创体系拉斯维加斯网站✿ღღ,支持国内外多种形态的GPU算力卡及主流CPU处理器✿ღღ,同时适配DeepSeek✿ღღ、Qwen✿ღღ、LLama✿ღღ、ChatGLM等国内外主流开源AI大模型✿ღღ。
容芯致远CTO石旭在主题报告中分享了K20背后的架构创新理念与核心技术✿ღღ。他谈到✿ღღ,芯片✿ღღ、系统和软件是计算机体系结构的三大关键要素✿ღღ。只有在体系结构层面进行高维度的创新✿ღღ,才能打破成本✿ღღ、效率✿ღღ、灵活性“不可能三角”的魔咒✿ღღ,让GPU发挥更大算力效率✿ღღ,同时更具成本优势和灵活的适应性✿ღღ。
在高性能计算(HPC)✿ღღ、大模型训练/推理等场景应用中✿ღღ,与CPU相比✿ღღ,GPU作为核心加速计算部件✿ღღ,具有功耗更高✿ღღ、运行温度更高✿ღღ、故障率更高等“三高”特征✿ღღ,进而对GPU算力卡的生产级可用性✿ღღ、运维便捷性✿ღღ、使用寿命构成严重挑战✿ღღ。有数据表明✿ღღ,某国外著名GPU在非7X24小时使用情况下的故障率为1-3%✿ღღ,在高负荷场景下故障率高达5-8%✿ღღ。由于长期处于高温高能耗状态✿ღღ,GPU的平均寿命仅有1-3年✿ღღ。对普通架构智算整机而言✿ღღ,单卡故障会直接导致整机停止服务✿ღღ,恢复时间需2小时以上✿ღღ。
针对上述挑战✿ღღ,容芯致远技术团队另辟蹊径✿ღღ,立足AGC架构设计理念✿ღღ,实现了全球首创的GPU热插拔✿ღღ、GPU-RAID高可用✿ღღ、GPU节能延寿等三大技术突破✿ღღ。通过GPU Box设计✿ღღ,更换GPU卡就像换硬盘一样简单✿ღღ,运维时间从至少2小时缩短到1分钟✿ღღ,极致提升运维效率人族无敌3✿ღღ,保障业务连续性✿ღღ;通过GPU-RAID技术✿ღღ,类似磁盘阵列的冗余设计✿ღღ,使单机可用性从传统架构的85%跃升至99.99%✿ღღ,极大提升生产环境下智算系统的SLA服务水平✿ღღ;通过GPU算力卡单点电源管理技术✿ღღ,构建细粒度能耗管理体系✿ღღ,让GPU在非工作时段由系统自启休眠模式✿ღღ,降低功耗和电费✿ღღ,并有效延长GPU卡的使用寿命✿ღღ。另外✿ღღ,通过单张GPU算力卡与100G至400G网卡绑定技术(不占用CPU性能)✿ღღ,实现单机2T至8T通信墙✿ღღ,支撑构建万卡矩阵组网✿ღღ。
容芯致远提出的AGC架构与技术突破✿ღღ,已经获得多家上下游伙伴与企业用户的认可拉斯维加斯网站✿ღღ。来自航天联志✿ღღ、燧原科技✿ღღ、信者科技的嘉宾分别介绍了与容芯致远的合作成果✿ღღ。其中✿ღღ,航天联志基于容芯致远技术的通算/智算系列产品✿ღღ,已经在油田人族无敌3✿ღღ、政务✿ღღ、涉密部门实现部署应用✿ღღ;燧原科技表示对于燧原S60的容芯致远一体机DeepSeek 671B满血版✿ღღ,经优化测试后获得了极好的综合性能✿ღღ,相较于ACC结构✿ღღ,节省了50%的硬件资源✿ღღ;信者科技不仅将容芯致远的AGC智算方案引入某重点双一流高校场景✿ღღ,还推出了基于超融合DAU数据处理器加速卡的信创服务器方案✿ღღ,提升IO性能3-10倍拉斯维加斯网站✿ღღ,降低硬件投资及运营成本50%以上✿ღღ。
为进一步推广AGC架构✿ღღ,吸引更多企业进行协同创新✿ღღ,容芯致远选择将所有知识产权面向CPU✿ღღ、GPU✿ღღ、整机厂商以及RISC-V联盟成员单位进行开放✿ღღ、共享✿ღღ。在此次会议上✿ღღ,RISC-V联盟国产智算体系结构创新专业组也宣告成立✿ღღ,成为该联盟旗下七大专业组之一✿ღღ。
在全球RISC-V生态高速发展✿ღღ、RISC-V高性能处理器不断取得技术突破的态势之下✿ღღ,RISC-V+AI正成为新的产业共识✿ღღ,有望为AI推理算力市场带来新的组合方案✿ღღ。在这一背景下✿ღღ,基于RISC-V的国产化智算体系架构创新机会巨大✿ღღ,国产智算创新体系专业组的成立可谓恰逢其时人族无敌3✿ღღ。中国开放指令生态(RISC-V)联盟秘书长包云岗在致辞中对专业组提出了三点期望✿ღღ:一是坚持开源开放✿ღღ,秉承RISC-V初心✿ღღ,推动技术共享和协作创新✿ღღ,二是聚焦国产智算✿ღღ,结合中国市场需求✿ღღ,打造真正可自主演进的解决方案✿ღღ,三是汇聚行业力量✿ღღ,联合产学研各界共同构建繁荣的RISC-V生态体系✿ღღ。
目前✿ღღ,国产智算体系结构创新专业组首批共有15家成员单位加入✿ღღ,由北京中科彼岸集成电路科技有限公司和北京容芯致远科技有限公司共同发起创立✿ღღ,由天津信创海河实验室✿ღღ、超睿科技(上海)有限公司拉斯维加斯网站✿ღღ、兆松科技(武汉)有限公司担任副组长单位✿ღღ。其他十余家委员单位涵盖RISC-V芯片✿ღღ、GPU✿ღღ、整机✿ღღ、软件等全产业链✿ღღ。
根据规划✿ღღ,专业组一方面致力于中国的智算技术体系研究✿ღღ,秉持着开放人族无敌3✿ღღ、开源✿ღღ、创新✿ღღ、共享的合作理念人族无敌3✿ღღ,深入开展技术研究工作✿ღღ,挖掘RISC-V技术在智算领域的深度潜力✿ღღ,形成和输出技术标准制定与规范✿ღღ,不断推动体系结构的创新✿ღღ;另一方面✿ღღ,致力于中国智算生态发展✿ღღ,以提升国产智算生态链的整体能力为己任人族无敌3✿ღღ,全力推动国产智算技术与产业的茁壮成长✿ღღ,打造优质的国产智算系统生态✿ღღ。
石旭在演讲中也谈到✿ღღ,未来还有很多体系结构方面的技术需要协同专业组一起协作解决,比如部件级芯片级高速传输技术✿ღღ、国产开源人工智能框架等✿ღღ。目前联盟内部已经启动“延安开源框架”研发项目✿ღღ,将全方位支持国产GPU✿ღღ,着力解决GPU深度优化✿ღღ、全局缓存共享✿ღღ、全链路优化✿ღღ、大模型安全✿ღღ、训推效率提升等5个方面的问题✿ღღ。
在圆桌论坛环节✿ღღ,RISC-V副秘书长张松就国产AI发展和七位行业专家展开深度对话✿ღღ,容芯致远首席科学家张彦朝指出✿ღღ:“AGC架构已在国内多个重点行业验证✿ღღ,推理效率提升3倍以上✿ღღ。”兆松科技CEO范泽分享✿ღღ:“我们开发的RISC-V专用编译器可将CUDA迁移损耗控制在15%以内✿ღღ。”信创海河实验室主任王涛强调✿ღღ:“要通过开源协作突破技术壁垒✿ღღ,构建自主可控的AI生态✿ღღ。”
在本次行业盛会上✿ღღ,年轻的容芯致远公司以其突破性的技术让大家为之震撼✿ღღ。公司研发的智能计算解决方案凭借创新架构和卓越性能拉斯维加斯网站拉斯维加斯网站✿ღღ,赢得了与会专家的高度评价✿ღღ。一位资深IT专家现场题写对联“小公司✿ღღ,开大会✿ღღ,彰显创新力量✿ღღ;新技术✿ღღ,破旧局✿ღღ,科技引领未来”✿ღღ,生动诠释了这家新兴企业的创新力量✿ღღ。在日趋激烈的全球AI竞赛中✿ღღ,这样的创新力量将为中国智算架构实现跨越式发展注入强劲动能✿ღღ,推动中国AI技术走向世界前沿✿ღღ。