找回密码
 立即注册
搜索

百度智能云打造国产算力基础设施

admin 2026-4-11 05:09 33人围观 话题

# 话题
智谱正式开源新一代大模型GLM5.1。作为智谱GLM系列的最新力作,GLM-5.1的整体能力得到了全面提升。尤其在代码能力上:在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1超过GPT-5.4、Claude Opus4.6,刷新全球 ...
 智谱正式开源新一代大模型GLM5.1。作为智谱GLM系列的最新力作,GLM-5.1的整体能力得到了全面提升。尤其在代码能力上:在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1超过GPT-5.4、Claude Opus4.6,刷新全球最佳成绩。此外,GLM-5.1还在长程任务(Long Horizon Task)处理能力上实现了显著突破,有别于当前以分钟级交互为主的模型,GLM-5.1可在单次任务中持续、自主地工作长达8小时,凭借自主规划、执行与迭代进化,最终交付完整的工程级成果。

百度百舸基于昆仑芯硬件平台第一时间完成了GLM-5.1的模型适配与集群部署,助力最新开源大模型快速投入生产环境的大规模应用。

百度百舸基于Prefill-Decode分离架构,使用CP(Context Parallelism)上下文并行策略有效降低128K以上序列的计算负载和显存压力,从而使得GLM-5.1能够更好的支撑AI Agent、Coding场景的长上下文与高并发需求。

目前,百度百舸与昆仑芯已具备「极速模型适配-全链路性能提升-高效规模化部署-超大规模集群落地」的完备能力。

极速模型适配

为实现高性能模型的快速开发与适配,百度百舸联合昆仑芯开发了vLLM-Kunlun Plugin,将vLLM社区版与昆仑芯XPU后端完全解耦。用户通过vLLM-Kunlun Plugin,快速适配主流开源模型。

依托CUDA-like特性,vLLM-Kunlun Plugin在软件层面「抹平」了硬件差异,使开发者能够像使用通用GPU一样便捷地使用昆仑芯。同时,vLLM-Playground已全面支持昆仑芯,即便是初学者也能通过直观的Web UI一键完成模型配置与推理。

在适配效率上,基于昆仑芯成熟的高性能算子库,针对无新增算子的新模型(如从GLM-5.0版本迭代至GLM-5.1)可实现Day0极速适配,针对有新增算子的新模型,也可在极短时间内完成新算子的开发与模型适配。再配合torch_xray精度对齐工具与PyTorch Profiler性能分析工具,百度百舸为模型跑对与性能表现提供了全方位保障。
精彩评论0
我有话说......
相关推荐