国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时
摘要
快科技4月10日消息,3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus4.6只低了2.6分。前两天GL......
快科技4月10日消息,3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球
前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在
除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能力,还在长程任务(Long-HorizonTask)上取得突破,实现了:
8小时从零构建Linux桌面
655次迭代打破向量数据库优化瓶颈
1000轮工具调用优化真实机器学习模型负载
值得一提的是,在METR榜单的同等评估标准下,GLM-5.1是
此前智谱提到,GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。
在最接近真实软件开发的SWE-benchPro基准测试中,GLM-5.1刷新全球
