项目动态 | 庭宇科技Agentic Lybic 以57.1%成功率问鼎OSWorld基准测试2025年9月9日,庭宇科技Agentic Lybic 在全球权威的OSWorld基准测试中,以57.1%的任务成功率(1次运行,最大步数50步)荣登榜首。 这一成绩标志着庭宇科技在复杂计算机操作任务(涵盖网页浏览、桌面操作、多应用协调等)的理解与执行上,已展现出接近人类水平的智能体行为,成为该测评当前公开榜单的最高纪录。 ![]() ![]() (所有任务均通过独立校验脚本验证) 这次成绩不仅是对我们技术路线的肯定,也是对 Agentic AI 在真实世界中应用的一次重要验证。OSWorld被视为“Computer Use”赛道最权威、最难刷分的测评平台,其特点在于:
正因如此,它已被OpenAI、Anthropic、字节跳动等头部机构广泛采用。 为推动GUI智能体技术的整体发展,庭宇科技决定将Agentic Lybic的核心代码重新整理并开源,其坚信开源生态是加速技术创新的最佳催化剂,公司诚挚邀请全球开发者共同参与,优化核心算法、适配新应用场景、完善评测基准,共同构建下一代人机交互的未来。 庭宇科技是一家专门从事边缘计算云服务的科技型企业,公司拥有自主研发的弹性融合分布式边缘计算网络及海量高质量边缘节点构建的云平台。主营业务为客户提供 高性能、高可靠、高弹性、低成本 的云计算、内容分发、实时互动音视频,解决了客户为重资产算力及云交互研发投入成本过高的难题。 庭宇科技专注构建 AI Agent 基础设施平台 Lybic,聚焦前沿应用,集类人化操作能力、秒级高并发响应、零侵入便捷部署于一体,赋能 AI Agent 规模化落地。 ![]() ![]() ![]() 本文内容来源于公众号庭宇科技(ID:tingyu-keji),内容略有删改,如有侵权,请联系我们予以删除。 |