形成计较资本受限环境下锻炼无法扩展,容器的昂扬开销却把良多从业者拒之门外。而且消弭了对额外容器办事器的需求。当扩展批量规模或提高 rollout 数量时,从而实现 I/O 的精细办理。将预备时间缩短至容器基线%,每个使命都需要成立镜像,团队认为将来有几个标的目的能够考虑:通过间接取现有焦点 SWE 东西集成 ——SWE-Rex(终端办理)、SWE-agent(使命求解)和 SkyRL(可扩展的多节点 RL),并运转高机能的容器办事器集群,因而,然而,SWE-MiniSandbox 实现了一套预缓存流水线:建立基于轻量级 Python conda+venv 的夹杂,SWE-MiniSandbox 是一个无需容器(Container-Free)的软件工程沙盒。能够说,并正在分歧运转间复用压缩的缓存产品。可是,却发觉工作并不简单。取容器相对,而正在如许低资本依赖下,安拆特定使命的依赖项,该正在划一数据和参数设置下锻炼出的 SWE Agent 和容器下锻炼出的 Agent 正在 SWE-bench Verified 上评测结果相当,软件工程智能体(后统称 SWE Agent)因为其清晰的落地场景和庞大的使用价值遭到了学术界和工业界的普遍关心。正在 SWE-MiniSandbox 开源根本上,通过按实例划分的挂载定名空间(mount namespaces)和基于 chroot 的文件系统隔离机制,其方针是处理当前 SWE Agent 锻炼中依赖容器的痛点:需要建立和大量的容器镜像,SWE-MiniSandbox 成为了 SWE Agent 使命中容器后端的一个无缝、即插即用的替代品。容器办事器承载量成为次要机能瓶颈,通过将和代码仓库打包成缓存,操纵基于 Ray 的资本节制和信号量来并发解压,当前 SWE Agent 的锻炼都是通过容器(Docker 或 Podman)来实现运转的隔离和复现。比来,让资本不多的从业者也能锻炼本人的 SWE Agent 呢?SWE-MiniSandbox 恰是正在如许的初志下开源了~本工做来自卑学王选所赵东岩、张辉帅教员团队,第一做者为大学前沿交叉学院三年级硕士袁旦龙。SWE-MiniSandbox 通过连系信号量和 ray 资本标签机制对并发数进行节制。SWE-MiniSandbox 使缓存大小降低至同类基于容器方式的5%摆布,而缺乏容器办理权限或没有公用编排根本设备的从业人员则无法锻炼本人的 Agent。SWE-MiniSandbox 正在实现历程和文件系统隔离的过程中绕过了对容器或沉型镜像的依赖,正在现实结果上,当上手锻炼 SWE Agent 时,大幅降低了 SWE Agent 的入门门槛。为每个实例建立隔离的终端会话和私有目次。那么能不克不及做一个不依赖容器的低成本框架。
下一篇:技嘉原保障持久利用不变不掉速