slime:一个专注于大规模强化学习扩展的LLM后训练框架,助力高效训练和灵活数据生成。
高性能训练,通过连接Megatron与SGLang实现高效多模式训练;灵活的数据生成工作流,支持自定义数据生成接口和服务器引擎;提供GLM4-9B和Qwen3-4B模型示例,方便快速上手。
高性能训练,通过连接Megatron与SGLang实现高效多模式训练;灵活的数据生成工作流,支持自定义数据生成接口和服务器引擎;提供GLM4-9B和Qwen3-4B模型示例,方便快速上手。
消息来源频道
@HardcoreOpenAI
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!