目前想通过对 verl 项目做贡献来做为以后的项目经历,可以贡献的地方:

  1. 将多轮 RL 引入到 vllm,目前只有 sglang 支持多轮 RL
  2. 建立一个 tiny-verl 仓库,抽离 verl 的核心逻辑,提供学习。