VenomRose-Juri

Fu Xiaoliang VenomRose-Juri

Research Interests: Reinforcement Learning in LLMs and VLMs (Reasoning, Multi-turn RL, Agentic RL).

Achievements

MASPO-RL MASPO-RL Public

Mass-Adaptive Soft Policy Optimization (MASPO) - Official Implementation

Python 55
DGPO-RL DGPO-RL Public

Decoupled Gradient Policy Optimization (DGPO) - Official Implementation

Python 46
GithubX-F/DynaMO-RL GithubX-F/DynaMO-RL Public

Dynamic Rollout Allocation and Advantage Modulation for Policy Optimization (DynaMO) - Official Implementation

Python 85 2
GithubX-F/ProxMO-RL GithubX-F/ProxMO-RL Public

Proximity-based Multi-turn Optimization (ProxMO) - Official Implementation

Python 57 2