Ryuki Ri's picture

6 1

Ryuki Ri

RyukiRi

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 21 minutes ago

Unifying Group-Relative and Self-Distillation Policy Optimization via Sample Routing

upvoted a paper 2 days ago

Group-in-Group Policy Optimization for LLM Agent Training

upvoted a paper 27 days ago

Revisiting On-Policy Distillation: Empirical Failure Modes and Simple Fixes

View all activity

Organizations

None yet

RyukiRi 's datasets

None public yet