Rohan Surana's picture

Rohan Surana

rohan2810

rohan2810

AI & ML interests

None yet

Recent Activity

authored a paper 2 days ago

MusiCRS: Benchmarking Audio-Centric Conversational Recommendation

authored a paper 2 days ago

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

authored a paper 2 days ago

F-GRPO: Factorized Group-Relative Policy Optimization for Unified Candidate Generation and Ranking

View all activity

Organizations

None yet

authored 4 papers 2 days ago

MusiCRS: Benchmarking Audio-Centric Conversational Recommendation

Paper • 2509.19469 • Published Sep 23, 2025

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Paper • 2605.02913 • Published Apr 8 • 9

F-GRPO: Factorized Group-Relative Policy Optimization for Unified Candidate Generation and Ranking

Paper • 2605.12995 • Published 8 days ago • 2

MASS-DPO: Multi-negative Active Sample Selection for Direct Policy Optimization

Paper • 2605.10784 • Published 10 days ago • 1

submitted a paper to Daily Papers 6 days ago

F-GRPO: Factorized Group-Relative Policy Optimization for Unified Candidate Generation and Ranking

Paper • 2605.12995 • Published 8 days ago • 2

submitted a paper to Daily Papers 14 days ago

Generate, Filter, Control, Replay: A Comprehensive Survey of Rollout Strategies for LLM Reinforcement Learning

Paper • 2605.02913 • Published Apr 8 • 9

authored a paper 8 months ago

In-context Ranking Preference Optimization

Paper • 2504.15477 • Published Apr 21, 2025