Yifeng Liu's picture

Yifeng Liu

lyf07

·

AI & ML interests

None yet

Organizations

None yet

submitted a paper to Daily Papers 3 months ago

Mending the Holes: Mitigating Reward Hacking in Reinforcement Learning for Multilingual Translation

Paper • 2603.13045 • Published Mar 13 • 2

authored 2 papers 3 months ago

R-PRM: Reasoning-Driven Process Reward Modeling

Paper • 2503.21295 • Published Mar 27, 2025

Mending the Holes: Mitigating Reward Hacking in Reinforcement Learning for Multilingual Translation

Paper • 2603.13045 • Published Mar 13 • 2