TIANYI's picture

TIANYI

BIMU233

·

http://bimu.site

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

Conditional Equivalence of DPO and RLHF: Implicit Assumption, Failure Modes, and Provable Alignment

upvoted a paper 14 days ago

Continuous Latent Diffusion Language Model

upvoted a paper 15 days ago

Anchored Policy Optimization: Mitigating Exploration Collapse Via Support-Constrained Rectification

View all activity

Organizations

None yet

authored a paper about 1 month ago

SPPO: Sequence-Level PPO for Long-Horizon Reasoning Tasks

Paper • 2604.08865 • Published Apr 10 • 29