Shangzhe Li's picture

1 1

Shangzhe Li

DVA13304

https://tobyleelsz.github.io/

AI & ML interests

Reinforcement Learning, Imitation Learning, Learning Theory

Organizations

None yet

models 2

DVA13304/Qwen-2.5-0.5B-Base

Updated Jan 4 • 3

DVA13304/Qwen-2.5-3B-Teacher

Updated Jan 4 • 1

datasets 1

DVA13304/Qwen-2.5-3B-Bellman

Updated Jan 4 • 7