15 13

山田蒼

jwilson8

AI & ML interests

Research on LLM agents and evaluation.

Recent Activity

upvoted a paper 1 day ago

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

liked a model 2 days ago

tjarvis91/qovaryx-350m-scratch-base

upvoted a paper 3 days ago

OSCAR: Offline Spectral Covariance-Aware Rotation for 2-bit KV Cache Quantization

View all activity

Organizations

None yet

upvoted a paper 1 day ago

DelTA: Discriminative Token Credit Assignment for Reinforcement Learning from Verifiable Rewards

Paper • 2605.21467 • Published 5 days ago • 197

liked a model 2 days ago

tjarvis91/qovaryx-350m-scratch-base

Text Generation • Updated about 4 hours ago • 19 • 1

upvoted 2 papers 3 days ago

OSCAR: Offline Spectral Covariance-Aware Rotation for 2-bit KV Cache Quantization

Paper • 2605.17757 • Published 7 days ago • 62

StableVLA: Towards Robust Vision-Language-Action Models without Extra Data

Paper • 2605.18287 • Published 7 days ago • 15

liked a model 3 days ago

tencent/Hy-MT2-1.8B

Translation • 2B • Updated 3 days ago • 5.55k • • 693

liked a model 4 days ago

castdies/cn-1

Updated about 1 hour ago • 1

upvoted a paper 4 days ago

Anti-Self-Distillation for Reasoning RL via Pointwise Mutual Information

Paper • 2605.11609 • Published 13 days ago • 190

upvoted a paper 6 days ago

CiteVQA: Benchmarking Evidence Attribution for Trustworthy Document Intelligence

Paper • 2605.12882 • Published 12 days ago • 264

liked a dataset 7 days ago

wop/XXXXXL-chain-of-thought

Viewer • Updated 1 day ago • 14 • 255 • 4

upvoted a paper 10 days ago

WildClawBench: A Benchmark for Real-World, Long-Horizon Agent Evaluation

Paper • 2605.10912 • Published 14 days ago • 45

liked a dataset 11 days ago

nvidia/PhysicalAI-Autonomous-Vehicles

Updated 18 days ago • 170k • 884

upvoted a paper 11 days ago

Skill1: Unified Evolution of Skill-Augmented Agents via Reinforcement Learning

Paper • 2605.06130 • Published 18 days ago • 110

liked a model 14 days ago

SJun99/hanging_rubber_band_on_3_pillars_grootn1.5_070000

2B • Updated 14 days ago • 22 • 1

liked a dataset 18 days ago

PreSciencePreScience/PreScience

Viewer • Updated 18 days ago • 839k • 110 • 1

upvoted a paper 20 days ago

From Context to Skills: Can Language Models Learn from Context Skillfully?

Paper • 2604.27660 • Published 22 days ago • 162

liked a model 24 days ago

openai/clip-vit-base-patch32

Zero-Shot Image Classification • Updated Feb 29, 2024 • 21.8M • 940

upvoted 3 papers about 1 month ago

WorldMark: A Unified Benchmark Suite for Interactive Video World Models

Paper • 2604.21686 • Published Apr 23 • 36

Predicting integers from continuous parameters

Paper • 2602.10751 • Published Apr 13 • 3

LLaDA2.0-Uni: Unifying Multimodal Understanding and Generation with Diffusion Large Language Model

Paper • 2604.20796 • Published Apr 22 • 242

liked a model about 1 month ago

tencent/HY-Embodied-0.5

Image-Text-to-Text • 4B • Updated Apr 14 • 810 • 906

山田蒼

AI & ML interests

Recent Activity

Organizations

jwilson8's activity