1 60 8

Tom Lu

eigentom

https://eigentom.github.io

EigenTom

AI & ML interests

MLLM, Generative AI, Agentic RL

Recent Activity

upvoted a paper 1 day ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

upvoted a paper 22 days ago

WorldReasonBench: Human-Aligned Stress Testing of Video Generators as Future World-State Predictors

authored a paper 25 days ago

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

View all activity

Organizations

upvoted a paper 1 day ago

Masking Stale Observations Helps Search Agents -- Until It Doesn't: A Regime Map and Its Mechanism

Paper • 2606.00408 • Published 7 days ago • 57

upvoted a paper 22 days ago

WorldReasonBench: Human-Aligned Stress Testing of Video Generators as Future World-State Predictors

Paper • 2605.10434 • Published 25 days ago • 29

authored a paper 25 days ago

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Paper • 2605.05242 • Published May 3 • 120

upvoted a paper 27 days ago

Beyond Semantic Similarity: Rethinking Retrieval for Agentic Search via Direct Corpus Interaction

Paper • 2605.05242 • Published May 3 • 120

liked a dataset about 1 month ago

SII-GAIR-NLP/davinci-llm-data

Viewer • Updated Apr 16 • 1.25M • 931 • 13

upvoted 2 papers about 2 months ago

Lyra 2.0: Explorable Generative 3D Worlds

Paper • 2604.13036 • Published Apr 14 • 41

MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents

Paper • 2601.12346 • Published Jan 18 • 52

updated a Space about 2 months ago

Reviewgrounder Demo

💻

Generate an AI-powered review for any research paper PDF

authored 4 papers about 2 months ago

RSVP: Reasoning Segmentation via Visual Prompting and Multi-modal Chain-of-Thought

Paper • 2506.04277 • Published Jun 4, 2025

VEU-Bench: Towards Comprehensive Understanding of Video Editing

Paper • 2504.17828 • Published Apr 24, 2025

SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding

Paper • 2603.16124 • Published Mar 17 • 3

ClawBench: Can AI Agents Complete Everyday Online Tasks?

Paper • 2604.08523 • Published Apr 9 • 263

upvoted 4 papers about 2 months ago

Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding

Paper • 2604.05015 • Published Apr 6 • 236

Watch Before You Answer: Learning from Visually Grounded Post-Training

Paper • 2604.05117 • Published Apr 6 • 36

ClawBench: Can AI Agents Complete Everyday Online Tasks?

Paper • 2604.08523 • Published Apr 9 • 263

SWE-QA-Pro: A Representative Benchmark and Scalable Training Recipe for Repository-Level Code Understanding

Paper • 2603.16124 • Published Mar 17 • 3

upvoted a paper 2 months ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published Mar 17 • 98

upvoted a paper 3 months ago

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published Mar 15 • 429

liked a dataset 4 months ago

mikronai/VectorEdits

Viewer • Updated Feb 28 • 271k • 794 • 7

published a Space 4 months ago

Reviewgrounder Demo

💻

Generate an AI-powered review for any research paper PDF

Tom Lu

AI & ML interests

Recent Activity

Organizations

eigentom's activity

Reviewgrounder Demo

Reviewgrounder Demo