HF Papers

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

2026-06-12

SpatialClaw: Rethinking Action Interface for Agentic Spatial Reasoning

SpatialClaw: Rethinking Action Interface for Agentic Spatial Reasoning

2026-06-12

MiniMax Sparse Attention

MiniMax Sparse Attention

2026-06-12

InterleaveThinker: Reinforcing Agentic Interleaved Generation

InterleaveThinker: Reinforcing Agentic Interleaved Generation

2026-06-12

FORT-Searcher: Synthesizing Shortcut-Resistant Search Tasks for Training Deep Search Agents

FORT-Searcher: Synthesizing Shortcut-Resistant Search Tasks for Training Deep Search Agents

2026-06-12

Robust-U1: Can MLLMs Self-Recover Corrupted Visual Content for Robust Understanding?

Robust-U1: Can MLLMs Self-Recover Corrupted Visual Content for Robust Understanding?

2026-06-12

MaxProof: Scaling Mathematical Proof with Generative-Verifier RL and Population-Level Test-Time Scaling

MaxProof: Scaling Mathematical Proof with Generative-Verifier RL and Population-Level Test-Time Scaling

2026-06-12

WeaveBench: A Long-Horizon, Real-World Benchmark for Computer-Use Agents with Hybrid Interfaces

WeaveBench: A Long-Horizon, Real-World Benchmark for Computer-Use Agents with Hybrid Interfaces

2026-06-12

LabVLA: Grounding Vision-Language-Action Models in Scientific Laboratories

LabVLA: Grounding Vision-Language-Action Models in Scientific Laboratories

2026-06-12

HYDRA-X: Native Unified Multimodal Models with Holistic Visual Tokenizers

HYDRA-X: Native Unified Multimodal Models with Holistic Visual Tokenizers

2026-06-12

N-GRPO: Embedding-Level Neighbor Mixing for Enhanced Policy Optimization

N-GRPO: Embedding-Level Neighbor Mixing for Enhanced Policy Optimization

2026-06-12

EurekAgent: Agent Environment Engineering is All You Need For Autonomous Scientific Discovery

EurekAgent: Agent Environment Engineering is All You Need For Autonomous Scientific Discovery

2026-06-12

Demystifying Hidden-State Recurrence: Switchable Latent Reasoning with On-Policy Reinforcement Learning

Demystifying Hidden-State Recurrence: Switchable Latent Reasoning with On-Policy Reinforcement Learning

2026-06-12

VideoMDM: Towards 3D Human Motion Generation From 2D Supervision

VideoMDM: Towards 3D Human Motion Generation From 2D Supervision

2026-06-12

Where, What, Why, and Importance: Structured Defect Grounding for Text-to-Image Feedback

Where, What, Why, and Importance: Structured Defect Grounding for Text-to-Image Feedback

2026-06-12

VIA-SD: Verification via Intra-Model Routing for Speculative Decoding

VIA-SD: Verification via Intra-Model Routing for Speculative Decoding

2026-06-12

MoVerse: Real-Time Video World Modeling with Panoramic Gaussian Scaffold

MoVerse: Real-Time Video World Modeling with Panoramic Gaussian Scaffold

2026-06-12

From 2D Grids to 1D Tokens: Reforming Shared Representations for Multimodal Image Fusion

From 2D Grids to 1D Tokens: Reforming Shared Representations for Multimodal Image Fusion

2026-06-12

TreeSeeker: Tree-Structured Trial, Error, and Return in Deep Search

TreeSeeker: Tree-Structured Trial, Error, and Return in Deep Search

2026-06-12

HarnessBridge: Learnable Bidirectional Controller for LLM Agent Harness

HarnessBridge: Learnable Bidirectional Controller for LLM Agent Harness

2026-06-12