HF Papers

LongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced Colleagues

LongMemEval-V2: Evaluating Long-Term Agent Memory Toward Experienced Colleagues

2026-05-13

Reward Hacking in Rubric-Based Reinforcement Learning

Reward Hacking in Rubric-Based Reinforcement Learning

2026-05-13

LychSim: A Controllable and Interactive Simulation Framework for Vision Research

LychSim: A Controllable and Interactive Simulation Framework for Vision Research

2026-05-13

UniPath: Adaptive Coordination of Understanding and Generation for Unified Multimodal Reasoning

UniPath: Adaptive Coordination of Understanding and Generation for Unified Multimodal Reasoning

2026-05-13

WildRelight: A Real-World Benchmark and Physics-Guided Adaptation for Single-Image Relighting

WildRelight: A Real-World Benchmark and Physics-Guided Adaptation for Single-Image Relighting

2026-05-13

VidSplat: Gaussian Splatting Reconstruction with Geometry-Guided Video Diffusion Priors

VidSplat: Gaussian Splatting Reconstruction with Geometry-Guided Video Diffusion Priors

2026-05-13

Images in Sentences: Scaling Interleaved Instructions for Unified Visual Generation

Images in Sentences: Scaling Interleaved Instructions for Unified Visual Generation

2026-05-13

AutoLLMResearch: Training Research Agents for Automating LLM Experiment Configuration -- Learning from Cheap, Optimizing Expensive

AutoLLMResearch: Training Research Agents for Automating LLM Experiment Configuration — Learning from Cheap, Optimizing Expensive

2026-05-13

MoCam: Unified Novel View Synthesis via Structured Denoising Dynamics

MoCam: Unified Novel View Synthesis via Structured Denoising Dynamics

2026-05-13

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

EVOCHAMBER: Test-Time Co-evolution of Multi-Agent System at Individual, Team, and Population Scales

2026-05-13

Micro-Defects Expose Macro-Fakes: Detecting AI-Generated Images via Local Distributional Shifts

Micro-Defects Expose Macro-Fakes: Detecting AI-Generated Images via Local Distributional Shifts

2026-05-13

AdaPreLoRA: Adafactor Preconditioned Low-Rank Adaptation

AdaPreLoRA: Adafactor Preconditioned Low-Rank Adaptation

2026-05-13

EgoForce: Forearm-Guided Camera-Space 3D Hand Pose from a Monocular Egocentric Camera

EgoForce: Forearm-Guided Camera-Space 3D Hand Pose from a Monocular Egocentric Camera

2026-05-13

SleepWalk: A Three-Tier Benchmark for Stress-Testing Instruction-Guided Vision-Language Navigation

SleepWalk: A Three-Tier Benchmark for Stress-Testing Instruction-Guided Vision-Language Navigation

2026-05-13

Qwen-Image-2.0 Technical Report

Qwen-Image-2.0 Technical Report

2026-05-12

Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs

Soohak: A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs

2026-05-12

CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models

CollabVR: Collaborative Video Reasoning with Vision-Language and Video Generation Models

2026-05-12

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

2026-05-12

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

PaperFit: Vision-in-the-Loop Typesetting Optimization for Scientific Documents

2026-05-12

SEIF: Self-Evolving Reinforcement Learning for Instruction Following

SEIF: Self-Evolving Reinforcement Learning for Instruction Following

2026-05-12