HF Papers

PixVerve: Advancing Native UHR Image Generation to 100MP with a Large-Scale High-Quality Dataset

PixVerve: Advancing Native UHR Image Generation to 100MP with a Large-Scale High-Quality Dataset

2026-05-20

Video Models Can Reason with Verifiable Rewards

Video Models Can Reason with Verifiable Rewards

2026-05-20

Fast 4D Mesh Generation by Spatio-Temporal Attention Chains

Fast 4D Mesh Generation by Spatio-Temporal Attention Chains

2026-05-20

Semantic Generative Tuning for Unified Multimodal Models

Semantic Generative Tuning for Unified Multimodal Models

2026-05-20

Delta Attention Residuals

Delta Attention Residuals

2026-05-20

Overcoming Catastrophic Forgetting in Visual Continual Learning with Reinforcement Fine-Tuning

Overcoming Catastrophic Forgetting in Visual Continual Learning with Reinforcement Fine-Tuning

2026-05-20

PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents

PEEK: Context Map as an Orientation Cache for Long-Context LLM Agents

2026-05-20

Code-Guided Reasoning for Small Language Models: Evaluating Executable MCQA Scaffolds

Code-Guided Reasoning for Small Language Models: Evaluating Executable MCQA Scaffolds

2026-05-20

TideGS: Scalable Training of Over One Billion 3D Gaussian Splatting Primitives via Out-of-Core Optimization

TideGS: Scalable Training of Over One Billion 3D Gaussian Splatting Primitives via Out-of-Core Optimization

2026-05-20

Draft Less, Retrieve More: Hybrid Tree Construction for Speculative Decoding

Draft Less, Retrieve More: Hybrid Tree Construction for Speculative Decoding

2026-05-20

Context Memorization for Efficient Long Context Generation

Context Memorization for Efficient Long Context Generation

2026-05-20

ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

2026-05-20

CopT: Contrastive On-Policy Thinking with Continuous Spaces for General and Agentic Reasoning

CopT: Contrastive On-Policy Thinking with Continuous Spaces for General and Agentic Reasoning

2026-05-20

Stage-adaptive Token Selection for Efficient Omni-modal LLMs

Stage-adaptive Token Selection for Efficient Omni-modal LLMs

2026-05-20

Echo-Forcing: A Scene Memory Framework for Interactive Long Video Generation

Echo-Forcing: A Scene Memory Framework for Interactive Long Video Generation

2026-05-20

DocAtlas: Multilingual Document Understanding Across 80+ Languages

DocAtlas: Multilingual Document Understanding Across 80+ Languages

2026-05-20

Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models

Mid-Training with Self-Generated Data Improves Reinforcement Learning in Language Models

2026-05-20

Base Models Look Human To AI Detectors

Base Models Look Human To AI Detectors

2026-05-20

Matérn Noise for Triangulation-Agnostic Flow Matching on Meshes

Matérn Noise for Triangulation-Agnostic Flow Matching on Meshes

2026-05-20

Where Does Authorship Signal Emerge in Encoder-Based Language Models?

Where Does Authorship Signal Emerge in Encoder-Based Language Models?

2026-05-20