HF Papers

PhysX-Omni: Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects

PhysX-Omni: Unified Simulation-Ready Physical 3D Generation for Rigid, Deformable, and Articulated Objects

2026-05-22

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

LatentOmni: Rethinking Omni-Modal Understanding via Unified Audio-Visual Latent Reasoning

2026-05-22

Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning

Spreadsheet-RL: Advancing Large Language Model Agents on Realistic Spreadsheet Tasks via Reinforcement Learning

2026-05-22

WorldKV: Efficient World Memory with World Retrieval and Compression

WorldKV: Efficient World Memory with World Retrieval and Compression

2026-05-22

Forecasting Scientific Progress with Artificial Intelligence

Forecasting Scientific Progress with Artificial Intelligence

2026-05-22

SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers

SEGA: Spectral-Energy Guided Attention for Resolution Extrapolation in Diffusion Transformers

2026-05-22

Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving

Sensor2Sensor: Cross-Embodiment Sensor Conversion for Autonomous Driving

2026-05-22

FlowLong: Inference-time Long Video Generation via Manifold-constrained Tweedie Matching

FlowLong: Inference-time Long Video Generation via Manifold-constrained Tweedie Matching

2026-05-22

SpaceDG: Benchmarking Spatial Intelligence under Visual Degradation

SpaceDG: Benchmarking Spatial Intelligence under Visual Degradation

2026-05-22

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles

Maestro: Reinforcement Learning to Orchestrate Hierarchical Model-Skill Ensembles

2026-05-22

Q-ARVD: Quantizing Autoregressive Video Diffusion Models

Q-ARVD: Quantizing Autoregressive Video Diffusion Models

2026-05-22

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

2026-05-22

Unsupervised Process Reward Models

Unsupervised Process Reward Models

2026-05-22

GenEvolve: Self-Evolving Image Generation Agents via Tool-Orchestrated Visual Experience Distillation

GenEvolve: Self-Evolving Image Generation Agents via Tool-Orchestrated Visual Experience Distillation

2026-05-22

KVServe: Service-Aware KV Cache Compression for Communication-Efficient Disaggregated LLM Serving

KVServe: Service-Aware KV Cache Compression for Communication-Efficient Disaggregated LLM Serving

2026-05-22

Forecasting Downstream Performance of LLMs With Proxy Metrics

Forecasting Downstream Performance of LLMs With Proxy Metrics

2026-05-22

One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems

One Sentence, One Drama: Personalized Short-Form Drama Generation via Multi-Agent Systems

2026-05-22

ClinSeekAgent: Automating Multimodal Evidence Seeking for Agentic Clinical Reasoning

ClinSeekAgent: Automating Multimodal Evidence Seeking for Agentic Clinical Reasoning

2026-05-22

Swift Sampling: Selecting Temporal Surprises via Taylor Series

Swift Sampling: Selecting Temporal Surprises via Taylor Series

2026-05-22

Efficient Agentic Reasoning Through Self-Regulated Simulative Planning

Efficient Agentic Reasoning Through Self-Regulated Simulative Planning

2026-05-22