HF Papers

Flash-GMM: A Memory-Efficient Kernel for Scalable Soft Clustering

Flash-GMM: A Memory-Efficient Kernel for Scalable Soft Clustering

2026-06-12

Leveraging Morphology for Historical Script Metrological Analysis

Leveraging Morphology for Historical Script Metrological Analysis

2026-06-12

Revisiting Articulated Parts Perception in Robot Manipulation

Revisiting Articulated Parts Perception in Robot Manipulation

2026-06-12

On the Limits of LLM Adaptability: Impact of Model-Internalized Priors on Annotation Task Performance

On the Limits of LLM Adaptability: Impact of Model-Internalized Priors on Annotation Task Performance

2026-06-12

Redesign Mixture-of-Experts Routers with Manifold Power Iteration

Redesign Mixture-of-Experts Routers with Manifold Power Iteration

2026-06-11

Toward Generalist Autonomous Research via Hypothesis-Tree Refinement

Toward Generalist Autonomous Research via Hypothesis-Tree Refinement

2026-06-11

Agentic Environment Engineering for Large Language Models: A Survey of Environment Modeling, Synthesis, Evaluation, and Application

Agentic Environment Engineering for Large Language Models: A Survey of Environment Modeling, Synthesis, Evaluation, and Application

2026-06-11

Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

Claw-SWE-Bench: A Benchmark for Evaluating OpenClaw-style Agent Harnesses on Coding Tasks

2026-06-11

Beyond Scalar Rewards by Internalizing Reasoning into Score Distributions

Beyond Scalar Rewards by Internalizing Reasoning into Score Distributions

2026-06-11

TRL-Bench: Standardizing Cross-Paradigm Representation-Level Evaluation of Tabular Encoders

TRL-Bench: Standardizing Cross-Paradigm Representation-Level Evaluation of Tabular Encoders

2026-06-11

Reason, Then Re-reason: Cross-view Revisiting Improves Spatial Reasoning

Reason, Then Re-reason: Cross-view Revisiting Improves Spatial Reasoning

2026-06-11

DeNovoSWE: Scaling Long-Horizon Environments for Generating Entire Repositories from Scratch

DeNovoSWE: Scaling Long-Horizon Environments for Generating Entire Repositories from Scratch

2026-06-11

World Pilot: Steering Vision-Language-Action Models with World-Action Priors

World Pilot: Steering Vision-Language-Action Models with World-Action Priors

2026-06-11

On Subquadratic Architectures: From Applications to Principles

On Subquadratic Architectures: From Applications to Principles

2026-06-11

ComBench: A Benchmark for Rigorous Proof Reasoning and Constructive Realization in Olympiad-Level Combinatorics

ComBench: A Benchmark for Rigorous Proof Reasoning and Constructive Realization in Olympiad-Level Combinatorics

2026-06-11

Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code

Grammar-Constrained Decoding Can Jailbreak LLMs into Generating Malicious Code

2026-06-11

InternVideo3: Agentify Foundation Models with Multimodal Contextual Reasoning

InternVideo3: Agentify Foundation Models with Multimodal Contextual Reasoning

2026-06-11

Breaking Entropy Bounds: Accelerating RL Training via MTP with Rejection Sampling

Breaking Entropy Bounds: Accelerating RL Training via MTP with Rejection Sampling

2026-06-11

Reroute, Don't Remove: Recoverable Visual Token Routing for Vision-Language Models

Reroute, Don’t Remove: Recoverable Visual Token Routing for Vision-Language Models

2026-06-11

TRACE: A Unified Rollout Budget Allocation Framework for Efficient Agentic Reinforcement Learning

TRACE: A Unified Rollout Budget Allocation Framework for Efficient Agentic Reinforcement Learning

2026-06-11