HF Papers

Attention Amnesia in Hybrid LLMs: When CoT Fine-Tuning Breaks Long-Range Recall, and How to Fix It

Attention Amnesia in Hybrid LLMs: When CoT Fine-Tuning Breaks Long-Range Recall, and How to Fix It

2026-06-10

Interpreting and Steering a Text-to-Speech Language Model with Sparse Autoencoders

Interpreting and Steering a Text-to-Speech Language Model with Sparse Autoencoders

2026-06-10

Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval

Online Skill Learning for Web Agents via State-Grounded Dynamic Retrieval

2026-06-10

SkillHarm: Lifecycle-Aware Skill-Based Attacks via Automated Construction

SkillHarm: Lifecycle-Aware Skill-Based Attacks via Automated Construction

2026-06-10

How Does Reasoning Flow? Tracing Attention-Induced Information Flow for Targeted RL in LLMs

How Does Reasoning Flow? Tracing Attention-Induced Information Flow for Targeted RL in LLMs

2026-06-10

BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling

BrainSurgery: Reproducible and Reliable Declarative Weight Manipulations for Model Editing and Upcycling

2026-06-10

Bridging the Agent-World Gap: Text World Models for LLM-based Agents

Bridging the Agent-World Gap: Text World Models for LLM-based Agents

2026-06-10

PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

PsychoSafe: Eliciting Psychologically-Informed Refusals in Large Language Models

2026-06-10

Struct-Searcher: Agentic Structural Thinking Advances Multimodal Deep Information Seeking

Struct-Searcher: Agentic Structural Thinking Advances Multimodal Deep Information Seeking

2026-06-10

UniPET: a universal network for high-quality PET image denoising across varied dose reduction factors

UniPET: a universal network for high-quality PET image denoising across varied dose reduction factors

2026-06-10

U-TTT: Towards Generalizable PET Image Denoising via Test-Time Training

U-TTT: Towards Generalizable PET Image Denoising via Test-Time Training

2026-06-10

MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation

MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation

2026-06-10

Emergent Misalignment Can Be Induced by Sycophancy and Reversed via Alignment Gating

Emergent Misalignment Can Be Induced by Sycophancy and Reversed via Alignment Gating

2026-06-10

What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

What Should Agents Say? Action-state Communication for Efficient Multi-Agent Systems

2026-06-10

Next Forcing: Causal World Modeling with Multi-Chunk Prediction

Next Forcing: Causal World Modeling with Multi-Chunk Prediction

2026-06-10

Dynamic Linear Attention

Dynamic Linear Attention

2026-06-10

Test-Time Gradient Guidance of Flow Policies in Reinforcement Learning

Test-Time Gradient Guidance of Flow Policies in Reinforcement Learning

2026-06-10

Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation

Late-Layer Fusion is Enough: Dual-Path Vision Token Routing for Multimodal Large Language Models under Visual Saturation

2026-06-10

Do Coding Agents Deceive Us? Detecting and Preventing Cheating via Capped Evaluation with Randomized Tests

Do Coding Agents Deceive Us? Detecting and Preventing Cheating via Capped Evaluation with Randomized Tests

2026-06-10

IR3DE: A Linear Router for Large Language Models

IR3DE: A Linear Router for Large Language Models

2026-06-10