HF Papers

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

UniT: Unified Multimodal Chain-of-Thought Test-time Scaling

2026-02-18

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

jina-embeddings-v5-text: Task-Targeted Embedding Distillation

2026-02-18

Revisiting the Platonic Representation Hypothesis: An Aristotelian View

Revisiting the Platonic Representation Hypothesis: An Aristotelian View

2026-02-18

Understanding vs. Generation: Navigating Optimization Dilemma in Multimodal Models

Understanding vs. Generation: Navigating Optimization Dilemma in Multimodal Models

2026-02-18

On Surprising Effectiveness of Masking Updates in Adaptive Optimizers

On Surprising Effectiveness of Masking Updates in Adaptive Optimizers

2026-02-18

COMPOT: Calibration-Optimized Matrix Procrustes Orthogonalization for Transformers Compression

COMPOT: Calibration-Optimized Matrix Procrustes Orthogonalization for Transformers Compression

2026-02-18

TAROT: Test-driven and Capability-adaptive Curriculum Reinforcement Fine-tuning for Code Generation with Large Language Models

TAROT: Test-driven and Capability-adaptive Curriculum Reinforcement Fine-tuning for Code Generation with Large Language Models

2026-02-18

Panini: Continual Learning in Token Space via Structured Memory

Panini: Continual Learning in Token Space via Structured Memory

2026-02-18

STAPO: Stabilizing Reinforcement Learning for LLMs by Silencing Rare Spurious Tokens

STAPO: Stabilizing Reinforcement Learning for LLMs by Silencing Rare Spurious Tokens

2026-02-18

Visual Persuasion: What Influences Decisions of Vision-Language Models?

Visual Persuasion: What Influences Decisions of Vision-Language Models?

2026-02-18

Prescriptive Scaling Reveals the Evolution of Language Model Capabilities

Prescriptive Scaling Reveals the Evolution of Language Model Capabilities

2026-02-18

Learning Native Continuation for Action Chunking Flow Policies

Learning Native Continuation for Action Chunking Flow Policies

2026-02-18

Causal-JEPA: Learning World Models through Object-Level Latent Interventions

Causal-JEPA: Learning World Models through Object-Level Latent Interventions

2026-02-18

ClinAlign: Scaling Healthcare Alignment from Clinician Preference

ClinAlign: Scaling Healthcare Alignment from Clinician Preference

2026-02-18

Geometry-Aware Rotary Position Embedding for Consistent Video World Model

Geometry-Aware Rotary Position Embedding for Consistent Video World Model

2026-02-18

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

The Vision Wormhole: Latent-Space Communication in Heterogeneous Multi-Agent Systems

2026-02-18

A Trajectory-Based Safety Audit of Clawdbot (OpenClaw)

A Trajectory-Based Safety Audit of Clawdbot (OpenClaw)

2026-02-18

HLE-Verified: A Systematic Verification and Structured Revision of Humanity's Last Exam

HLE-Verified: A Systematic Verification and Structured Revision of Humanity’s Last Exam

2026-02-18

Detecting Overflow in Compressed Token Representations for Retrieval-Augmented Generation

Detecting Overflow in Compressed Token Representations for Retrieval-Augmented Generation

2026-02-18

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge

2026-02-18