AI Native Foundation

Confidence and Calibration of Activation Oracles for Reliable Interpretation of Language Model Internals

2026-05-27

Beyond Final Answers: Auditing Trajectory-Level Hallucinations in Multi-Agent Industrial Workflows

2026-05-27

DarkForest: Less Talk, Higher Accuracy for Multi-Agent LLMs

2026-05-27

Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini

2026-05-27

MobileMoE: Scaling On-Device Mixture of Experts

2026-05-27

Squeezing Capacity from Multimodal Large Language Models for Subject-driven Generation

2026-05-27

Learning to Act under Noise: Enhancing Agent Robustness via Noisy Environments

2026-05-27

FastKernels: Benchmarking GPU Kernel Generation in Production

2026-05-27

MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale

2026-05-27

RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models

2026-05-27

SAM: State-Adaptive Memory for Long-Horizon Reasoning Agent

2026-05-27

ZeroUnlearn: Few-Shot Knowledge Unlearning in Large Language Models

2026-05-27

Agentic CLEAR: Automating Multi-Level Evaluation of LLM Agents

2026-05-27

Understanding Data Temporality Impact on Large Language Models Pre-training

2026-05-27

Can LLMs Introspect? A Reality Check

2026-05-27

NSF-SciFy: Mining the NSF Awards Database for Scientific Claims

2026-05-27

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

2026-05-27

Learning High-Frequency Continuous Action Chunks in Latent Space

2026-05-27

EverAnimate: Minute-Scale Human Animation via Latent Flow Restoration

2026-05-27

STREAM: A Data-Centric Framework for Mining High-Value Task-Oriented Dialogues from Streaming Media

2026-05-27

HF Papers

Confidence and Calibration of Activation Oracles for Reliable Interpretation of Language Model Internals

Beyond Final Answers: Auditing Trajectory-Level Hallucinations in Multi-Agent Industrial Workflows

DarkForest: Less Talk, Higher Accuracy for Multi-Agent LLMs

Gemini Embedding 2: A Native Multimodal Embedding Model from Gemini

MobileMoE: Scaling On-Device Mixture of Experts

Squeezing Capacity from Multimodal Large Language Models for Subject-driven Generation

Learning to Act under Noise: Enhancing Agent Robustness via Noisy Environments

FastKernels: Benchmarking GPU Kernel Generation in Production

MRT: Masked Region Transformer for Layered Image Generation and Editing at Scale

RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models

SAM: State-Adaptive Memory for Long-Horizon Reasoning Agent

ZeroUnlearn: Few-Shot Knowledge Unlearning in Large Language Models

Agentic CLEAR: Automating Multi-Level Evaluation of LLM Agents

Understanding Data Temporality Impact on Large Language Models Pre-training

Can LLMs Introspect? A Reality Check

NSF-SciFy: Mining the NSF Awards Database for Scientific Claims

CroCo: Cross-Lingual Contrastive Preference Tuning on Self-Generations

Learning High-Frequency Continuous Action Chunks in Latent Space

EverAnimate: Minute-Scale Human Animation via Latent Flow Restoration

STREAM: A Data-Centric Framework for Mining High-Value Task-Oriented Dialogues from Streaming Media

About

Insights

Case Study

Legal