new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jul 18

Submitted by

Chevalier

A Survey of Context Engineering for Large Language Models

·
15 authors

Submitted by

Senqiao

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

·
6 authors

Submitted by

tonghe90

π^3: Scalable Permutation-Equivariant Visual Geometry Learning

·
10 authors

Submitted by

vanilla1116

The Imitation Game: Turing Machine Imitator is Length Generalizable Reasoner

·
7 authors

1

Submitted by

Ruihang

AnyCap Project: A Unified Framework, Dataset, and Benchmark for Controllable Omni-modal Captioning

·
11 authors

Submitted by

krahets

Diffuman4D: 4D Consistent Human View Synthesis from Sparse-View Videos with Spatio-Temporal Diffusion Models

·
9 authors

Submitted by

ai-alanov

RiemannLoRA: A Unified Riemannian Framework for Ambiguity-Free LoRA Optimization

·
7 authors

1

Submitted by

yyuncong

MindJourney: Test-Time Scaling with World Models for Spatial Reasoning

·
8 authors

Submitted by

reach-vb

Voxtral

·
106 authors

Submitted by

wangqiang9

FantasyPortrait: Enhancing Multi-Character Portrait Animation with Expression-Augmented Diffusion Transformers

·
6 authors

Submitted by

yilunzhao

AbGen: Evaluating Large Language Models in Ablation Study Design and Evaluation for Scientific Research

·
8 authors

Submitted by

elephantmipt

Teach Old SAEs New Domain Tricks with Boosting

·
6 authors

1

Submitted by

Owos

FLEXITOKENS: Flexible Tokenization for Evolving Language Models

·
3 authors

Submitted by

ucfzl

TLB-VFI: Temporal-Aware Latent Brownian Bridge Diffusion for Video Frame Interpolation

·
2 authors

Submitted by

AndreiB137

Einstein Fields: A Neural Perspective To Computational General Relativity

·
4 authors

Submitted by

Ningyu

Automating Steering for Safe Multimodal Large Language Models

·
7 authors