Audio - a henern Collection

henern 's Collections

RAG

Data

Vision

Audio

Reports

Audio

updated Feb 12

Audio/Music/Speech/etc.

Language Model Can Listen While Speaking

Paper • 2408.02622 • Published Aug 5, 2024 • 43
Llasa: Scaling Train-Time and Inference-Time Compute for Llama-based Speech Synthesis

Paper • 2502.04128 • Published Feb 6 • 26