Bryan Teo

bteo98

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

Perception Encoder: The best visual embeddings are not at the output of the network

upvoted a paper 5 days ago

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

liked a dataset 5 days ago

amazon-agi/SIFT-50M

View all activity

Organizations

None yet

bteo98's activity

upvoted a paper 3 days ago

Perception Encoder: The best visual embeddings are not at the output of the network

Paper • 2504.13181 • Published 4 days ago • 23

upvoted a paper 5 days ago

SIFT-50M: A Large-Scale Multilingual Dataset for Speech Instruction Fine-Tuning

Paper • 2504.09081 • Published 10 days ago • 16

upvoted a paper 12 days ago

DDT: Decoupled Diffusion Transformer

Paper • 2504.05741 • Published 14 days ago • 72

upvoted a collection 16 days ago

Llama 4

Collection

Llama 4 release • 10 items • Updated 16 days ago • 439

upvoted 2 papers 25 days ago

Wan: Open and Advanced Large-Scale Video Generative Models

Paper • 2503.20314 • Published 27 days ago • 49

Qwen2.5-Omni Technical Report

Paper • 2503.20215 • Published 27 days ago • 139

upvoted a paper 26 days ago

Gumbel-Softmax Flow Matching with Straight-Through Guidance for Controllable Biological Sequence Generation

Paper • 2503.17361 • Published Mar 21 • 4

upvoted 3 papers about 2 months ago

Babel: Open Multilingual Large Language Models Serving Over 90% of Global Speakers

Paper • 2503.00865 • Published Mar 2 • 63

REINFORCE++: A Simple and Efficient Approach for Aligning Large Language Models

Paper • 2501.03262 • Published Jan 4 • 99

SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features

Paper • 2502.14786 • Published Feb 20 • 142

upvoted 3 papers 3 months ago

Demons in the Detail: On Implementing Load Balancing Loss for Training Specialized Mixture-of-Expert Models

Paper • 2501.11873 • Published Jan 21 • 66

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published Jan 22 • 384

VideoLLaMA 3: Frontier Multimodal Foundation Models for Image and Video Understanding

Paper • 2501.13106 • Published Jan 22 • 91

upvoted 4 papers 4 months ago

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 148

upvoted 2 papers 8 months ago

WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling

Paper • 2408.16532 • Published Aug 29, 2024 • 51

LLM Pruning and Distillation in Practice: The Minitron Approach

Paper • 2408.11796 • Published Aug 21, 2024 • 59

upvoted a paper 9 months ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15, 2024 • 163