Boyuan Chen's picture

72 17

Boyuan Chen

BoyuanChen

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 13 hours ago

LLMs are Greedy Agents: Effects of RL Fine-tuning on Decision-Making Abilities

upvoted a paper about 13 hours ago

BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation

upvoted a paper about 13 hours ago

Efficient Pretraining Length Scaling

View all activity

Organizations

None yet

BoyuanChen's activity

upvoted 6 papers about 13 hours ago

LLMs are Greedy Agents: Effects of RL Fine-tuning on Decision-Making Abilities

Paper • 2504.16078 • Published 1 day ago • 10

BookWorld: From Novels to Interactive Agent Societies for Creative Story Generation

Paper • 2504.14538 • Published 3 days ago • 17

Efficient Pretraining Length Scaling

Paper • 2504.14992 • Published 2 days ago • 15

Kuwain 1.5B: An Arabic SLM via Language Injection

Paper • 2504.15120 • Published 2 days ago • 93

TTRL: Test-Time Reinforcement Learning

Paper • 2504.16084 • Published 1 day ago • 55

The Bitter Lesson Learned from 2,000+ Multilingual Benchmarks

Paper • 2504.15521 • Published 1 day ago • 50

upvoted 4 papers 1 day ago

LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs

Paper • 2504.14655 • Published 3 days ago • 17

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

Paper • 2504.13203 • Published 8 days ago • 26

Learning to Reason under Off-Policy Guidance

Paper • 2504.14945 • Published 2 days ago • 66

Could Thinking Multilingually Empower LLM Reasoning?

Paper • 2504.11833 • Published 7 days ago • 25

upvoted a paper 2 days ago

70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float

Paper • 2504.11651 • Published 8 days ago • 15

upvoted 2 papers 7 days ago

Seedream 3.0 Technical Report

Paper • 2504.11346 • Published 8 days ago • 45

Genius: A Generalizable and Purely Unsupervised Self-Training Framework For Advanced Reasoning

Paper • 2504.08672 • Published 12 days ago • 53

upvoted a paper 8 days ago

Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability

Paper • 2504.08003 • Published 14 days ago • 47

upvoted 4 papers 10 days ago

SAEs Can Improve Unlearning: Dynamic Sparse Autoencoder Guardrails for Precision Unlearning in LLMs

Paper • 2504.08192 • Published 13 days ago • 4

Seaweed-7B: Cost-Effective Training of Video Generation Foundation Model

Paper • 2504.08685 • Published 12 days ago • 121

Kimi-VL Technical Report

Paper • 2504.07491 • Published 14 days ago • 120

DeepSeek-R1 Thoughtology: Let's <think> about LLM Reasoning

Paper • 2504.07128 • Published 22 days ago • 82

upvoted a paper 14 days ago

DDT: Decoupled Diffusion Transformer

Paper • 2504.05741 • Published 16 days ago • 73

upvoted a paper 15 days ago

Generative Evaluation of Complex Reasoning in Large Language Models

Paper • 2504.02810 • Published 20 days ago • 14