1 17 6

Shun Zheng

shun-zheng

AI & ML interests

None yet

Recent Activity

liked a model about 9 hours ago

deepseek-ai/DeepSeek-V3.1-Base

upvoted a paper 9 days ago

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

upvoted a paper 9 days ago

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

View all activity

Organizations

liked a model about 9 hours ago

deepseek-ai/DeepSeek-V3.1-Base

685B • Updated 1 day ago • 605

upvoted 2 papers 9 days ago

Seed Diffusion: A Large-Scale Diffusion Language Model with High-Speed Inference

Paper • 2508.02193 • Published 16 days ago • 126

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Paper • 2507.23726 • Published 20 days ago • 107

liked a model 15 days ago

openai/gpt-oss-20b

Text Generation • 22B • Updated 7 days ago • 3.65M • • 3.14k

upvoted a paper 20 days ago

Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published 25 days ago • 139

liked a dataset 23 days ago

Skywork/Skywork-OR1-RL-Data

Viewer • Updated May 29 • 119k • 1.01k • 53

upvoted a paper 23 days ago

Skywork Open Reasoner 1 Technical Report

Paper • 2505.22312 • Published May 28 • 55

upvoted 2 papers 24 days ago

A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17 • 244

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 40

upvoted 3 papers 26 days ago

Test-Time Scaling with Reflective Generative Model

Paper • 2507.01951 • Published Jul 2 • 106

STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models

Paper • 2507.15375 • Published about 1 month ago • 25

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published 28 days ago • 36

upvoted a paper 27 days ago

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

Paper • 2507.14683 • Published Jul 19 • 126

liked a model 28 days ago

nvidia/AceReason-Nemotron-1.1-7B

Text Generation • 8B • Updated Jul 11 • 8.08k • • 55

upvoted 2 papers about 1 month ago

ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs

Paper • 2506.18896 • Published Jun 23 • 28

Skywork-R1V3 Technical Report

Paper • 2507.06167 • Published Jul 8 • 68

commented 2 papers about 1 month ago

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 40 •

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 40 •

upvoted 2 papers about 2 months ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 255

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Paper • 2507.00432 • Published Jul 1 • 73

Shun Zheng

AI & ML interests

Recent Activity

Organizations

shun-zheng's activity