minju's picture

10

minju

iaminju

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 13 days ago

T1: Tool-integrated Self-verification for Test-time Compute Scaling in Small Language Models

updated a model 25 days ago

iaminju/rlpvr_pref_only

published a model 25 days ago

iaminju/rlpvr_pref_only

View all activity

Organizations

models 13

iaminju/rlpvr_pref_only

Updated 25 days ago • 2

iaminju/rlpvr_math_only

Updated 25 days ago • 18

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_sample_83k_3

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_sample_83k_2

Updated Feb 28 • 1

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_sample_83k

Updated Feb 27 • 1

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_sample_10k

Text Generation • Updated Feb 26 • 7

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_sample_1k

Text Generation • Updated Feb 26 • 7

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_nq_s_pref

Text Generation • Updated Feb 25 • 3

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_pref

Text Generation • Updated Feb 25 • 2

iaminju/DeepSeek-R1-Distill-Qwen-1.5B-GRPO_math_nq_s

datasets

None public yet