sdpkjc (Yanxiao Zhao)

arxiv:2508.14040

arxiv:2502.11896

arxiv:2403.00673

models 95

datasets 17

sdpkjc/SATQuest

Viewer • Updated Sep 6, 2025 • 140 • 55

sdpkjc/SATQuest-RFT-3k

Viewer • Updated Jul 30, 2025 • 3k • 58

sdpkjc/24problems_quiz-eval-n4-1-10-24

Viewer • Updated May 22, 2025 • 55.5k • 12

sdpkjc/24problems_quiz-eval-5

Viewer • Updated May 22, 2025 • 100k • 7

sdpkjc/24problems_quiz

Viewer • Updated May 21, 2025 • 85.6k • 29

sdpkjc/SATQuest-RFT-1k

Viewer • Updated Apr 23, 2025 • 1k • 11

sdpkjc/SATQuest-Tiny

Viewer • Updated Apr 20, 2025 • 10 • 7

sdpkjc/SATQuest-G

Viewer • Updated Mar 28, 2025 • 963 • 370

sdpkjc/NumBase-N01-S2g-B2g

Viewer • Updated Feb 26, 2025 • 983k • 3

sdpkjc/NumBase-N01-S2g-B28

Viewer • Updated Feb 26, 2025 • 459k • 6

View 17 datasets

Yanxiao Zhao

AI & ML interests

Organizations

Collections 1

sdpkjc/SATQuest

sdpkjc/SATQuest-RFT-3k

SATQuest: A Verifier for Logical Reasoning Evaluation and Reinforcement Fine-Tuning of LLMs

sdpkjc/SATQuest

sdpkjc/SATQuest-RFT-3k

SATQuest: A Verifier for Logical Reasoning Evaluation and Reinforcement Fine-Tuning of LLMs

Papers 5

models 95

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed5

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed4

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed3

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed2

sdpkjc/Ant-v4-ppo_fix_continuous_action-seed1

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed5

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed4

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed3

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed2

sdpkjc/Humanoid-v4-ppo_fix_continuous_action-seed1

datasets 17

sdpkjc/SATQuest

sdpkjc/SATQuest-RFT-3k

sdpkjc/24problems_quiz-eval-n4-1-10-24

sdpkjc/24problems_quiz-eval-5

sdpkjc/24problems_quiz

sdpkjc/SATQuest-RFT-1k

sdpkjc/SATQuest-Tiny

sdpkjc/SATQuest-G

sdpkjc/NumBase-N01-S2g-B2g

sdpkjc/NumBase-N01-S2g-B28

Yanxiao Zhao

AI & ML interests

Organizations

Collections 1

Papers 5

models 95 Sort: Recently updated

datasets 17 Sort: Recently updated

models 95

datasets 17