Zhichen Zeng's picture

Zhichen Zeng

zhichenz

zhichenz98

AI & ML interests

None yet

Recent Activity

authored a paper 7 days ago

Improving LLM General Preference Alignment via Optimistic Online Mirror Descent

authored a paper 7 days ago

WAPITI: A Watermark for Finetuned Open-Source LLMs

authored a paper 7 days ago

Harnessing Consistency for Robust Test-Time LLM Ensemble

View all activity

Organizations

None yet

authored 8 papers 7 days ago

Improving LLM General Preference Alignment via Optimistic Online Mirror Descent

Paper • 2502.16852 • Published Feb 24, 2025

WAPITI: A Watermark for Finetuned Open-Source LLMs

Paper • 2410.06467 • Published Oct 9, 2024

Harnessing Consistency for Robust Test-Time LLM Ensemble

Paper • 2510.13855 • Published Oct 12, 2025

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 204

TSAQA: Time Series Analysis Question And Answering Benchmark

Paper • 2601.23204 • Published Jan 30 • 3

ALERT: Zero-shot LLM Jailbreak Detection via Internal Discrepancy Amplification

Paper • 2601.03600 • Published Jan 7

Subspace Alignment for Vision-Language Model Test-time Adaptation

Paper • 2601.08139 • Published Jan 13

Code as Agent Harness

Paper • 2605.18747 • Published 15 days ago • 211

upvoted a paper 12 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published 13 days ago • 49

upvoted a paper 13 days ago

Code as Agent Harness

Paper • 2605.18747 • Published 15 days ago • 211

upvoted 2 papers about 1 month ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published Apr 30 • 217

Recursive Multi-Agent Systems

Paper • 2604.25917 • Published Apr 28 • 273

liked a dataset about 2 months ago

YennNing/MC-Search

Viewer • Updated Feb 22 • 3.33k • 777 • 28

upvoted 3 papers 3 months ago

Video-Based Reward Modeling for Computer-Use Agents

Paper • 2603.10178 • Published Mar 10 • 43

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 197

dLLM: Simple Diffusion Language Modeling

Paper • 2602.22661 • Published Feb 26 • 153

upvoted a paper 4 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 204

upvoted a paper 5 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted a paper 6 months ago

Latent Collaboration in Multi-Agent Systems

Paper • 2511.20639 • Published Nov 25, 2025 • 128

upvoted a paper 11 months ago

MIRIX: Multi-Agent Memory System for LLM-Based Agents

Paper • 2507.07957 • Published Jul 10, 2025 • 80