Xingshan Zeng's picture

Xingshan Zeng

zxshamson

·

AI & ML interests

None yet

Recent Activity

authored a paper 1 day ago

MT-Eval: A Multi-Turn Capabilities Evaluation Benchmark for Large Language Models

authored a paper 1 day ago

FollowBench: A Multi-level Fine-grained Constraints Following Benchmark for Large Language Models

authored a paper 1 day ago

M4LE: A Multi-Ability Multi-Range Multi-Task Multi-Domain Long-Context Evaluation Benchmark for Large Language Models

View all activity

Organizations

Papers 9

arxiv:2605.18703

arxiv:2601.08276

arxiv:2508.12685

arxiv:2504.01400

models 0

None public yet

datasets 0

None public yet