Haowei Zhang's picture

Haowei Zhang

freesky

·

freesky01

AI & ML interests

None yet

Recent Activity

liked a model 1 day ago

OpenMOSS-Team/MOSS-TTS-Nano-100M

liked a Space 1 day ago

OpenMOSS-Team/MOSS-TTS-Nano

liked a model 5 days ago

OpenMOSS-Team/MOSS-VL-Base-0408

View all activity

Organizations

upvoted a paper 7 days ago

DataFlex: A Unified Framework for Data-Centric Dynamic Training of Large Language Models

Paper • 2603.26164 • Published 18 days ago • 351

upvoted a paper 13 days ago

PackForcing: Short Video Training Suffices for Long Video Sampling and Long Context Inference

Paper • 2603.25730 • Published 19 days ago • 52

upvoted a paper 28 days ago

AI Can Learn Scientific Taste

Paper • 2603.14473 • Published 30 days ago • 422

upvoted a paper about 1 month ago

BandPO: Bridging Trust Regions and Ratio Clipping via Probability-Aware Bounds for LLM Reinforcement Learning

Paper • 2603.04918 • Published Mar 5 • 56

upvoted a paper about 2 months ago

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

upvoted 7 papers 2 months ago

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

Paper • 2602.10934 • Published Feb 11 • 49

Prism: Spectral-Aware Block-Sparse Attention

Paper • 2602.08426 • Published Feb 9 • 38

MOVA: Towards Scalable and Synchronized Video-Audio Generation

Paper • 2602.08794 • Published Feb 9 • 159

Making Avatars Interact: Towards Text-Driven Human-Object Interaction for Controllable Talking Avatars

Paper • 2602.01538 • Published Feb 2 • 15

Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models

Paper • 2602.02185 • Published Feb 2 • 118

UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing

Paper • 2602.02437 • Published Feb 2 • 80

AgentLongBench: A Controllable Long Benchmark For Long-Contexts Agents via Environment Rollouts

Paper • 2601.20730 • Published Jan 28 • 21

upvoted 8 papers 3 months ago

TL-GRPO: Turn-Level RL for Reasoning-Guided Iterative Optimization

Paper • 2601.16480 • Published Jan 23 • 50

Learning to Discover at Test Time

Paper • 2601.16175 • Published Jan 22 • 44

Qwen3-TTS Technical Report

Paper • 2601.15621 • Published Jan 22 • 74

Live Avatar: Streaming Real-time Audio-Driven Avatar Generation with Infinite Length

Paper • 2512.04677 • Published Dec 4, 2025 • 177

Patient-Similarity Cohort Reasoning in Clinical Text-to-SQL

Paper • 2601.09876 • Published Jan 14 • 7

EvoCUA: Evolving Computer Use Agents via Learning from Scalable Synthetic Experience

Paper • 2601.15876 • Published Jan 22 • 92

HERMES: KV Cache as Hierarchical Memory for Efficient Streaming Video Understanding

Paper • 2601.14724 • Published Jan 21 • 75

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Paper • 2601.13836 • Published Jan 20 • 37