38 18 8

Hamish Ivison

hamishivi

https://ivison.id.au

AI & ML interests

NLP :)

Recent Activity

upvoted a paper 6 days ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

updated a model 10 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite__1__1764018132_step_2450

published a model 10 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite__1__1764018132_step_2450

View all activity

Organizations

upvoted a paper 6 days ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Paper • 2511.21689 • Published 13 days ago • 99

updated a model 10 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11764018132_step_2450

8B • Updated 10 days ago • 31

published a model 10 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11764018132_step_2450

8B • Updated 10 days ago • 31

updated a model 13 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step_1300

8B • Updated 13 days ago • 27

published a model 13 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step_1300

8B • Updated 13 days ago • 27

updated a model 14 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_3160511762886037_checkpoints_step_1300

8B • Updated 14 days ago • 23

published a model 14 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_3160511762886037_checkpoints_step_1300

8B • Updated 14 days ago • 23

authored 2 papers 14 days ago

RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments

Paper • 2511.07317 • Published 29 days ago • 13

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 15 days ago • 54

updated 2 datasets 15 days ago

rl-research/dr-tulu-rl-data

Viewer • Updated 15 days ago • 4.88k • 484 • 12

rl-research/dr-tulu-sft-data

Viewer • Updated 15 days ago • 13.1k • 769 • 24

updated 2 models 15 days ago

rl-research/DR-Tulu-SFT-8B

Text Generation • 8B • Updated 11 days ago • 343 • 5

rl-research/DR-Tulu-8B

Text Generation • 8B • Updated 7 days ago • 1.5k • 68

upvoted a paper 15 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 15 days ago • 54

updated a collection 15 days ago

DR Tulu

Collection

Models and data associated with DR Tulu, http://allenai-web/papers/drtulu • 5 items • Updated 15 days ago • 31

commented a paper 15 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 15 days ago • 54 •

updated a model 16 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step1900

8B • Updated 16 days ago • 32

published a model 16 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step1900

8B • Updated 16 days ago • 32

updated a model 19 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_checkpoints_step_1700

8B • Updated 19 days ago • 122

published a model 19 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_checkpoints_step_1700

8B • Updated 19 days ago • 122

Hamish Ivison

AI & ML interests

Recent Activity

Organizations

hamishivi's activity