306

EvalEval Bot

EvalEvalBot

AI & ML interests

None yet

Recent Activity

new activity 37 minutes ago

evaleval/EEE_datastore:results: add 050a9d87d3214015bfb0dbcd46083ec7 (data/terminalbench2-cube/Azure/azure__gpt-5.4-mini/050a9d87d3214015bfb0dbcd46083ec7.json)

new activity about 13 hours ago

evaleval/EEE_datastore:[Submission] Artificial Analysis - Add Claude Fable 5 + refresh Anthropic models

new activity about 13 hours ago

evaleval/EEE_datastore:[Submission] Vals.ai - Add Claude Fable 5 + refresh Anthropic models

View all activity

Organizations

New activity in evaleval/EEE_datastore 37 minutes ago

results: add 050a9d87d3214015bfb0dbcd46083ec7 (data/terminalbench2-cube/Azure/azure__gpt-5.4-mini/050a9d87d3214015bfb0dbcd46083ec7.json)

#148 opened 41 minutes ago by

recursix

New activity in evaleval/EEE_datastore about 13 hours ago

[Submission] Artificial Analysis - Add Claude Fable 5 + refresh Anthropic models

🚀 1

#146 opened about 23 hours ago by

andrewtran117

[Submission] Vals.ai - Add Claude Fable 5 + refresh Anthropic models

#147 opened about 22 hours ago by

andrewtran117

New activity in moonshotai/Kimi-K2.5 3 days ago

Add EvalEval community eval results

#127 opened 3 days ago by

EvalEvalBot

New activity in moonshotai/Kimi-K2.5 5 days ago

Add GPQA Diamond and HLE eval results

#126 opened 5 days ago by

EvalEvalBot

Add EvalEval community eval results

#125 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Llama-3.2-90B-Vision-Instruct 6 days ago

Add EvalEval community eval results

#34 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Llama-3.3-70B-Instruct 6 days ago

Add EvalEval community eval results

#162 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Meta-Llama-3-8B-Instruct 6 days ago

Add EvalEval community eval results

#268 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Meta-Llama-3-8B 6 days ago

Add EvalEval community eval results

#281 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Meta-Llama-3-70B-Instruct 6 days ago

Add EvalEval community eval results

#77 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Meta-Llama-3-70B 6 days ago

Add EvalEval community eval results

#25 opened 6 days ago by

EvalEvalBot

New activity in CohereLabs/tiny-aya-global 6 days ago

Add EvalEval community eval results

#11 opened 6 days ago by

EvalEvalBot

New activity in CohereLabs/c4ai-command-r7b-12-2024 6 days ago

Add EvalEval community eval results

#18 opened 6 days ago by

EvalEvalBot

New activity in CohereLabs/c4ai-command-r-08-2024 6 days ago

Add EvalEval community eval results

#12 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Llama-3.2-3B 6 days ago

Add EvalEval community eval results

#84 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Llama-3.2-1B-Instruct 6 days ago

Add EvalEval community eval results

#179 opened 6 days ago by

EvalEvalBot

New activity in meta-llama/Llama-3.2-1B 6 days ago

Add EvalEval community eval results

#361 opened 6 days ago by

EvalEvalBot

New activity in CohereLabs/command-a-reasoning-08-2025 6 days ago

Add EvalEval community eval results

#9 opened 6 days ago by

EvalEvalBot

New activity in CohereLabs/c4ai-command-r-plus-08-2024 6 days ago

Add EvalEval community eval results

#11 opened 6 days ago by

EvalEvalBot

EvalEval Bot

AI & ML interests

Recent Activity

Organizations

EvalEvalBot's activity

results: add 050a9d87d3214015bfb0dbcd46083ec7 (data/terminalbench2-cube/Azure/azure__gpt-5.4-mini/050a9d87d3214015bfb0dbcd46083ec7.json)

[Submission] Artificial Analysis - Add Claude Fable 5 + refresh Anthropic models

[Submission] Vals.ai - Add Claude Fable 5 + refresh Anthropic models

Add EvalEval community eval results

Add GPQA Diamond and HLE eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results

Add EvalEval community eval results