hannahbillo
/

dpo-llama3-8b-sample-rules

Generated from Trainer

Model card Files Files and versions

Metrics Training metrics Community

dpo-llama3-8b-sample-rules

72.2 MB

1 contributor

History: 16 commits

hannahbillo's picture

End of training

56238db verified over 1 year ago