AI & ML interests
None yet
Organizations
None yet
ketchup123/DPO_ablations_llama_codepreferences_pref_filter_only
ketchup123/DPO_ablations_llama_orpo_pref_filter_only
ketchup123/DPO_ablations_llama_helpsteer_pref_filter_only
Updated
ketchup123/DPO_ablations_llama_ultrafeedback_pref_filter_only
Updated
ketchup123/DPO_ablations_llama_tulu_pref_filter_only
Updated
ketchup123/DPO_apertus_orpo
Updated
ketchup123/DPO_apertus_helpsteer
ketchup123/DPO_apertus_ultrafeedback
Updated
ketchup123/DPO_apertus_codepreferences
Updated
ketchup123/DPO_apertus_option_d
ketchup123/DPO_apertus_option_f
ketchup123/DPO_smollm_2_ultramix_no_pref_filter
Updated
ketchup123/DPO_apertus_tuluDPO
ketchup123/DPO_apertus_option_a
ketchup123/apertus_8B_SFT
Text Generation
• 8B • Updated • 4
ketchup123/DPO_olmo_2_1B_option_f
ketchup123/DPO_olmo_2_1B_codepreferences
Updated
ketchup123/DPO_olmo_2_1B_ultrafeedback
Updated
ketchup123/DPO_olmo_2_1B_orpo
ketchup123/DPO_olmo_2_1B_helpsteer
ketchup123/DPO_olmo_2_1B_option_d
Updated
ketchup123/DPO_olmo_2_1B_option_a
ketchup123/DPO_olmo_2_1B_tuluDPO
Updated
ketchup123/DPO_olmo_2_7B_orpo
Updated
ketchup123/DPO_olmo_2_7B_helpsteer
ketchup123/DPO_olmo_2_7B_codepreferences
Updated
ketchup123/DPO_olmo_2_7B_option_f
ketchup123/DPO_olmo_2_7B_ultrafeedback
Updated
ketchup123/DPO_olmo_2_7B_tuluDPO
Updated
ketchup123/DPO_olmo_2_7B_option_d
Updated