3 31 26

Simon Aytes

saytes

https://www.saytes.io

SimonAytes

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

You Only Judge Once: Multi-response Reward Modeling in a Single Forward Pass

upvoted a paper 2 months ago

THINKSAFE: Self-Generated Safety Alignment for Reasoning Models

updated a model 3 months ago

saytes/sft-Qwen-14B-lora-20260115

View all activity

Organizations

upvoted a paper 2 days ago

You Only Judge Once: Multi-response Reward Modeling in a Single Forward Pass

Paper • 2604.10966 • Published 4 days ago • 8

upvoted a paper 2 months ago

THINKSAFE: Self-Generated Safety Alignment for Reasoning Models

Paper • 2601.23143 • Published Jan 30 • 39

updated a model 3 months ago

saytes/sft-Qwen-14B-lora-20260115

Updated Jan 18

published a model 3 months ago

saytes/sft-Qwen-14B-lora-20260115

Updated Jan 18

updated a model 3 months ago

saytes/sft-Qwen-14B-merged-20260115

15B • Updated Jan 18

published a model 3 months ago

saytes/sft-Qwen-14B-merged-20260115

15B • Updated Jan 18

updated a model 3 months ago

saytes/sft-deepseek-r1-14b-merged-controlTokens-20250811

15B • Updated Jan 12

updated a dataset 3 months ago

saytes/sft_reasoning_training_data

Viewer • Updated Jan 12 • 83.1k • 9

published a dataset 3 months ago

saytes/sft_reasoning_training_data

Viewer • Updated Jan 12 • 83.1k • 9

published a model 3 months ago

saytes/sft-deepseek-r1-14b-merged-controlTokens-20250811

15B • Updated Jan 12

updated a model 3 months ago

saytes/DS_CT_20250811_7B

8B • Updated Jan 7

published 5 models 3 months ago

updated 4 models 3 months ago

saytes/sft-Qwen-14B-lora-controlTokens-20250928

Updated Jan 6

saytes/sft-Qwen-7B-lora-controlTokens-20250925

Updated Jan 6

saytes/sft-deepseek-r1-14b-lora-controlTokens-20250811

Updated Jan 6

saytes/sft-deepseek-r1-7b-lora-controlTokens-20250925

Updated Jan 6

Simon Aytes

AI & ML interests

Recent Activity

Organizations

saytes's activity