sean's picture

1 1

sean

seangogo

AI & ML interests

None yet

Organizations

None yet

seangogo 's models 22

seangogo/qwen3_0pt6b_awq

seangogo/qwen3_0.6b_awq

Updated Jan 6 • 2

seangogo/qwen3-0.6b-awq

Updated Jan 6 • 4

seangogo/summary_from_human_feedback_grpo_100

Feature Extraction • 0.5B • Updated Nov 16, 2025

seangogo/dpo_summary_from_human_feedback

Feature Extraction • 0.5B • Updated Nov 11, 2025 • 1

seangogo/Qwen2.5-1.5B_reward_model_v2_normalized

Feature Extraction • 2B • Updated Nov 8, 2025

seangogo/Qwen2.5-1.5B_reward_model_v2

Feature Extraction • 2B • Updated Nov 7, 2025

seangogo/Qwen2.5-1.5B_reward_model

2B • Updated Nov 7, 2025

seangogo/poca-SoccerTwos-v2

Reinforcement Learning • Updated Oct 16, 2024 • 1

seangogo/poca-SoccerTwos

Updated Oct 16, 2024

seangogo/ppo-SnowballTarget-real

Reinforcement Learning • Updated Oct 8, 2024 • 1

seangogo/ppo-SnowballTarget

Reinforcement Learning • Updated Oct 8, 2024 • 6

seangogo/a2c-PandaReachDense-v3

Reinforcement Learning • Updated Oct 4, 2024 • 4

seangogo/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Oct 3, 2024

seangogo/ppo-CartPole-v1-ppo-from-scratch

Reinforcement Learning • Updated Oct 2, 2024

seangogo/Reinforce-PixelCopter-v2

Reinforcement Learning • Updated Sep 24, 2024

seangogo/Reinforce-PixelCopter

Reinforcement Learning • Updated Sep 24, 2024

seangogo/Reinforce-CartPole-v1

Reinforcement Learning • Updated Sep 23, 2024

seangogo/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Sep 21, 2024 • 10

seangogo/Taxi-v3

Reinforcement Learning • Updated Sep 19, 2024

seangogo/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Sep 18, 2024

seangogo/ppo-LunarLander-v2

Reinforcement Learning • Updated Sep 15, 2024 • 5