Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

reinforcement-learning

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

62,343

Full-text search

Active filters: reinforcement-learning

LidoHon/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 18, 2022 • 4 • 1

OSalem99/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 18, 2022 • 5

LidoHon/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 19, 2022

Harrier/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Nov 19, 2022 • 10

yizhangliu/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 10, 2023 • 3 • 1

Harrier/Reinforce-CartPole-0

Reinforcement Learning • Updated Nov 20, 2022

Harrier/Reinforce-Pixelcopter-0

Reinforcement Learning • Updated Nov 20, 2022

xaeroq/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 20, 2022

xaeroq/q-Taxi-v3

Reinforcement Learning • Updated Nov 20, 2022

bsmith0430/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 22, 2022 • 4

Harrier/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 21, 2022 • 4

TUMxudashuai/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 22, 2022 • 5

BeeBeaver/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 22, 2022

SweepCake/LunarLander-v2-PPO-HFcourse

Reinforcement Learning • Updated Nov 22, 2022 • 4

motmono/Modified-Reinforce-PixelCopter

Reinforcement Learning • Updated Nov 22, 2022

juansebashr/ppo-LunarLander-v2

Reinforcement Learning • Updated Mar 12, 2023 • 4

Chayo/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 23, 2022 • 4

popolin52/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 23, 2022

xaeroq/dqn-Qbert-v5

Reinforcement Learning • Updated Nov 23, 2022 • 8

kontogiorgos/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 23, 2022

phtutgo/Reinforce01

Reinforcement Learning • Updated Nov 23, 2022

kontogiorgos/q-Taxi-v3

Reinforcement Learning • Updated Nov 23, 2022

TUMxudashuai/DQN-LunarLander-v2

Reinforcement Learning • Updated Nov 23, 2022 • 4

xaeroq/MLAgents-Pyramids

Reinforcement Learning • Updated Nov 23, 2022 • 12

xaeroq/ppo-MsPacman-v5

Reinforcement Learning • Updated Nov 24, 2022 • 9

aspectcisco/ppo-LunarLander-v2

Reinforcement Learning • Updated Nov 24, 2022 • 4

morgansoftware/LunarLander-v2

Reinforcement Learning • Updated Nov 24, 2022 • 4

Galeros/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Nov 24, 2022 • 4

feabries/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Nov 24, 2022

feabries/q-Taxi-v3

Reinforcement Learning • Updated Nov 24, 2022