Torch SB3 QuantilePPO

WIP WIP WIP WIP WIP WIP

simple for now just run

python -m quantileppobenchmark.atariquantileppo

This repository implements Quantile Regression-based reinforcement learning heads and distribution classes, integrated into PPO and World Model architectures.
It follows the ideas from Dabney et al. for Distributional RL and adapts them to continuous and discrete control via PPO.

📦 Requirements

Python 3.9+ (recommended: 3.10 or 3.11)
PyTorch
Stable-Baselines3
Gymnasium + Atari environments
NumPy, TensorBoard, Matplotlib

All dependencies are listed in requirements.txt.

🛠 Setting up a Local Environment

We provide a cross-platform bootstrap to avoid cluttering your global Python installation.

One-time setup

Clone the repo and run:

Linux/macOS

bash setup_env.sh

Windows PowerShell

.\setup_env.ps1

The script:

Creates a .venv/ virtual environment if it doesn’t exist.
Upgrades pip, setuptools, and wheel.
Installs dependencies from requirements.txt.
Prints the correct activation command for your OS.

▶ Activating the Environment

After setup, activate the venv:

Linux/macOS

source .venv/bin/activate

Windows PowerShell

.\.venv\Scripts\Activate.ps1

Deactivate anytime with:

deactivate

🎮 Atari ROM Setup (AutoROM)

If you plan to train Atari environments, install ROMs using:

AutoROM --accept-license

This is required for environments like PongNoFrameskip-v4.

🚀 Training Examples

Atari Pong with QuantilePPO

python atariquantileppo.py --env PongNoFrameskip-v4 --timesteps 1_000_000

📂 Project Structure

quantile_head.py          # Quantile regression head (IQN-style embedding)
quantile_distribution.py  # Distribution wrapper over quantile outputs
quantile_loss.py          # Quantile regression loss
quantileworldmodelexample.py  # Transformer-based ensemble world model using quantile heads
requirements.txt          # All dependencies
setup_env.sh / setup_env.ps1 / bootstrap_env.py  # Environment bootstrap scripts

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
.idea		.idea
plots		plots
quantileppobenchmark		quantileppobenchmark
quantileppoimpl		quantileppoimpl
research_paper		research_paper
utilities		utilities
worldmodelexample		worldmodelexample
README.md		README.md
bootstrap_env.py		bootstrap_env.py
gitignore		gitignore
requirements.txt		requirements.txt
setup_env.ps1		setup_env.ps1
setup_env.sh		setup_env.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Torch SB3 QuantilePPO

📦 Requirements

🛠 Setting up a Local Environment

One-time setup

▶ Activating the Environment

🎮 Atari ROM Setup (AutoROM)

🚀 Training Examples

Atari Pong with QuantilePPO

📂 Project Structure

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

IISuperluminaLII/quantileppo

Folders and files

Latest commit

History

Repository files navigation

Torch SB3 QuantilePPO

📦 Requirements

🛠 Setting up a Local Environment

One-time setup

▶ Activating the Environment

🎮 Atari ROM Setup (AutoROM)

🚀 Training Examples

Atari Pong with QuantilePPO

📂 Project Structure

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages