v0.1.0

msbaines released this 01 Dec 22:18

1db8bbd

Added

ShardedDataParallel with autoreduce (#157)
cpu support for Pipe (#188)
ShardedOptim: Distributed Grad Scaler (for torch AMP) (#182)
OSS-aware clip grads, bridge sharded states (#167)
oss: add rank_local_state_dict staticmethod (#174)
support for PyTorch 1.7.0 (#171)
Add implementation of AdaScale (#139)

Fixed

pip package install (#196, #200)

Assets 2