Fixed Torch Backend, added test

- Now torch backend should provide a proper packed sequence - added test to ensure that the packed sequences actually works
MushroomRL · Dec 6, 2023 · f56d3bc · f56d3bc
1 parent e5de4fb
commit f56d3bc
Show file tree

Hide file tree

Showing 2 changed files with 75 additions and 1 deletion.
diff --git a/mushroom_rl/core/_impl/array_backend.py b/mushroom_rl/core/_impl/array_backend.py
@@ -137,7 +137,7 @@ def pack_padded_sequence(array, lengths):
 
         new_shape = (shape[0]*shape[1], ) + shape[2:]
         mask = (torch.arange(len(array), device=TorchUtils.get_device())[None, :] < lengths[:, None]).flatten()
-        return array.reshape(new_shape)[mask]
+        return array.transpose(0,1).reshape(new_shape)[mask]
 
 
 class ListBackend(ArrayBackend):

diff --git a/tests/core/test_array_backend.py b/tests/core/test_array_backend.py
@@ -0,0 +1,74 @@
+import torch
+import numpy as np
+from mushroom_rl.core._impl import NumpyBackend, TorchBackend
+
+
+def sequence_generator():
+    list_n_steps = np.random.randint(2, 10, 100)
+    list_n_envs = np.random.randint(2, 20, 100)
+    list_n_dim = np.random.randint(1, 10, 100)
+
+    for n_steps, n_envs, n_dim in zip(list_n_steps, list_n_envs, list_n_dim):
+        lengths = np.random.randint(1, n_steps, size=(n_envs,))
+
+        array = list()
+
+        for d in range(n_dim):
+            offset_dim = 10 * d
+
+            array_dim = list()
+            for e in range(n_envs):
+                offset_env = 100 * e
+                array_env_dim = offset_dim + offset_env + np.arange(0, n_steps)
+
+                array_dim.append(array_env_dim)
+
+            array_dim = np.stack(array_dim).T
+
+            array.append(array_dim)
+
+        array = np.stack(array, axis=-1).squeeze()
+
+        yield array, lengths
+
+
+def test_pack_sequance_numpy():
+    for array, lengths in sequence_generator():
+        print('################################## Numpy')
+        print('original')
+        print(array)
+
+        print('lengths')
+        print(lengths)
+
+        packed_array = NumpyBackend.pack_padded_sequence(array, lengths)
+        print('packed')
+        print(packed_array)
+
+        desired_array = np.concatenate([array[:l, i] for i, l in enumerate(lengths)])
+        print('desired')
+        print(desired_array)
+
+        assert np.array_equal(desired_array, packed_array)
+
+
+def test_pack_sequance_torch():
+    for array, lengths in sequence_generator():
+        torch_array = torch.as_tensor(array)
+        torch_lengths = torch.as_tensor(lengths)
+
+        print('original')
+        print(torch_array)
+
+        print('lengths')
+        print(torch_lengths)
+
+        packed_array = TorchBackend.pack_padded_sequence(torch_array, torch_lengths)
+        print('packed')
+        print(packed_array)
+
+        desired_array = torch.concatenate([torch_array[:l, i] for i, l in enumerate(torch_lengths)])
+        print('desired')
+        print(desired_array)
+
+        assert torch.equal(packed_array, desired_array)