RumbleDB · ghislainfourny · Jun 14, 2022 · Jun 14, 2022 · Nov 7, 2022 · May 4, 2023
@@ -219,32 +219,32 @@
         </dependency>
         <dependency>
             <groupId>org.apache.spark</groupId>
-            <artifactId>spark-core_2.12</artifactId>
-            <version>3.4.2</version>
+            <artifactId>spark-core_2.13</artifactId>
+            <version>3.5.1</version>
             <scope>provided</scope>
         </dependency>
         <dependency>
             <groupId>org.apache.spark</groupId>
-            <artifactId>spark-sql_2.12</artifactId>
-            <version>3.4.2</version>
+            <artifactId>spark-sql_2.13</artifactId>
+            <version>3.5.1</version>
             <scope>provided</scope>
         </dependency>
         <dependency>
             <groupId>org.apache.spark</groupId>
-            <artifactId>spark-mllib_2.12</artifactId>
-            <version>3.4.2</version>
+            <artifactId>spark-mllib_2.13</artifactId>
+            <version>3.5.1</version>
             <scope>provided</scope>
         </dependency>
         <dependency>
             <groupId>org.apache.hadoop</groupId>
-             <artifactId>hadoop-aws</artifactId>
-            <version>3.3.2</version>
+            <artifactId>hadoop-aws</artifactId>
+            <version>3.3.6</version>
             <scope>provided</scope>
         </dependency>
         <dependency>
             <groupId>org.apache.spark</groupId>
-            <artifactId>spark-avro_2.12</artifactId>
-            <version>3.4.2</version>
+            <artifactId>spark-avro_2.13</artifactId>
+            <version>3.5.1</version>
         </dependency>
         <dependency>
             <groupId>org.antlr</groupId>
@@ -292,11 +292,11 @@
             <artifactId>httpclient</artifactId>
             <version>4.5.13</version>
         </dependency>
-	<!--<dependency>
-	    <groupId>edu.vanderbilt.accre</groupId>
-	    <artifactId>laurelin</artifactId>
-	    <version>1.0.1</version>
-	</dependency>-->
+        <!--<dependency>
+            <groupId>edu.vanderbilt.accre</groupId>
+            <artifactId>laurelin</artifactId>
+            <version>1.0.1</version>
+        </dependency>-->
         <dependency>
             <groupId>org.jgrapht</groupId>
             <artifactId>jgrapht-core</artifactId>
@@ -310,12 +310,12 @@
         <dependency>
             <groupId>com.fasterxml.jackson.dataformat</groupId>
             <artifactId>jackson-dataformat-yaml</artifactId>
-            <version>2.13.4</version>
+            <version>2.15.2</version>
         </dependency>
         <dependency>
             <groupId>io.delta</groupId>
-            <artifactId>delta-core_2.12</artifactId>
-            <version>2.4.0</version>
+            <artifactId>delta-spark_2.13</artifactId>
+            <version>3.2.1</version>
         </dependency>
     </dependencies>
 

@@ -36,16 +36,6 @@ public class Main {
     public static RumbleJLineShell terminal = null;
 
     public static void main(String[] args) throws IOException {
-        String javaVersion = System.getProperty("java.version");
-        if (!javaVersion.startsWith("11.") && !javaVersion.startsWith("17.")) {
-            System.err.println("[Error] RumbleDB requires Java 11 or 17.");
-            System.err.println("Your Java version: " + System.getProperty("java.version"));
-            System.err.println("You can download Java 11 or 17 from https://adoptium.net/");
-            System.err.println(
-                "If you do have Java 11 or 17, but the wrong version appears above, then it means you need to set your JAVA_HOME environment variable properly to point to Java 11 or 17."
-            );
-            System.exit(43);
-        }
         RumbleRuntimeConfiguration sparksoniqConf = null;
         // Parse arguments
         try {

@@ -1048,7 +1048,7 @@ public StaticContext visitExitStatement(ExitStatement exitStatement, StaticConte
         return argument;
     }
 
-    private ExecutionMode getHighestExecutionMode(ExecutionMode firstExecMode, ExecutionMode secondExecMode) {
+    private static ExecutionMode getHighestExecutionMode(ExecutionMode firstExecMode, ExecutionMode secondExecMode) {
         if (firstExecMode == ExecutionMode.UNSET || secondExecMode == ExecutionMode.UNSET) {
             return ExecutionMode.UNSET;
         }

@@ -46,13 +46,14 @@
 import org.rumbledb.types.BuiltinTypesCatalogue;
 import org.rumbledb.types.FieldDescriptor;
 import org.rumbledb.types.ItemType;
-import scala.collection.mutable.WrappedArray;
+import scala.collection.immutable.ArraySeq;
+import scala.collection.Iterator;
+
 import sparksoniq.spark.SparkSessionManager;
 
 import java.io.IOException;
 import java.io.Serializable;
 import java.io.StringReader;
-import java.lang.reflect.Array;
 import java.math.BigDecimal;
 import java.math.BigInteger;
 import java.sql.Date;
@@ -589,9 +590,15 @@ private static Item convertValueToItem(
                 }
             } else {
                 @SuppressWarnings("unchecked")
-                Object arrayObject = ((WrappedArray<Object>) o).array();
-                for (int index = 0; index < Array.getLength(arrayObject); index++) {
-                    Object value = Array.get(arrayObject, index);
+                Iterator<Object> iterator = null;
+                if (o instanceof scala.collection.mutable.ArraySeq) {
+                    iterator = ((scala.collection.mutable.ArraySeq<Object>) o).iterator();
+                } else {
+                    iterator = ((ArraySeq<Object>) o).iterator();
+                }
+                while (iterator.hasNext()) {
+                    Object value = iterator.next();
+
                     members.add(convertValueToItem(value, dataType, metadata, memberType));
                 }
             }

@@ -1,4 +1,4 @@
-// Generated from ./src/main/java/org/rumbledb/parser/XQueryLexer.g4 by ANTLR 4.8
+// Generated from ./src/main/java/org/rumbledb/parser/XQueryLexer.g4 by ANTLR 4.9.3
 
 // Java header
 package org.rumbledb.parser;
@@ -18,7 +18,7 @@
 
 @SuppressWarnings({"all", "warnings", "unchecked", "unused", "cast"})
 public class XQueryLexer extends Lexer {
-	static { RuntimeMetaData.checkVersion("4.8", RuntimeMetaData.VERSION); }
+	static { RuntimeMetaData.checkVersion("4.9.3", RuntimeMetaData.VERSION); }
 
 	protected static final DFA[] _decisionToDFA;
 	protected static final PredictionContextCache _sharedContextCache =

@@ -1,4 +1,4 @@
-// Generated from ./src/main/java/org/rumbledb/parser/XQueryParser.g4 by ANTLR 4.8
+// Generated from ./src/main/java/org/rumbledb/parser/XQueryParser.g4 by ANTLR 4.9.3
 
 // Java header
 package org.rumbledb.parser;
@@ -25,7 +25,7 @@
 
 @SuppressWarnings({"all", "warnings", "unchecked", "unused", "cast"})
 public class XQueryParser extends Parser {
-	static { RuntimeMetaData.checkVersion("4.8", RuntimeMetaData.VERSION); }
+	static { RuntimeMetaData.checkVersion("4.9.3", RuntimeMetaData.VERSION); }
 
 	protected static final DFA[] _decisionToDFA;
 	protected static final PredictionContextCache _sharedContextCache =

@@ -1,4 +1,4 @@
-// Generated from ./src/main/java/org/rumbledb/parser/XQueryParser.g4 by ANTLR 4.8
+// Generated from ./src/main/java/org/rumbledb/parser/XQueryParser.g4 by ANTLR 4.9.3
 
 // Java header
 package org.rumbledb.parser;

@@ -1,4 +1,4 @@
-// Generated from ./src/main/java/org/rumbledb/parser/XQueryParser.g4 by ANTLR 4.8
+// Generated from ./src/main/java/org/rumbledb/parser/XQueryParser.g4 by ANTLR 4.9.3
 
 // Java header
 package org.rumbledb.parser;

@@ -86,7 +86,8 @@
 import com.esotericsoftware.kryo.io.Input;
 import com.esotericsoftware.kryo.io.Output;
 
-import scala.collection.mutable.WrappedArray;
+import scala.collection.immutable.ArraySeq;
+import scala.collection.Iterator;
 import sparksoniq.spark.SparkSessionManager;
 
 public class FlworDataFrameUtils {
@@ -807,19 +808,20 @@ private static Object deserializeByteArray(byte[] toDeserialize, Kryo kryo, Inpu
     }
 
     public static void deserializeWrappedParameters(
-            WrappedArray<byte[]> wrappedParameters,
+            ArraySeq<byte[]> wrappedParameters,
             List<List<Item>> deserializedParams,
             Kryo kryo,
             Input input
     ) {
-        Object[] serializedParams = (Object[]) wrappedParameters.array();
-        for (Object serializedParam : serializedParams) {
-            if (serializedParam == null) {
+        Iterator<byte[]> iterator = wrappedParameters.iterator();
+        while (iterator.hasNext()) {
+            byte[] bytes = iterator.next();
+            if (bytes == null) {
                 deserializedParams.add(Collections.emptyList());
                 continue;
             }
             @SuppressWarnings("unchecked")
-            List<Item> deserializedParam = (List<Item>) deserializeByteArray((byte[]) serializedParam, kryo, input);
+            List<Item> deserializedParam = (List<Item>) deserializeByteArray((byte[]) bytes, kryo, input);
             deserializedParams.add(deserializedParam);
         }
     }

@@ -25,12 +25,14 @@
 import org.rumbledb.api.Item;
 import org.rumbledb.exceptions.OurBadException;
 
-import scala.collection.mutable.WrappedArray;
+import scala.collection.immutable.ArraySeq;
+import scala.collection.Iterator;
+
 
 import java.util.ArrayList;
 import java.util.List;
 
-public class GroupClauseArrayMergeAggregateResultsUDF implements UDF1<WrappedArray<Object>, Object[]> {
+public class GroupClauseArrayMergeAggregateResultsUDF implements UDF1<ArraySeq<Object>, Object[]> {
 
 
     private static final long serialVersionUID = 1L;
@@ -43,22 +45,23 @@ public GroupClauseArrayMergeAggregateResultsUDF() {
     }
 
     @Override
-    public Object[] call(WrappedArray<Object> wrappedParameters) {
+    public Object[] call(ArraySeq<Object> wrappedParameters) {
         this.nextResult.clear();
         this.deserializedParams.clear();
         List<Object> result = new ArrayList<Object>();
-        Object[] insideArrays = (Object[]) wrappedParameters.array();
-        for (Object o : insideArrays) {
+        Iterator<Object> iterator = wrappedParameters.iterator();
+        while (iterator.hasNext()) {
+            Object o = iterator.next();
             if (o instanceof Row) {
                 Row row = (Row) o;
                 result.add(row);
             }
-            if (o instanceof WrappedArray) {
-                @SuppressWarnings("rawtypes")
-                WrappedArray wrappedArray = (WrappedArray) o;
-                Object[] insideArrays2 = (Object[]) wrappedArray.array();
-                for (Object p : insideArrays2)
-                    result.add(p);
+            if (o instanceof ArraySeq) {
+                @SuppressWarnings("unchecked")
+                ArraySeq<Object> arraySeq = (ArraySeq<Object>) o;
+                Iterator<Object> iterator2 = arraySeq.iterator();
+                while (iterator2.hasNext())
+                    result.add(iterator2.next());
             } else {
                 throw new OurBadException("We cannot process " + o.getClass().getCanonicalName());
             }

@@ -23,12 +23,12 @@
 import org.apache.spark.sql.api.java.UDF1;
 import org.rumbledb.api.Item;
 import org.rumbledb.runtime.flwor.FlworDataFrameUtils;
-import scala.collection.mutable.WrappedArray;
+import scala.collection.immutable.ArraySeq;
 
 import java.util.ArrayList;
 import java.util.List;
 
-public class GroupClauseSerializeAggregateResultsUDF implements UDF1<WrappedArray<byte[]>, byte[]> {
+public class GroupClauseSerializeAggregateResultsUDF implements UDF1<ArraySeq<byte[]>, byte[]> {
 
 
     private static final long serialVersionUID = 1L;
@@ -43,7 +43,7 @@ public GroupClauseSerializeAggregateResultsUDF() {
     }
 
     @Override
-    public byte[] call(WrappedArray<byte[]> wrappedParameters) {
+    public byte[] call(ArraySeq<byte[]> wrappedParameters) {
         this.nextResult.clear();
         this.deserializedParams.clear();
         FlworDataFrameUtils.deserializeWrappedParameters(

@@ -9,54 +9,37 @@ If you do not want to install Spark, then you need to use the standalone jar
 instead from www.rumbledb.org.
 
 Usage:
-spark-submit <Spark arguments> <path to RumbleDB's jar> <mode> <parameters>
+rumbledb <mode> <parameters>
 
 The first optional argument specifies the mode:
 **** run ****
 for directly running a query from an input file or (with -q) provided directly on the command line.
 
 It is the default mode.
 
-spark-submit rumbledb-1.22.0.jar run my-query.jq
-spark-submit rumbledb-1.22.0.jar run -q '1+1'
+rumbledb run my-query.jq
+rumbledb run -q '1+1'
 
 You can specify an output path with -o like so:
-spark-submit rumbledb-1.22.0.jar run -q '1+1' -o my-output.txt
+rumbledb run -q '1+1' -o my-output.txt
 
 **** serve ****
 for running as an HTTP server listening on the specified port (-p) and host (-h).
 
-spark-submit rumbledb-1.22.0.jar serve -p 9090
+rumbledb serve -p 9090
 
 RumbleDB also supports Apache Livy for use in Jupyter notebooks, which may be
 even more convenient if you are using a cluster.
 
 **** repl ****
 for shell mode.
 
-spark-submit rumbledb-1.22.0.jar repl
+rumbledb repl
 
 
 **** resource use configuration ****
 
-For a local use, you can control the number of cores, as well as allocated
-memory, with:
-spark-submit --master local[*] rumbledb-1.22.0.jar repl
-spark-submit --master local[*] rumbledb-1.22.0.jar repl
-spark-submit --master local[2] rumbledb-1.22.0.jar repl
-spark-submit --master local[*] --driver-memory 10G rumbledb-1.22.0.jar repl
-
-You can use RumbleDB remotely with:
-spark-submit --master yarn rumbledb-1.22.0.jar repl
-
-(Although for clusters provided as a service, --master yarn is often implicit
-and unnecessary).
-
-For remote use (e.g., logged in on the Spark cluster with ssh), you can set the
-number of executors, cores and memory, you can use:
-spark-submit --executor-cores 3 --executor-memory 5G rumbledb-1.22.0.jar repl
-
-For remote use, you can also use other file system paths such as S3, HDFS, etc:
-spark-submit rumbledb-1.22.0.jar run hdfs://server:port/my-query.jq -o hdfs://server:port/my-output.json
+The docker edition of RumbleDB cannot change the number of cores or the memory allocation.
+If you wish to do so, you could consider using the standalone RumbleDB jar.
 
 More documentation on available CLI parameters is available on https://www.rumbledb.org/
@@ -21,6 +21,7 @@
 package iq;
 
 import iq.base.AnnotationsTestsBase;
+import scala.Function0;
 import scala.util.Properties;
 
 import org.apache.spark.SparkConf;
@@ -51,7 +52,12 @@ public class Bugs extends AnnotationsTestsBase {
     public static final String javaVersion =
         System.getProperty("java.version");
     public static final String scalaVersion =
-        Properties.scalaPropOrElse("version.number", "unknown");
+        Properties.scalaPropOrElse("version.number", new Function0<String>() {
+            @Override
+            public String apply() {
+                return "unknown";
+            }
+        });
     protected static List<File> _testFiles = new ArrayList<>();
     protected final File testFile;
 

@@ -38,6 +38,7 @@
 import org.rumbledb.api.Item;
 import org.rumbledb.api.SequenceOfItems;
 import scala.util.Properties;
+import scala.Function0;
 import sparksoniq.spark.SparkSessionManager;
 import utils.FileManager;
 
@@ -58,7 +59,12 @@ public class DeltaUpdateRuntimeTests extends AnnotationsTestsBase {
     public static final String javaVersion =
         System.getProperty("java.version");
     public static final String scalaVersion =
-        Properties.scalaPropOrElse("version.number", "unknown");
+        Properties.scalaPropOrElse("version.number", new Function0<String>() {
+            @Override
+            public String apply() {
+                return "unknown";
+            }
+        });
 
     public RumbleRuntimeConfiguration getConfiguration() {
         return new RumbleRuntimeConfiguration(