Update BucketizerSuite.scala

zhengruifeng · web-flow · commit eaebedbaba51 · 2017-12-05T21:09:12.000+08:00
diff --git a/mllib/src/test/scala/org/apache/spark/ml/feature/BucketizerSuite.scala b/mllib/src/test/scala/org/apache/spark/ml/feature/BucketizerSuite.scala
@@ -109,15 +109,6 @@ class BucketizerSuite extends SparkFunSuite with MLlibTestSparkContext with Defa
           s"The feature value is not correct after bucketing.  Expected $y but found $x")
     }
 
-    test("Bucket should only drop NaN in input columns, with handleInvalid=skip") {
-      val df = spark.createDataFrame(Seq((2.3, 3.0), (Double.NaN, 3.0), (6.7, Double.NaN)
-      )).toDF("a", "b")
-      val splits = Array(Double.NegativeInfinity, 3.0, Double.PositiveInfinity)
-      val bucketizer = new Bucketizer().setInputCol("a").setOutputCol("x").setSplits(splits)
-      bucketizer.setHandleInvalid("skip")
-      assert(bucketizer.transform(df).count() == 2)
-    }
-
     bucketizer.setHandleInvalid("skip")
     val skipResults: Array[Double] = bucketizer.transform(dataFrame)
       .select("result").as[Double].collect()
@@ -132,6 +123,15 @@ class BucketizerSuite extends SparkFunSuite with MLlibTestSparkContext with Defa
     }
   }
 
+  test("Bucketizer should only drop NaN in input columns, with handleInvalid=skip") {
+    val df = spark.createDataFrame(Seq((2.3, 3.0), (Double.NaN, 3.0), (6.7, Double.NaN)))
+      .toDF("a", "b")
+    val splits = Array(Double.NegativeInfinity, 3.0, Double.PositiveInfinity)
+    val bucketizer = new Bucketizer().setInputCol("a").setOutputCol("x").setSplits(splits)
+    bucketizer.setHandleInvalid("skip")
+    assert(bucketizer.transform(df).count() == 2)
+  }
+
   test("Bucket continuous features, with NaN splits") {
     val splits = Array(Double.NegativeInfinity, -0.5, 0.0, 0.5, Double.PositiveInfinity, Double.NaN)
     withClue("Invalid NaN split was not caught during Bucketizer initialization") {