[SPARK-22465][Core][WIP] Changes after code review

sujithjay · sujithjay · commit 961e3848cea1 · 2017-12-23T20:54:13.000+05:30
diff --git a/core/src/main/scala/org/apache/spark/Partitioner.scala b/core/src/main/scala/org/apache/spark/Partitioner.scala
@@ -60,9 +60,15 @@ object Partitioner {
   def defaultPartitioner(rdd: RDD[_], others: RDD[_]*): Partitioner = {
     val rdds = (Seq(rdd) ++ others)
     val hasPartitioner = rdds.filter(_.partitioner.exists(_.numPartitions > 0))
-    if (hasPartitioner.nonEmpty
-      && isEligiblePartitioner(hasPartitioner.maxBy(_.partitions.length), rdds)) {
-      hasPartitioner.maxBy(_.partitions.length).partitioner.get
+
+    val hasMaxPartitioner = if(hasPartitioner.nonEmpty){
+      Some(hasPartitioner.maxBy(_.partitions.length))
+    } else {
+      None
+    }
+
+    if(isEligiblePartitioner(hasMaxPartitioner, rdds)) {
+      hasMaxPartitioner.get.partitioner.get
     } else {
       if (rdd.context.conf.contains("spark.default.parallelism")) {
         new HashPartitioner(rdd.context.defaultParallelism)
@@ -77,9 +83,12 @@ object Partitioner {
    * less than and within a single order of magnitude of the max number of upstream partitions;
    * otherwise, returns false
    */
-  private def isEligiblePartitioner(hasMaxPartitioner: RDD[_], rdds: Seq[RDD[_]]): Boolean = {
+  private def isEligiblePartitioner(hasMaxPartitioner: Option[RDD[_]], rdds: Seq[RDD[_]]): Boolean = {
+    if(hasMaxPartitioner.isEmpty){
+      return false
+    }
     val maxPartitions = rdds.map(_.partitions.length).max
-    log10(maxPartitions).floor - log10(hasMaxPartitioner.getNumPartitions).floor < 1
+    log10(maxPartitions) - log10(hasMaxPartitioner.get.getNumPartitions) < 1
   }
 }