minor comments

cloud-fan · cloud-fan · commit adf7d333bf97 · 2017-03-21T09:31:22.000+08:00
diff --git a/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/util/FailureSafeParser.scala b/sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/util/FailureSafeParser.scala
@@ -42,8 +42,8 @@ class FailureSafeParser[IN](
       (row, badRecord) => {
         var i = 0
         while (i < actualSchema.length) {
-          val f = actualSchema(i)
-          resultRow(schema.fieldIndex(f.name)) = row.map(_.get(i, f.dataType)).orNull
+          val from = actualSchema(i)
+          resultRow(schema.fieldIndex(from.name)) = row.map(_.get(i, from.dataType)).orNull
           i += 1
         }
         resultRow(corruptFieldIndex.get) = badRecord()
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/DataFrameReader.scala b/sql/core/src/main/scala/org/apache/spark/sql/DataFrameReader.scala
@@ -383,11 +383,12 @@ class DataFrameReader private[sql](sparkSession: SparkSession) extends Logging {
     }
 
     verifyColumnNameOfCorruptRecord(schema, parsedOptions.columnNameOfCorruptRecord)
-    val dataSchema = StructType(schema.filterNot(_.name == parsedOptions.columnNameOfCorruptRecord))
+    val actualSchema =
+      StructType(schema.filterNot(_.name == parsedOptions.columnNameOfCorruptRecord))
 
     val createParser = CreateJacksonParser.string _
     val parsed = jsonDataset.rdd.mapPartitions { iter =>
-      val rawParser = new JacksonParser(dataSchema, parsedOptions)
+      val rawParser = new JacksonParser(actualSchema, parsedOptions)
       val parser = new FailureSafeParser[String](
         input => rawParser.parse(input, createParser, UTF8String.fromString),
         parsedOptions.parseMode,
@@ -442,14 +443,15 @@ class DataFrameReader private[sql](sparkSession: SparkSession) extends Logging {
     }
 
     verifyColumnNameOfCorruptRecord(schema, parsedOptions.columnNameOfCorruptRecord)
-    val dataSchema = StructType(schema.filterNot(_.name == parsedOptions.columnNameOfCorruptRecord))
+    val actualSchema =
+      StructType(schema.filterNot(_.name == parsedOptions.columnNameOfCorruptRecord))
 
     val linesWithoutHeader: RDD[String] = maybeFirstLine.map { firstLine =>
       filteredLines.rdd.mapPartitions(CSVUtils.filterHeaderLine(_, firstLine, parsedOptions))
     }.getOrElse(filteredLines.rdd)
 
     val parsed = linesWithoutHeader.mapPartitions { iter =>
-      val rawParser = new UnivocityParser(dataSchema, parsedOptions)
+      val rawParser = new UnivocityParser(actualSchema, parsedOptions)
       val parser = new FailureSafeParser[String](
         input => Seq(rawParser.parse(input)),
         parsedOptions.parseMode,
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/execution/datasources/csv/UnivocityParser.scala b/sql/core/src/main/scala/org/apache/spark/sql/execution/datasources/csv/UnivocityParser.scala
@@ -51,7 +51,7 @@ class UnivocityParser(
   private val row = new GenericInternalRow(requiredSchema.length)
 
   // Retrieve the raw record string.
-  private def getCurrentInput(): UTF8String = {
+  private def getCurrentInput: UTF8String = {
     UTF8String.fromString(tokenizer.getContext.currentParsedContent().stripLineEnd)
   }
 
@@ -207,7 +207,7 @@ class UnivocityParser(
         }
       }
       throw BadRecordException(
-        () => getCurrentInput(),
+        () => getCurrentInput,
         getPartialResult,
         new RuntimeException("Malformed CSV record"))
     } else {
@@ -221,7 +221,7 @@ class UnivocityParser(
         row
       } catch {
         case NonFatal(e) =>
-          throw BadRecordException(() => getCurrentInput(), () => None, e)
+          throw BadRecordException(() => getCurrentInput, () => None, e)
       }
     }
   }

Original file line number	Diff line number	Diff line change
`@@ -51,7 +51,7 @@ class UnivocityParser(`
`51`	`51`	`private val row = new GenericInternalRow(requiredSchema.length)`
`52`	`52`
`53`	`53`	`// Retrieve the raw record string.`
`54`		`- private def getCurrentInput(): UTF8String = {`
	`54`	`+ private def getCurrentInput: UTF8String = {`
`55`	`55`	`UTF8String.fromString(tokenizer.getContext.currentParsedContent().stripLineEnd)`
`56`	`56`	`}`
`57`	`57`
`@@ -207,7 +207,7 @@ class UnivocityParser(`
`207`	`207`	`}`
`208`	`208`	`}`
`209`	`209`	`throw BadRecordException(`
`210`		`- () => getCurrentInput(),`
	`210`	`+ () => getCurrentInput,`
`211`	`211`	`getPartialResult,`
`212`	`212`	`new RuntimeException("Malformed CSV record"))`
`213`	`213`	`} else {`
`@@ -221,7 +221,7 @@ class UnivocityParser(`
`221`	`221`	`row`
`222`	`222`	`} catch {`
`223`	`223`	`case NonFatal(e) =>`
`224`		`- throw BadRecordException(() => getCurrentInput(), () => None, e)`
	`224`	`+ throw BadRecordException(() => getCurrentInput, () => None, e)`
`225`	`225`	`}`
`226`	`226`	`}`
`227`	`227`	`}`