rdblue
diff --git a/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/plans/QueryPlan.scala‎
Lines changed: 1 addition & 1 deletion b/‎sql/catalyst/src/main/scala/org/apache/spark/sql/catalyst/plans/QueryPlan.scala‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎sql/core/src/main/java/org/apache/spark/sql/sources/v2/reader/SupportsReportStatistics.java‎
Lines changed: 5 additions & 0 deletions b/‎sql/core/src/main/java/org/apache/spark/sql/sources/v2/reader/SupportsReportStatistics.java‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎sql/core/src/main/scala/org/apache/spark/sql/DataFrameReader.scala‎
Lines changed: 7 additions & 9 deletions b/‎sql/core/src/main/scala/org/apache/spark/sql/DataFrameReader.scala‎
Lines changed: 7 additions & 9 deletions
diff --git a/‎sql/core/src/main/scala/org/apache/spark/sql/DataFrameWriter.scala‎
Lines changed: 7 additions & 8 deletions b/‎sql/core/src/main/scala/org/apache/spark/sql/DataFrameWriter.scala‎
Lines changed: 7 additions & 8 deletions
diff --git a/‎sql/core/src/main/scala/org/apache/spark/sql/execution/SparkOptimizer.scala‎
Lines changed: 0 additions & 2 deletions b/‎sql/core/src/main/scala/org/apache/spark/sql/execution/SparkOptimizer.scala‎
Lines changed: 0 additions & 2 deletions
@@ -363,7 +363,7 @@ abstract class QueryPlan[PlanType <: QueryPlan[PlanType]] extends TreeNode[PlanT
   /**
    * Canonicalized copy of this query plan.
    */
-  protected lazy val canonicalized: PlanType = this
+  lazy val canonicalized: PlanType = this
 
   /**
    * Returns true when the given query plan will return the same results as this query plan.
 
@@ -22,6 +22,11 @@
 /**
  * A mix in interface for {@link DataSourceReader}. Data source readers can implement this
  * interface to report statistics to Spark.
+ *
+ * Statistics are reported to the optimizer before a projection or any filters are pushed to the
+ * DataSourceReader. Implementations that return more accurate statistics based on projection and
+ * filters will not improve query performance until the planner can push operators before getting
+ * stats.
  */
 @InterfaceStability.Evolving
 public interface SupportsReportStatistics extends DataSourceReader {
 
@@ -149,22 +149,20 @@ class DataFrameReader private[sql](sparkSession: SparkSession) extends Logging {
     val cls = DataSource.lookupDataSource(source)
     if (classOf[DataSourceV2].isAssignableFrom(cls)) {
       val source = cls.newInstance().asInstanceOf[DataSourceV2]
-      val (pathOption, tableOption) = extraOptions.get("path") match {
+      val options: Map[String, String] = extraOptions.get("path") match {
         case Some(path) if !path.contains("/") =>
           // without "/", this cannot be a full path. parse it as a table name
           val ident = sparkSession.sessionState.sqlParser.parseTableIdentifier(path)
           // ensure the database is set correctly
-          val db = ident.database.getOrElse(sparkSession.catalog.currentDatabase)
-          (None, Some(ident.copy(database = Some(db))))
-        case Some(path) =>
-          (Some(path), None)
+          (extraOptions ++ Map(
+            "database" -> ident.database.getOrElse(sparkSession.catalog.currentDatabase),
+            "table" -> ident.table)).toMap
         case _ =>
-          (None, None)
+          extraOptions.toMap
       }
 
-      Dataset.ofRows(sparkSession, DataSourceV2Relation(
-        source, extraOptions.toMap, pathOption, tableOption,
-        userSpecifiedSchema = userSpecifiedSchema))
+      Dataset.ofRows(sparkSession, DataSourceV2Relation.create(
+        source, options, userSpecifiedSchema = userSpecifiedSchema))
 
     } else {
       // Code path for data source v1.
 
@@ -224,25 +224,24 @@ final class DataFrameWriter[T] private[sql](ds: Dataset[T]) {
       // save variants always match columns by name
       extraOptions.put("matchByName", "true")
 
-      val (pathOption, tableOption) = extraOptions.get("path") match {
+      val options: Map[String, String] = extraOptions.get("path") match {
         case Some(path) if !path.contains("/") =>
           // without "/", this cannot be a full path. parse it as a table name
           val ident = df.sparkSession.sessionState.sqlParser.parseTableIdentifier(path)
           // ensure the database is set correctly
-          val db = ident.database.getOrElse(df.sparkSession.catalog.currentDatabase)
-          (None, Some(ident.copy(database = Some(db))))
-        case Some(path) =>
-          (Some(path), None)
+          (extraOptions ++ Map(
+            "database" -> ident.database.getOrElse(df.sparkSession.catalog.currentDatabase),
+            "table" -> ident.table)).toMap
         case _ =>
-          (None, None)
+          extraOptions.toMap
       }
 
       val partitions = normalizedParCols.map(_.map(col => col -> (None: Option[String])).toMap)
-      val relation = DataSourceV2Relation(dataSource, extraOptions.toMap, pathOption, tableOption)
+      val relation = DataSourceV2Relation.create(dataSource, options)
 
       val (overwrite, ifNotExists) = mode match {
         case SaveMode.Ignore =>
-          if (relation.writer(df.logicalPlan.schema, mode).isEmpty) {
+          if (relation.newWriter(df.logicalPlan.schema, mode).isEmpty) {
             return
           }
           (false, false)
 
@@ -21,7 +21,6 @@ import org.apache.spark.sql.ExperimentalMethods
 import org.apache.spark.sql.catalyst.catalog.SessionCatalog
 import org.apache.spark.sql.catalyst.optimizer.Optimizer
 import org.apache.spark.sql.execution.datasources.PruneFileSourcePartitions
-import org.apache.spark.sql.execution.datasources.v2.DataSourceV2PushDown
 import org.apache.spark.sql.execution.python.ExtractPythonUDFFromAggregate
 import org.apache.spark.sql.internal.SQLConf
 
@@ -35,6 +34,5 @@ class SparkOptimizer(
     Batch("Optimize Metadata Only Query", Once, OptimizeMetadataOnlyQuery(catalog, conf)) :+
     Batch("Extract Python UDF from Aggregate", Once, ExtractPythonUDFFromAggregate) :+
     Batch("Prune File Source Table Partitions", Once, PruneFileSourcePartitions) :+
-    Batch("Push down operators to data source scan", Once, DataSourceV2PushDown) :+
     Batch("User Provided Optimizers", fixedPoint, experimentalMethods.extraOptimizations: _*)
 }