apache · HyukjinKwon · Dec 9, 2015 · Dec 9, 2015 · aray · Dec 9, 2015
diff --git a/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala b/sql/core/src/main/scala/org/apache/spark/sql/DataFrame.scala
@@ -1261,7 +1261,7 @@ class DataFrame private[sql](
    * @since 1.4.0
    */
   def drop(colName: String): DataFrame = {
-    drop(Seq(colName) : _*)
+    drop(colName, Seq() : _*)
   }
 
   /**
@@ -1271,10 +1271,11 @@ class DataFrame private[sql](
    * @since 1.6.0
    */
   @scala.annotation.varargs
-  def drop(colNames: String*): DataFrame = {
+  def drop(colName: String, colNames: String*): DataFrame = {
     val resolver = sqlContext.analyzer.resolver
-    val remainingCols =
-      schema.filter(f => colNames.forall(n => !resolver(f.name, n))).map(f => Column(f.name))
+    val remainingCols = schema.filter { f =>
+        (colName +: colNames).forall(n => !resolver(f.name, n))
+      }.map(f => Column(f.name))
     if (remainingCols.size == this.schema.size) {
       this
     } else {
@@ -1291,16 +1292,34 @@ class DataFrame private[sql](
    * @since 1.4.1
    */
   def drop(col: Column): DataFrame = {
-    val expression = col match {
+    drop(Seq(col) : _*)
+  }
+
+  /**
+   * Returns a new [[DataFrame]] with columns dropped.
+   * This version of drop accepts Column(s) rather than name(s).
+   * This is a no-op if the DataFrame doesn't have column(s)
+   * with equivalent expression(s).
+   * @group dfops
+   * @since 1.6.0
+   */
+  @scala.annotation.varargs
+  def drop(cols: Column*): DataFrame = {
+    val resolver = sqlContext.analyzer.resolver
+    val attrs = this.logicalPlan.output
+    val expressions = cols.map {
       case Column(u: UnresolvedAttribute) =>
-        queryExecution.analyzed.resolveQuoted(u.name, sqlContext.analyzer.resolver).getOrElse(u)
+        queryExecution.analyzed.resolveQuoted(u.name, resolver).getOrElse(u)
       case Column(expr: Expression) => expr
     }
-    val attrs = this.logicalPlan.output
-    val colsAfterDrop = attrs.filter { attr =>
-      attr != expression
-    }.map(attr => Column(attr))
-    select(colsAfterDrop : _*)
+    val remainingCols = attrs.filter { attr =>
+        !expressions.contains(attr)
+      }.map(attr => Column(attr))
+    if (remainingCols.size == this.schema.size) {
+      this
+    } else {
+      this.select(remainingCols: _*)
+    }
   }
 
   /**

diff --git a/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala b/sql/core/src/test/scala/org/apache/spark/sql/DataFrameSuite.scala
@@ -402,6 +402,13 @@ class DataFrameSuite extends QueryTest with SharedSQLContext {
     assert(df.schema.map(_.name) === Seq("value"))
   }
 
+  test("drop column using drop with column references") {
+    val src = Seq((0, 2, 3)).toDF("a", "b", "c")
+    val df = src.drop(src("a"), src("b"))
+    checkAnswer(df, Row(3))
+    assert(df.schema.map(_.name) === Seq("c"))
+  }
+
   test("drop unknown column (no-op) with column reference") {
     val col = Column("random")
     val df = testData.drop(col)