From 0a14b990a935a5148c4213965130ad8aa7161eff Mon Sep 17 00:00:00 2001
From: Liu-xiandong <liuxiandong@ncic.ac.cn>
Date: Fri, 12 Nov 2021 02:30:54 +0000
Subject: [PATCH 1/2] Add sparse_attention warnning

---
 docs/api/paddle/nn/functional/sparse_attention_cn.rst | 3 +++
 1 file changed, 3 insertions(+)

diff --git a/docs/api/paddle/nn/functional/sparse_attention_cn.rst b/docs/api/paddle/nn/functional/sparse_attention_cn.rst
index ac95e6e6a3d..619f521b179 100755
--- a/docs/api/paddle/nn/functional/sparse_attention_cn.rst
+++ b/docs/api/paddle/nn/functional/sparse_attention_cn.rst
@@ -9,6 +9,9 @@ sparse_attention
 
 其稀疏数据排布通过CSR格式表示，CSR格式包含两个参数， ``offset`` 和 ``colunms`` 。计算公式为：
 
+.. warning::
+    目前该API只在CUDA11.3及以上版本中使用。
+
 .. math::
    result=softmax(\frac{ Q * K^T }{\sqrt{d}}) * V
 

From e960b1f0dff584c28904f633b7268d1dca7cf000 Mon Sep 17 00:00:00 2001
From: Liu-xiandong <liuxiandong@ncic.ac.cn>
Date: Fri, 12 Nov 2021 03:27:59 +0000
Subject: [PATCH 2/2] add warning

---
 docs/api/paddle/nn/functional/sparse_attention_cn.rst | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/docs/api/paddle/nn/functional/sparse_attention_cn.rst b/docs/api/paddle/nn/functional/sparse_attention_cn.rst
index 619f521b179..06e73583f75 100755
--- a/docs/api/paddle/nn/functional/sparse_attention_cn.rst
+++ b/docs/api/paddle/nn/functional/sparse_attention_cn.rst
@@ -9,14 +9,14 @@ sparse_attention
 
 其稀疏数据排布通过CSR格式表示，CSR格式包含两个参数， ``offset`` 和 ``colunms`` 。计算公式为：
 
-.. warning::
-    目前该API只在CUDA11.3及以上版本中使用。
-
 .. math::
    result=softmax(\frac{ Q * K^T }{\sqrt{d}}) * V
 
 其中，``Q``，``K``，``V`` 表示注意力模块的三个输入参数。这三个参数的维度是一样的。 ``d`` 代表这三个参数的最后一个维度的大小。
 
+.. warning::
+    目前该API只在CUDA11.3及以上版本中使用。
+
 参数：
 :::::::::
   - query (Tensor) - 输入的Tensor，代表注意力模块中的 ``query`` ，这是一个4维Tensor，形状为 :[batch_size, num_heads, seq_len, head_dim]，数据类型为float32或float64。