From 81ad54ef4d9588b630f2eac970559534d754b1eb Mon Sep 17 00:00:00 2001
From: fengyuentau <yuantao.feng@opencv.org.cn>
Date: Fri, 22 Dec 2023 23:31:53 +0800
Subject: [PATCH 1/3] undo comment

---
 .../generate_onnx_models_with_onnxscript.py   | 194 +++++++++---------
 1 file changed, 97 insertions(+), 97 deletions(-)

diff --git a/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py b/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py
index 0ce1ef109..3cc389506 100644
--- a/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py
+++ b/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py
@@ -43,103 +43,103 @@ def make_model_and_data(model, *args, **kwargs):
     output_files = os.path.join("data", "output_" + name)
     np.save(output_files, output)
 
-# '''
-#     It builds a model with two Gather ops sharing a single same indices:
-
-#     [Input] -> Gather(indices=0) -> Gather(indices=0) -> [Output]
-
-#     , where the two indices constants have the same name.
-# '''
-# @ost.script()
-# def gather_shared_indices(x: ost.FLOAT[2, 1, 3, 4]) -> ost.FLOAT[3, 4]:
-#     indices = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([0], dtype=np.int64)))
-#     y0 = op.Gather(x, indices, axis=0)
-#     y1 = op.Gather(y0, indices, axis=0)
-#     return y1
-# make_model_and_data(gather_shared_indices, np.random.rand(2, 1, 3, 4).astype(np.float32))
-
-# '''
-#     [Input] -> Greater(B=61) -> [Output]
-#                         \
-#                         dtype=np.int64
-# '''
-# @ost.script()
-# def greater_input_dtype_int64(x: ost.FLOAT[27, 9]) ->ost.BOOL[27, 9]:
-#     y = op.Greater(x, op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([61], dtype=np.int64))))
-#     return y
-# make_model_and_data(greater_input_dtype_int64, np.random.randint(0, 100, size=[27, 9], dtype=np.int64), force_saving_input_as_dtype_float32=True, force_saving_output_as_dtype_float32=True)
-
-# from onnxscript import opset11
-
-# @ost.script()
-# def two_resizes_with_shared_subgraphs(x: ost.FLOAT["batch", 1, "height", "width"], y: ost.FLOAT[1, 1, 3, 2], z: ost.FLOAT[1, 1, 2, 1]) ->ost.FLOAT["batch", 1, "height", "width"]:
-#     shape_src_1 = opset11.Shape(x)
-#     shape_src_2 = opset11.Shape(x)
-#     gather_h = opset11.Gather(shape_src_1, opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([2], dtype=np.int64))), axis=0)
-#     gather_w = opset11.Gather(shape_src_2, opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([3], dtype=np.int64))), axis=0)
-#     unsqueeze_w_1 = opset11.Unsqueeze(gather_w, axes=[0])
-#     unsqueeze_w_2 = opset11.Unsqueeze(gather_w, axes=[0])
-#     unsqueeze_h_1 = opset11.Unsqueeze(gather_h, axes=[0])
-#     unsqueeze_h_2 = opset11.Unsqueeze(gather_h, axes=[0])
-#     concat_1 = opset11.Cast(opset11.Concat(unsqueeze_h_1, unsqueeze_w_1, axis=0), to=ost.INT64.dtype)
-#     concat_2 = opset11.Cast(opset11.Concat(unsqueeze_h_2, unsqueeze_w_2, axis=0), to=ost.INT64.dtype)
-
-#     # This op is required to test double node removal
-#     y = opset11.Add(y, opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [1], np.array([0.5], dtype=np.float32))))
-
-#     # First branch
-#     sliced = opset11.Slice(opset11.Shape(y),
-#         starts=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
-#         ends=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([2], dtype=np.int64))),
-#         axes=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
-#     )
-#     concat_y = opset11.Concat(sliced, concat_1, axis=0)
-#     resized_y = opset11.Resize(y,
-#         roi=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
-#         scales=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
-#         sizes=concat_y,
-#         coordinate_transformation_mode='pytorch_half_pixel',
-#         cubic_coeff_a=-0.75,
-#         mode='linear',
-#         nearest_mode='floor'
-#     )
-
-#     # Second branch
-#     sliced = opset11.Slice(opset11.Shape(z),
-#         starts=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
-#         ends=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([2], dtype=np.int64))),
-#         axes=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
-#     )
-#     concat_z = opset11.Concat(sliced, concat_2, axis=0)
-#     resized_z = opset11.Resize(z,
-#         roi=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
-#         scales=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
-#         sizes=concat_z,
-#         coordinate_transformation_mode='pytorch_half_pixel',
-#         cubic_coeff_a=-0.75,
-#         mode='linear',
-#         nearest_mode='floor'
-#     )
-
-#     return opset11.Add(resized_y, resized_z)
-
-# make_model_and_data(two_resizes_with_shared_subgraphs, np.random.rand(1, 1, 4, 5).astype(np.float32), np.random.rand(1, 1, 3, 2).astype(np.float32), np.random.rand(1, 1, 2, 1).astype(np.float32))
-
-
-# @ost.script()
-# def bias_gelu(x: ost.FLOAT[1, 2, 3]) -> ost.FLOAT[1, 2, 3]:
-#     bias = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [3], np.array([0.1, 0.3, 0.2], dtype=np.float32)))
-#     add1 = op.Add(x, bias)
-#     tmp = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [], np.array([np.sqrt(2)], dtype=np.float32)))
-#     div = op.Div(add1, tmp)
-#     erf = op.Erf(div)
-#     tmp_0 = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [], np.array([1], dtype=np.float32)))
-#     add2 = op.Add(erf, tmp_0)
-#     mul = op.Mul(add1, add2)
-#     tmp_1 = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [], np.array([0.5], dtype=np.float32)))
-#     return op.Mul(mul, tmp_1)
-
-# make_model_and_data(bias_gelu, np.random.rand(1, 2, 3).astype(np.float32))
+'''
+    It builds a model with two Gather ops sharing a single same indices:
+
+    [Input] -> Gather(indices=0) -> Gather(indices=0) -> [Output]
+
+    , where the two indices constants have the same name.
+'''
+@ost.script()
+def gather_shared_indices(x: ost.FLOAT[2, 1, 3, 4]) -> ost.FLOAT[3, 4]:
+    indices = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([0], dtype=np.int64)))
+    y0 = op.Gather(x, indices, axis=0)
+    y1 = op.Gather(y0, indices, axis=0)
+    return y1
+make_model_and_data(gather_shared_indices, np.random.rand(2, 1, 3, 4).astype(np.float32))
+
+'''
+    [Input] -> Greater(B=61) -> [Output]
+                        \
+                        dtype=np.int64
+'''
+@ost.script()
+def greater_input_dtype_int64(x: ost.FLOAT[27, 9]) ->ost.BOOL[27, 9]:
+    y = op.Greater(x, op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([61], dtype=np.int64))))
+    return y
+make_model_and_data(greater_input_dtype_int64, np.random.randint(0, 100, size=[27, 9], dtype=np.int64), force_saving_input_as_dtype_float32=True, force_saving_output_as_dtype_float32=True)
+
+from onnxscript import opset11
+
+@ost.script()
+def two_resizes_with_shared_subgraphs(x: ost.FLOAT["batch", 1, "height", "width"], y: ost.FLOAT[1, 1, 3, 2], z: ost.FLOAT[1, 1, 2, 1]) ->ost.FLOAT["batch", 1, "height", "width"]:
+    shape_src_1 = opset11.Shape(x)
+    shape_src_2 = opset11.Shape(x)
+    gather_h = opset11.Gather(shape_src_1, opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([2], dtype=np.int64))), axis=0)
+    gather_w = opset11.Gather(shape_src_2, opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [], np.array([3], dtype=np.int64))), axis=0)
+    unsqueeze_w_1 = opset11.Unsqueeze(gather_w, axes=[0])
+    unsqueeze_w_2 = opset11.Unsqueeze(gather_w, axes=[0])
+    unsqueeze_h_1 = opset11.Unsqueeze(gather_h, axes=[0])
+    unsqueeze_h_2 = opset11.Unsqueeze(gather_h, axes=[0])
+    concat_1 = opset11.Cast(opset11.Concat(unsqueeze_h_1, unsqueeze_w_1, axis=0), to=ost.INT64.dtype)
+    concat_2 = opset11.Cast(opset11.Concat(unsqueeze_h_2, unsqueeze_w_2, axis=0), to=ost.INT64.dtype)
+
+    # This op is required to test double node removal
+    y = opset11.Add(y, opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [1], np.array([0.5], dtype=np.float32))))
+
+    # First branch
+    sliced = opset11.Slice(opset11.Shape(y),
+        starts=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
+        ends=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([2], dtype=np.int64))),
+        axes=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
+    )
+    concat_y = opset11.Concat(sliced, concat_1, axis=0)
+    resized_y = opset11.Resize(y,
+        roi=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
+        scales=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
+        sizes=concat_y,
+        coordinate_transformation_mode='pytorch_half_pixel',
+        cubic_coeff_a=-0.75,
+        mode='linear',
+        nearest_mode='floor'
+    )
+
+    # Second branch
+    sliced = opset11.Slice(opset11.Shape(z),
+        starts=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
+        ends=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([2], dtype=np.int64))),
+        axes=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.INT64, [1], np.array([0], dtype=np.int64))),
+    )
+    concat_z = opset11.Concat(sliced, concat_2, axis=0)
+    resized_z = opset11.Resize(z,
+        roi=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
+        scales=opset11.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [0], np.empty([0]))),
+        sizes=concat_z,
+        coordinate_transformation_mode='pytorch_half_pixel',
+        cubic_coeff_a=-0.75,
+        mode='linear',
+        nearest_mode='floor'
+    )
+
+    return opset11.Add(resized_y, resized_z)
+
+make_model_and_data(two_resizes_with_shared_subgraphs, np.random.rand(1, 1, 4, 5).astype(np.float32), np.random.rand(1, 1, 3, 2).astype(np.float32), np.random.rand(1, 1, 2, 1).astype(np.float32))
+
+
+@ost.script()
+def bias_gelu(x: ost.FLOAT[1, 2, 3]) -> ost.FLOAT[1, 2, 3]:
+    bias = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [3], np.array([0.1, 0.3, 0.2], dtype=np.float32)))
+    add1 = op.Add(x, bias)
+    tmp = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [], np.array([np.sqrt(2)], dtype=np.float32)))
+    div = op.Div(add1, tmp)
+    erf = op.Erf(div)
+    tmp_0 = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [], np.array([1], dtype=np.float32)))
+    add2 = op.Add(erf, tmp_0)
+    mul = op.Mul(add1, add2)
+    tmp_1 = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, [], np.array([0.5], dtype=np.float32)))
+    return op.Mul(mul, tmp_1)
+
+make_model_and_data(bias_gelu, np.random.rand(1, 2, 3).astype(np.float32))
 
 batch_size = 1
 sequence_length = 320

From a8827e04c70e92e1b1694d9c57de28eb562147d5 Mon Sep 17 00:00:00 2001
From: fengyuentau <yuantao.feng@opencv.org.cn>
Date: Fri, 22 Dec 2023 23:37:00 +0800
Subject: [PATCH 2/3] add model and data

---
 .../dnn/onnx/data/input_einsum_const_inputs.npy   | Bin 0 -> 320 bytes
 .../dnn/onnx/data/output_einsum_const_inputs.npy  | Bin 0 -> 224 bytes
 testdata/dnn/onnx/models/einsum_const_inputs.onnx | Bin 0 -> 333 bytes
 3 files changed, 0 insertions(+), 0 deletions(-)
 create mode 100644 testdata/dnn/onnx/data/input_einsum_const_inputs.npy
 create mode 100644 testdata/dnn/onnx/data/output_einsum_const_inputs.npy
 create mode 100644 testdata/dnn/onnx/models/einsum_const_inputs.onnx

diff --git a/testdata/dnn/onnx/data/input_einsum_const_inputs.npy b/testdata/dnn/onnx/data/input_einsum_const_inputs.npy
new file mode 100644
index 0000000000000000000000000000000000000000..5fe09d6444ead84e0da75dd3e97c2fcfb37936ce
GIT binary patch
literal 320
zcmbR27wQ`j$;eQ~P_3SlTAW;@Zl$1ZlV+l>qoAIaUsO_*m=~X4l#&V(cT3DEP6dh=
zXCxM+0{I%oItoT$WTL5~P^&-&;Ia>&XSZ^9hh1})fqm?v#dZcsS++aZJg~XWn{97w
z<ZiRoTi9-|<667ujC}i#5<PY$(LDC^Uo+X;R`b|3rX|_!nz!0+{vRK^?B#6sC*rDX
zCuA4dpY}4hPvqEU=W({rE_Z^peZ^8W`%mwCZQM!(?c+WB?4+B1*##FF+9&=rwO`S8
z&~D$N3_In_1pCI@vGyx@?Co5t&)TZ*=dzcQ*kgNfqqO}C;s3T5o<6sg$qcr4l)P!@
RxoE$Q_8I}(Q(I2h0RY8~Yf}IK

literal 0
HcmV?d00001

diff --git a/testdata/dnn/onnx/data/output_einsum_const_inputs.npy b/testdata/dnn/onnx/data/output_einsum_const_inputs.npy
new file mode 100644
index 0000000000000000000000000000000000000000..f0dba5f85470280eed6b7cad03c3da757fb8e550
GIT binary patch
literal 224
zcmbR27wQ`j$;eQ~P_3SlTAW;@Zl$1ZlV+l>qoAIaUsO_*m=~X4l#&V(cT3DEP6dh=
zXCxM+0{I%oItoS*q^YA&t3U?esuj<-Pp<2*7funhU-p^TKHA5{K0+nK{-|?_y?ctA
z{U>2D`}t3G?O$x4Y+v>8xV=vJ9Q(tbW%e&8SK6EIX|dnYd(Pf>%QbtS)vWe{_I&p0
Uy=L}$i&^bW^Um4z>~63F0Nvj~%K!iX

literal 0
HcmV?d00001

diff --git a/testdata/dnn/onnx/models/einsum_const_inputs.onnx b/testdata/dnn/onnx/models/einsum_const_inputs.onnx
new file mode 100644
index 0000000000000000000000000000000000000000..e0ccd890214a54ae93745c0394c3627d91f8ea4a
GIT binary patch
literal 333
zcmd<!v^vDZRV>7wnO9I+5^pHQlxLvC;hdjWT#}eqq7}i#T9%konyTf)!32aX0*p!y
z2e0wlFN^oHE3Oo<zw1$F?_F`n&UbUA{SO{a`-{QF_S#v__N;5t?L|Y^*<Jkg(YAWe
z20P~ZJo|mj9QMo&8g@<$3m93f7`Xhnpq3iI7=}VzMX4pFMS1Z+OMxyiRAO_@%quR<
z)l%T%NG&W)EXmBzQxZ(dC{NZ=$jDAs(6v(la<UgNGFveS38#Y9#wUXu9}o6Vag-v=
zYy%-NE)fn!AptHX4rU-`f?}2=6)q%Oaj0U-l7$&$C?v!s05pgP*$^idE(QT%07A)C
AA^-pY

literal 0
HcmV?d00001


From 85d8061188a30b4a12b07d61bff41888e922a9c4 Mon Sep 17 00:00:00 2001
From: fengyuentau <yuantao.feng@opencv.org.cn>
Date: Fri, 22 Dec 2023 23:40:53 +0800
Subject: [PATCH 3/3] update script

---
 .../dnn/onnx/generate_onnx_models_with_onnxscript.py | 12 ++++++++++++
 1 file changed, 12 insertions(+)

diff --git a/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py b/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py
index 3cc389506..dc5942247 100644
--- a/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py
+++ b/testdata/dnn/onnx/generate_onnx_models_with_onnxscript.py
@@ -298,3 +298,15 @@ def attention_single_head(x: ost.FLOAT[batch_size, sequence_length, input_hidden
     return reshape
 
 make_model_and_data(attention_single_head, np.random.rand(batch_size, sequence_length, input_hidden_size).astype(np.float32))
+
+# Einsum_const_inputs
+
+input_0_data = np.random.rand(3, 2, 2, 4).astype(np.float32)
+input_1_data = np.random.rand(2, 2, 4).astype(np.float32)
+
+@ost.script()
+def einsum_const_inputs(input_0: ost.FLOAT[3, 2, 2, 4]) -> ost.FLOAT[3, 2, 2, 2]:
+    input_1 = op.Constant(value=onnx.helper.make_tensor("", onnx.TensorProto.FLOAT, input_1_data.shape, input_1_data))
+    return op.Einsum(input_0, input_1, equation="bhwc, hkc -> bhwk")
+
+make_model_and_data(einsum_const_inputs, input_0_data)