
图中的runtime名称做了脱敏
A compute 调用了两个cudaruntime,分别是cudaRT_P和cudaLaunchKernel,其中cudaRT_P调用了cudaRT_C,但是
|
def _build_tree_relationship( # noqa: C901 |
将三个cudaruntime 一起作为A compute的runtime子节点,即len(Acompute.runtime_node) == 3
对此,已经提交了pr,见 https://github.com/PaddlePaddle/VisualDL/pull/1256,希望参与问题的后续讨论,期待回复