Skip to content

Commit ba5106c

Browse files
authored
Create install_NGC_PaddlePaddle_ch.rst (#5096)
* Create instalL_NGC_PaddlePaddle_ch.rst one page on installing instruction on NGC PaddlePaddle was created. * Update index_cn.rst add a file link to NGC PaddlePaddle installation page * Update instalL_NGC_PaddlePaddle_ch.rst fix 2 errors:remove one link that is not needed, and correct the link for NVIDIA 容器工具包 * Update instalL_NGC_PaddlePaddle_ch.rst * Update instalL_NGC_PaddlePaddle_ch.rst update the head footnote * Update instalL_NGC_PaddlePaddle_ch.rst remove the numbers in headline, in order to make the doc align with others * Update instalL_NGC_PaddlePaddle_ch.rst try to fix a link issue
1 parent 75a648a commit ba5106c

File tree

2 files changed

+113
-0
lines changed

2 files changed

+113
-0
lines changed

docs/install/index_cn.rst

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -206,4 +206,5 @@
206206
compile/fromsource.rst
207207
install_Kunlun_zh.md
208208
install_ROCM_zh.md
209+
instalL_NGC_PaddlePaddle_ch.rst
209210
Tables.md
Lines changed: 112 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,112 @@
1+
.. _install_NGC_PaddlePaddle_container introduction:
2+
3+
================================
4+
NGC PaddlePaddle 容器安装指南
5+
================================
6+
7+
----------------------
8+
整体介绍
9+
----------------------
10+
11+
NGC PaddlePaddle 容器针对 NVIDIA GPU 加速进行了优化,并包含一组经过验证的库,可启用和优化NVIDIA GPU 性能。此容器还可能包含对 PaddlePaddle 源代码的修改,以最大限度地提高性能和兼容性。此容器还包含用于加速 ETL (`DALI <https://developer.nvidia.com/dali/>`_, `RAPIDS <https://rapids.ai/>`_),、训练(`cuDNN <https://developer.nvidia.com/cudnn>`_, `NCCL <https://developer.nvidia.com/nccl>`_)和推理(`TensorRT <https://docs.nvidia.com/deeplearning/frameworks/tf-trt-user-guide/index.html>`_)工作负载的软件。
12+
13+
----------------------
14+
环境准备
15+
----------------------
16+
17+
使用 NGC PaddlePaddle 容器需要主机系统安装以下内容:
18+
19+
* `Docker引擎 <https://docs.docker.com/get-docker/>`_
20+
21+
* `NVIDIA GPU 驱动程序 <https://docs.nvidia.com/datacenter/tesla/tesla-installation-notes/index.html>`_
22+
23+
* `NVIDIA 容器工具包 <https://github.com/NVIDIA/nvidia-docker>`_
24+
25+
有关支持的版本,请参阅 `NVIDIA框架容器支持矩阵 <https://docs.nvidia.com/deeplearning/frameworks/support-matrix/index.html>`_ 和 `NVIDIA 容器工具包文档 <https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html>`_。
26+
27+
不需要其他安装、编译或依赖管理。 无需安装 NVIDIA CUDA Toolkit。
28+
29+
----------------------
30+
安装步骤
31+
----------------------
32+
33+
要运行容器,请按照 NVIDIA Containers For Deep Learning Frameworks User's Guide 中 `Running A Container <https://docs.nvidia.com/deeplearning/frameworks/user-guide/index.html#runcont>`_ 一章中的说明发出适当的命令,并指定注册表、存储库和标签。 有关使用 NGC 的更多信息,请参阅 NGC 容器用户指南。
34+
如果您有 Docker 19.03 或更高版本,启动容器的典型命令是:
35+
36+
::
37+
38+
docker run --gpus all -it --rm nvcr.io/nvidia/paddlepaddle:22.07-py3
39+
40+
41+
如果您有 Docker 19.02 或更早版本,启动容器的典型命令是:
42+
43+
::
44+
45+
nvidia-docker run -it --rm nvcr.io/nvidia/paddlepaddle:22.07-py3
46+
47+
48+
49+
其中:
50+
* 22.07 是容器版本。
51+
PaddlePaddle 通过将其作为 Python 模块导入来运行:
52+
53+
::
54+
55+
$ python -c 'import paddle; paddle.utils.run_check()'
56+
Running verify PaddlePaddle program ...
57+
W0516 06:36:54.208734 442 device_context.cc:451] Please NOTE: device: 0, GPU Compute Capability: 8.0, Driver API Version: 11.7, Runtime API Version: 11.7
58+
W0516 06:36:54.212574 442 device_context.cc:469] device: 0, cuDNN Version: 8.4.
59+
PaddlePaddle works well on 1 GPU.
60+
W0516 06:37:12.706600 442 fuse_all_reduce_op_pass.cc:76] Find all_reduce operators: 2. To make the speed faster, some all_reduce ops are fused during training, after fusion, the number of all_reduce ops is 2.
61+
PaddlePaddle works well on 8 GPUs.
62+
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.
63+
64+
有关入门和自定义 PaddlePaddle 映像的信息,请参阅容器内的 /workspace/README.md。
65+
66+
您可能希望从容器外部的位置提取数据和模型描述以供 PaddlePaddle 使用。 为此,最简单的方法是将一个或多个主机目录挂载为 `Docker 绑定挂载 <https://docs.docker.com/storage/bind-mounts/>`_。 例如:
67+
68+
::
69+
70+
docker run --gpus all -it --rm -v local_dir:container_dir nvcr.io/nvidia/paddlepaddle:22.07-py3
71+
72+
73+
注意:为了在队列之间共享数据,NCCL 可能需要共享系统内存用于 IPC 和固定(页面锁定)系统内存资源。 操作系统对这些资源的限制可能需要相应增加。 有关详细信息,请参阅系统文档。 特别是,Docker 容器默认使用有限的共享和固定内存资源。 在容器内使用 NCCL 时,建议您通过发出以下命令来增加这些资源:
74+
75+
::
76+
77+
--shm-size=1g --ulimit memlock=-1
78+
79+
在 docker run 命令中。
80+
81+
----------------------
82+
NGC容器介绍
83+
----------------------
84+
85+
有关内容的完整列表,请参阅 `NVIDIA PaddlePaddle 容器发行说明 <https://docs.nvidia.com/deeplearning/frameworks/paddle-paddle-release-notes/index.html>`_。
86+
此容器映像包含 NVIDIA 版 PaddlePaddle 的完整源代码,位于 /opt/paddle/paddle。它是作为系统 Python 模块预构建和安装的。
87+
NVIDIA PaddlePaddle 容器针对与 NVIDIA GPU 一起使用进行了优化,并包含以下用于 GPU 加速的软件:
88+
89+
* `CUDA <https://developer.nvidia.com/cuda-toolkit>`_
90+
91+
* `cuBLAS <https://developer.nvidia.com/cublas>`_
92+
93+
* `NVIDIA cuDNN <https://developer.nvidia.com/cudnn>`_
94+
95+
* `NVIDIA NCCL <https://developer.nvidia.com/nccl>`_ (optimized for `NVLink <http://www.nvidia.com/object/nvlink.html>`_ )
96+
97+
* `NVIDIA Data Loading Library (DALI) <https://developer.nvidia.com/dali>`_
98+
99+
* `TensorRT <https://developer.nvidia.com/tensorrt>`__
100+
101+
* `PaddlePaddle with TensorRT (Paddle-TRT) <https://github.com/PaddlePaddle/Paddle-Inference-Demo/blob/master/docs/optimize/paddle_trt_en.rst>`_
102+
103+
此容器中的软件堆栈已经过兼容性验证,不需要最终用户进行任何额外的安装或编译。此容器可以帮助您从端到端加速深度学习工作流程。
104+
105+
106+
--------------------------------------------
107+
NGC PaddlePaddle 容器软件许可协议
108+
--------------------------------------------
109+
110+
当您下载或使用NGC PaddlePaddle 容器时,即表示您已经同意并接受此 `最终用户许可协议 <https://developer.nvidia.com/ngc/nvidia-deep-learning-container-license>`_ 的条款及其对应约束。
111+
112+

0 commit comments

Comments
 (0)