バージョン0.9.3 (nnabla, nnabla-ext-cuda)より, nnablaが分散学習(マルチGPU)をサポートしました.
- マルチプロセス版(mpirun/mpiexec)
- マルチスレッド版
の2つが利用できます.
MPIを使用したときには,現状のトレーニングスクリプトほぼそのままに
$ mpirun -n 4 python ${your_training_script.py}
のようにすると,分散学習が可能になります.
詳しくは,チュートリアルとCifar10の例を見てください.
インストールは こちらをご覧ください.