先日nnablaパッケージ群のv1.0.9がリリースされました。
v1.0.0以降リリースブログを投稿してなかったため、それ以降の主要な更新を紹介します。
Python
- CUDA10向けのPythonパッケージを提供(
pip install nnabla-ext-cuda100
でインストール可能) - GPU分散学習用のビルド済みバイナリのPyPIへの公開
- Mixed Precision学習用自動ロススケール調整機能 DynamicLossScalingUpdator
- Dynamic Graph利用時のTruncated BPTT対応(Variable.clear_all_graph_links)
- Numpyライクなarrayインデクシング
- Batch normalizationのパラメタ初期値の引数の追加
C++
レイヤー関数の追加・改善
- 画像のリサイズ関数Interpolateの追加(2DのBilinearのみ)
- LeakyReLUへのinplaceオプションの追加
- numpy.arangeライクな関数Arangeの追加
- Sort関数の追加
- Max/Min関数へのargmin/argmax相当の機能の追加(Min, Max)
- CUDNN ConvolutionのDeterministicオプションの追加
- Pad関数へのパディングオプションreflectの追加
ネットワークコンパクト化向け
ファイルフォーマットコンバータ
ユーティリティ
- ネットワーク計算グラフ描画機能 SimpleGraphViewer
- 学習結果のプロット描画を行う機能を追加 コマンドライン|Python API
ベースライン実装:nnabla-examples
- 尺度ベースのメタ学習の例題の追加:Prototypical Networks, Matching Networks
- YOLOv2 学習の改善:大幅な学習時間の短縮、コード整理、学習の不安定性の解消、ロス・計算時間のログ出力、評価スクリプトのPython2/3両対応
- ShuffleNetの例題の追加
- ShiftNetの例題の追加
- Dockerfileの追加