Neural Network Libraries v1.22.0をリリースしました!音声合成モデルHiFi-GANや動画のカラー化が可能なモデルであるDeep Exemplar-based Video Colorizationの推論コードを追加しました!また、量子化tfliteコンバータのデモも追加しました!
Spotlight
HiFi-GAN
原音に忠実な音声合成が可能であるHiFi-GAN (Kong et al., NeurIPS 2020)を実装しました!HiFi-GANは敵対的生成ネットワークによって生の波形を生成し、モデリングした音声の周期的パターンが音声のクオリティを向上させる点で非常に重要であることを示しています。
Interactive Demo for quantized tflite converter
過去のリリースにおいて、nnp
をint8 tflite
に変換する量子化tfliteコンバータ を追加しました。今回のリリースに際して、このコンバータの概念や実際にはどう使うのかを紹介するインタラクティブデモを作成しましたので、ぜひご利用ください!
名称 | ノートブック | タスク |
---|---|---|
学習後量子化 | 学習後量子化 |
Deep Exemplar-Based video Colorization
入力動画 | リファレンス | 出力動画 |
---|---|---|
End-to-Endのリファレンスベースの動画のカラー化モデルであるDeep Exemplar-based Video Colorization (Zhang et al, CVPR 2019)の推論コードを実装しました!このモデルはセマンティックな対応と色の伝搬のステップを組み合わせる再帰フレームワークを導入することで、時系列方向の一貫性を保ちつつ、リファレンスとして与えた画像に忠実なカラー化を実現しています。
このモデルをすぐに実行できるColabデモも用意しました!ぜひお試しください!
名称 | ノートブック | タスク |
---|---|---|
Deep-Exemplar-based-Video-Colorization | 動画のカラー化 |
DataIterator: sliceの挙動の修正
データイテレータの機能であるスライスを用いた際、一部のサンプルが利用不可になってしまう問題を修正しました。
正規化関数の最適化
cudaにおけるlayer_normalization
, instance_normalization
, group_normalization
が高速に動作するように最適化を行いました。例えば、group_normalization
においては既存の実装と比較して、forwardで最大73倍、backwardで最大40倍高速に実行されます。
リダクション系関数の高速化
nnabla.functions.max
, nnabla.funtions.sum
などで利用されるTensor Reductionのためのcuda kernelの最適化を行いました。例えばsum
の場合、特定のケースにおいては既存の実装と比較して最大で約5倍高速に実行されます。
マルチデバイス利用時の乱数シードセッターの修正
nnabla.functions.randn
などの乱数生成系関数の初期seedがスクリプトの実行毎に、またプロセスごとにランダムに決定されるように修正しました。これにより、デフォルトの設定では、乱数生成関数利用時に再現性が保証されなくなります。再現性を補償したい場合には、nnabla.random.set_function_seed(seed)
を利用して手動で初期seedをセットするようにしてください。1例として、毎回の実行でこれらの関数が必ず元バージョンと同様の乱数列を生成してほしい場合には、スクリプトの先頭でnnabla.random.set_function_seed(313)
を実行してください。
バグ修正
- デバッグメッセージの要素数/バイトサイズを修正
- F.gather_ndの高階微分の修正 (CPU / GPU)
- F.transpose: grid_dim.yのサイズによってtranspose_ndカーネルを利用
- nnabla-examplesの軽微なバグ修正
ビルド関連
- Dockerイメージのベースイメージをcentosからubuntuに変更 / PEP600タグの使用 (CPU / GPU)
- 無効なテキストファイルを無視
- protobuf >= v3.18.0のサポート
ドキュメントの追加・修正
レイヤー関数等の新規追加・改善
ユーティリティの機能改善
- imsave: グレースケールモードにおいて不正な配列が与えられたときにエラーを返すように変更
- create_communicatorにextensionとtype_configを指定できる引数を追加
- flatbuffersのインストールを促すメッセージの追加