EN

Neural Network Libraries v1.22.0をリリースしました!

2021年10月22日 金曜日

リリース

Posted by Takuya Yashima

Neural Network Libraries v1.22.0をリリースしました!音声合成モデルHiFi-GANや動画のカラー化が可能なモデルであるDeep Exemplar-based Video Colorizationの推論コードを追加しました!また、量子化tfliteコンバータのデモも追加しました!

Spotlight

HiFi-GAN

原音に忠実な音声合成が可能であるHiFi-GAN (Kong et al., NeurIPS 2020)を実装しました!HiFi-GANは敵対的生成ネットワークによって生の波形を生成し、モデリングした音声の周期的パターンが音声のクオリティを向上させる点で非常に重要であることを示しています。

Interactive Demo for quantized tflite converter

過去のリリースにおいて、nnpint8 tfliteに変換する量子化tfliteコンバータ を追加しました。今回のリリースに際して、このコンバータの概念や実際にはどう使うのかを紹介するインタラクティブデモを作成しましたので、ぜひご利用ください!

名称 ノートブック タスク
学習後量子化 Open In Colab 学習後量子化

Deep Exemplar-Based video Colorization

入力動画 リファレンス 出力動画
           
           

End-to-Endのリファレンスベースの動画のカラー化モデルであるDeep Exemplar-based Video Colorization (Zhang et al, CVPR 2019)の推論コードを実装しました!このモデルはセマンティックな対応と色の伝搬のステップを組み合わせる再帰フレームワークを導入することで、時系列方向の一貫性を保ちつつ、リファレンスとして与えた画像に忠実なカラー化を実現しています。

このモデルをすぐに実行できるColabデモも用意しました!ぜひお試しください!

名称 ノートブック タスク
Deep-Exemplar-based-Video-Colorization Open In Colab 動画のカラー化

DataIterator: sliceの挙動の修正

データイテレータの機能であるスライスを用いた際、一部のサンプルが利用不可になってしまう問題を修正しました。

正規化関数の最適化

cudaにおけるlayer_normalization, instance_normalization, group_normalizationが高速に動作するように最適化を行いました。例えば、group_normalizationにおいては既存の実装と比較して、forwardで最大73倍、backwardで最大40倍高速に実行されます。

リダクション系関数の高速化

nnabla.functions.max, nnabla.funtions.sumなどで利用されるTensor Reductionのためのcuda kernelの最適化を行いました。例えばsumの場合、特定のケースにおいては既存の実装と比較して最大で約5倍高速に実行されます。

マルチデバイス利用時の乱数シードセッターの修正

nnabla.functions.randnなどの乱数生成系関数の初期seedがスクリプトの実行毎に、またプロセスごとにランダムに決定されるように修正しました。これにより、デフォルトの設定では、乱数生成関数利用時に再現性が保証されなくなります。再現性を補償したい場合には、nnabla.random.set_function_seed(seed)を利用して手動で初期seedをセットするようにしてください。1例として、毎回の実行でこれらの関数が必ず元バージョンと同様の乱数列を生成してほしい場合には、スクリプトの先頭でnnabla.random.set_function_seed(313)を実行してください。

バグ修正

ビルド関連

ドキュメントの追加・修正

レイヤー関数等の新規追加・改善

ユーティリティの機能改善

デフォルト値などの変更

コア機能の追加・改善

Exampleの新規追加