論文一覧
-
On-the-fly Operation Batching in Dynamic Computation Graphs Framework
RNNのようにサンプルサイズが異なってミニバッチ処理しづらいDNNモデルを効率よく実行するミニバッチアルゴリズム、及びその実装 (by kikura)
-
Beating Atari with Natural Language Guided Reinforcement Learning Reinforcement Learning Atari NLP
強化学習において、Agentが取るべき行動を自然言語によって教示することで学習を加速。Atariで最も難しいと言われるMontezuma's Revengeにおいてhigh performance (by fukuta)
-
Person Search with Natural Language Description Retrieval
自然言語の記述による人の画像のretrieval
-
Efficient Sparse-Winograd Convolutional Neural Networks CNN acceleration ICLR2017
Winograd-convolutionをスパース行列で効率よく行う手法の提案
-
Deep Reinforcement Learning-based Image Captioning with Embedding Reward Caption Generation Reinforcement Learning
強化学習によるキャプション生成
-
Unseen Style Transfer Based on a Conditional Fast Style Transfer Network CNN
テスト時に任意のスタイル画像を与えてStyle Transferを行うことが出来るモデルの提案
-
DEEPDSL: A COMPILATION-BASED DOMAIN- SPECIFIC LANGUAGE FOR DEEP LEARNING acceleration optimization
DNNのモデルを定義するためのDSLを定義し、構造やメモリ操作を最適化することで高速化&省メモリ化
-
Parallel Multi Channel Convolution using General Matrix Multiplication acceleration CNN
convolutionを1x1の小さなカーネルの和と捉えることで高速化・省メモリ化
-
Orthogonal Random Features kernel approximation random feature nips2016
Random特徴の重み行列を直交行列にすると近似性能が上がる。
-
Improved Training of Wasserstein GANs GAN
WGANでLibshitz性を担保するためにweight clippingの代わりに、入力に関するCriticの勾配のノルムへの制約をロスに加えることで更に良いGAN
-
BEGAN: Boundary Equilibrium Generative Adversarial Networks GAN
従来のGANのように真と偽を見分けるDiscriminatorではなく、真のsampleのReconstruction Errorがより小さくなるように学習するようなAutoEncoderをDiscriminatorとして利用。恐らく現時点で一番キレイな顔画像生成に成功
-
Coordinating Filters for Faster Deep Neural Networks acceleration low-rank approximation
学習済みパラメータを低ランク近似するのではなく、低ランク近似しやすいようにパラメータを学習することで、DNNモデルを精度を落とさずに従来手法より高速化
-
Active Convolution: Learning the Shape of Convolution for Image Classification CNN classification
サンプリング領域を学習した変則的なフィルタ形状のconvolutionで精度向上
-
Smart Augmentation - Learning an Optimal Data Augmentation Strategy CNN classification data augmentation
Data Augmentationを行うlearnableなモジュールを追加して汎化性能向上
-
Deformable Convolutional Networks CNN segmentation detection
動的にサンプリング領域を変えるconvolutionを提案し精度向上
-
Is Second-order Information Helpful for Large-scale Visual Recognition? CNN classification
正規化された共分散特徴量を用いて、画像識別の精度向上
-
Mask R-CNN CNN segmentation detection acceleration pose estimation
Faster R-CNNのRegion Proposalに対してsegmentationを施すことで高速・正確なsegmentationを実現
-
SORT: Second-Order Response Transform for Visual Recognition CNN
2次の項を出力するようCNNを拡張して、画像認識の様々なタスクで精度向上
-
Second-order Convolutional Neural Networks CNN acceleration
CNN特徴量から共分散ベースの特徴量を出力するモジュールを追加して画像識別精度向上
-
Need for Speed: A Benchmark for Higher Frame Rate Object Tracking CNN tracking dataset
高フレームレートな動画の物体追跡データセットの提案と既存手法の比較
-
Convolutional Neural Network on Three Orthogonal Planes for Dynamic Texture Classification CNN C3D video
動画を様々な方向にconvすることで精度微増、ロバスト性を向上させた
-
Convolutional Low-Resolution Fine-Grained Classification classification fine-grained
低解像度画像のFine-grainedな識別の際に、超解像を用いることで精度を向上した
-
Wasserstein GAN & Towards Principled Methods for Training Generative Adversarial Networks GAN
Wasserstein GAN & Towards Principled Methods for Training Generative Adversarial Networks
-
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient GAN NLP
SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient
-
Viraliency: Pooling Local Virality CNN
LENAというPoolingモジュールを用いることで僅かだが精度向上
-
Multi-Residual Networks: Improving the Speed and Accuracy of Residual Networks acceleration
Fractal-Net状の構造を色々工夫して、精度・速度向上を目指した
-
Learning long-term dependencies for action recognition with a biologically-inspired deep network RNN biology
脳科学の知識に基づいたfeedback機構をRNNに組み込むことで、スパンの長い時間依存を上手く扱えるRNNモデルの提案
-
Global and Local Information Based Deep Network for Skin Lesion Segmentation CNN medical image
CNNで皮膚病の検出。Global情報とCNNで抽出したLocal情報を組み合わせて精度向上。
-
A Compact DNN: Approaching GoogLeNet-Level Accuracy of Classification and Domain Adaptation CNN model compression dilation
識別精度だけでなく、Domain-Adaptation能力も維持したままモデル圧縮
-
Opening the Black Box of Deep Neural Networks via Information SGD learning theory
SGDによるEncoder-Decoderモデルの学習過程を解析、可視化
-
Exploiting Spatio-Temporal Structure with Recurrent Winner-Take-All Networks CNN RNN RCNN video
winner-take-all dropoutというモジュールを用いたRCNNで動画のフレーム予測。僅かに精度向上。
-
Co-occurrence Filter image processing
共起確率で重み付けされた平滑化フィルタを用いることで、boundary-preserveな平滑化を実現
-
Language Modeling with Gated Convolutional Networks NLP CNN acceleration
NLPにRNNの代わりにsigmoidゲート構造付きのCNNを用いることで高速化
-
XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks CNN acceleration quantization
データ・フィルタともに1bitに量子化してCNNを54倍高速化