共 54 篇文章
显示摘要每页显示  条
为此,我们引入最优传输的几何理论(Optimal Mass Transportation),这个理论可视化了W-GAN的关键概念,例如概率分布,概率生成模型(生成器),Wasserstein距离。Wasserstein-GAN模型中,关键的概念包括概率分布(概率测度),概率测度间的最优传输映射(生成器),概率测度间的Wasserstein距离。概率分布 GAN模型中有两个至关重要的概率分布...
以静制动的TensorFlow Fold动态计算图介绍。第三层,能高效计算,能够在同一个批次里包含不同结构的样本,这个层次的多结构输入问题有些论坛上也叫Dynamic Batching问题, TensorFlow Fold的核心算法Dynamic Batching算法刚好同名,TensorFlow Fold和以后实现Dynamic Batching算法的框架处于这个层次。新推出的TensorFlow Fold就是一个TensorFl...
昨天,创业公司Gamalon也以认猫为例展示了他们的AI,不过,这个AI不需要大量训练数据,只需要几张图片做例子。在认猫这件事上,我们先给Gamalon的AI提供几个例子,让它对猫的胡须、尾巴、眼睛等部分建立印象,然后这个系统每见到一张新的猫,都可以继续升级自己对于猫的认识;△ Gamalon创始人、CEO Ben Vigoda.Gamalon创始人Ben Vigoda说,他...
9 个超酷的深度学习案例。https://github.com/jcjohnson/neural-style.https://github.com/alexjc/neural-doodle.https://github.com/david-gpu/srez.https://github.com/yahoo/open_nsfw.https://github.com/yenchenlin/DeepLearningFlappyBird.Miles Deep:成人视频分类器,精确度达到 95%.借助深度卷积神经网络,Miles Deep 可以快速针对成...
ResNeXt:何恺明 Facebook 升级 ResNet,提出神经网络新维度。文章介绍了其团队提出的 deep fusion 概念,沿着 deep fusion的思路研究了类似 ResNet、Highway、Inception等结构的深度融合网络,探索了“深度”在神经网络当中究竟带来了什么,并提出了一个新的网络模型,在不同数据集上均取得了不错的表现。可以发现像 ResNet、Highway、Incepti...
通过强化学习,DNC可以完成a moving blocks puzzle的游戏,总起来讲,DNC可以完成之前没有额外存储的神经网络很难完成的复杂的,结构化的任务。一个DNC网络就是一个神经网络结合额外的存储矩阵。DNC利用存储空间保存了迭代过程目标,这样它就能执行任何一个选定的目标,我们发现给定一个目标,经过要经过很多步骤,第一步也会从存储空间中找出...
【新智元导读】Samy Bengio,刚刚创业的 Youshua Bengio的弟弟,昨天在 Arxiv 上发布了他与同事、Google Brain 研究人员 Lukasz Kais 被今年 NISP 接收的文章,提出了一种新的模型,提升神经机器翻译水平,同时解开了 Active Memory 为何在提升机器翻译的效果不如提升语音、图像识别的原因,最后介绍了如何发挥 Active Memory 模型的最大潜力,...
【前言】8月初的蒙特利尔深度学习暑期班,由Yoshua Bengio、 Leon Bottou等大神组成的讲师团奉献了10天精彩的讲座,剑桥大学自然语言处理与信息检索研究组副研究员Marek Rei参加了本次课程,在本文中,他精炼地总结了学到的26个有代表性的知识点,包括分布式表示,tricks的技巧,对抗样本的训练,Neural Machine Translation,以及Theano、Nvid...
py_binary( name = ''simple_console'', srcs = [''simple_console.py''], srcs_version = ''PY2AND3'', deps = [''//tensorflow:tensorflow_py''],)py_library( name = ''tensorflow_py'', srcs = [''__init__.py''], ...
梯度下降优化算法综述。随机梯度下降(Stochastic gradient descent)梯度下降优化算法。Adaptive Moment Estimation(Adam) 也是一种不同参数自适应不同学习速率方法,与Adadelta与RMSprop区别在于,它计算历史梯度衰减方式不同,不使用历史平方衰减,其衰减方式类似动量,如下: mt与vt分别是梯度的带权平均和带权有偏方差,初始为0向量,Adam的...
帮助 | 留言交流 | 联系我们 | 服务条款 | 下载网文摘手 | 下载手机客户端
北京六智信息技术股份有限公司 Copyright© 2005-2024 360doc.com , All Rights Reserved
京ICP证090625号 京ICP备05038915号 京网文[2016]6433-853号 京公网安备11010502030377号
返回
顶部