新手上路
昨天 09:13
主楼
书籍
- 深度学习by Yoshua Bengio, Ian Goodfellow and Aaron Courville (05/07/2015)
- 神经网络与深度学习by Michael Nielsen (Dec 2014)
- 深度学习by Microsoft Research (2013)
- 深度学习教程由蒙特利尔大学 LISA 实验室编写(2015 年 1 月 6 日)
- neuraltalk由 Andrej Karpathy 编写:基于 numpy 的 RNN/LSTM 实现
- 遗传算法导论
- 人工智能:一种现代方法
- 神经网络中的深度学习:概述
- 人工智能与机器学习:主题详解
- 深入理解计算机视觉中的深度学习
- 深入深度学习- 基于 numpy 的交互式深度学习书籍
- 云、移动和边缘的实用深度学习- 一本关于生产过程中优化技术的书籍。
- 深度学习的数学与架构- 作者:Krishnendu Chaudhury
- TensorFlow 2.0 实战- 作者:Thushan Ganegedara
- 用于自然语言处理的深度学习- 作者:Stephan Raaijmakers
- 深度学习模式与实践- by Andrew Ferlitsch
- 深入理解深度学习- by Edward Raff
- Python 深度学习(第二版)- by François Chollet
- 进化式深度学习- by Micheal Lanham
- 工程深度学习平台- by Chi Wang 和 Donald Szeto
- 使用 R 进行深度学习(第二版)- by François Chollet 与 Tomasz Kalinowski 和 J. J. Allaire
- 深度学习中的正则化- by Liu Peng
- Jax 实战- by Grigory Sapunov
- 《Scikit-Learn、Keras 和 TensorFlow 实战机器学习》by Aurélien Géron | 2019 年 10 月 15 日
课程
- 机器学习 - 斯坦福大学by Andrew Ng on Coursera (2010-2014)
- 机器学习 - 加州理工学院by Yaser Abu-Mostafa (2012-2014)
- 机器学习 - 卡内基梅隆大学by Tom Mitchell (2011 年春季)
- 机器学习的神经网络by Geoffrey Hinton in Coursera (2012)
- 神经网络课程by Hugo Larochelle from Université de Sherbrooke (2013)
- 深度学习课程by CILVR lab @ NYU (2014)
- 人工智能 - Berkeleyby Dan Klein and Pieter Abbeel (2013)
- 人工智能 - MITby Patrick Henry Winston (2010)
- 视觉与学习 - 计算机与大脑by Shimon Ullman, Tomaso Poggio, Ethan Meyers @ MIT (2013)
- 用于视觉识别的卷积神经网络 - Stanfordby Fei-Fei Li, Andrej Karpathy (2017)
- 用于自然语言处理的深度学习 - Stanford
- 神经网络 - 优士堡
- 机器学习 - 牛津(2014-2015)
- 深度学习 - 英伟达(2015)
- 研究生暑期学校:深度学习、特征学习由 Geoffrey Hinton、Yoshua Bengio、Yann LeCun、Andrew Ng、Nando de Freitas 等人 @ IPAM, UCLA (2012)
- 深度学习 - Udacity/Googleby Vincent Vanhoucke 和 Arpan Chakraborty (2016)
- 深度学习 - UWaterlooby University of Waterloo 教授 Ali Ghodsi (2015)
- 统计机器学习 - CMUby Prof. Larry Wasserman
- 深度学习课程by Yann LeCun (2016)
- 设计、可视化和理解深度神经网络-加州大学伯克利分校
- UVA 深度学习课程阿姆斯特丹大学人工智能硕士课程。
- MIT 6.S094: 自主驾驶汽车的深度学习
- MIT 6.S191: 深度学习导论
- 加州大学伯克利分校计算机科学系 294:深度强化学习
- Keras in Motion 视频课程
- 面向程序员的深度学习实践by Jeremy Howard - Fast.ai
- 深度学习导论by Bhiksha Raj 教授 (2017)
- AI for Everyoneby Andrew Ng (2019)
- MIT Intro to Deep Learning 7 day bootcamp- 由 MIT 设计的为期七天的训练营,旨在介绍深度学习方法和应用 (2019)
- Deep Blueberry: Deep Learning- 为自学者提供的免费五周末学习计划,学习深度学习架构的基础,如 CNNs、LSTMs、RNNs、VAEs、GANs、DQN、A3C 等 (2019)
- Spinning Up in Deep Reinforcement Learning- 由 OpenAI 提供的免费深度强化学习课程 (2019)
- 深度学习专项课程 - Coursera- 通过 Andrew NG 的最佳课程进入人工智能领域。
- 深度学习 - 加州大学伯克利分校 | STAT-157由 Alex Smola 和 Mu Li(2019 年)
- 面向普通人的机器学习视频课程由 Nick Chase
- 使用 TensorFlow API 的机器学习速成课程- Google AI
- 从基础开始深入学习杰里米·霍华德 - Fast.ai
- 深度强化学习(纳米学位)- Udacity一个为期 3-6 个月的 Udacity 纳米学位,涵盖多门课程(2018 年)
- 动态中的深度学习作者:比尤·卡恩斯(2018 年)
- 使用计算机视觉和深度学习进行人脸检测作者:哈坎·切贝奇
- Classpert 上的深度学习在线课程列表Classpert 在线课程搜索提供的深度学习在线课程列表(部分免费)
- AWS 机器学习亚马逊机器学习大学提供的机器学习和深度学习课程
- 使用 PyTorch 的深度学习入门- Udacity 和 Facebook AI 共同提供的深度学习入门课程
- Kaggle 的深度学习Kaggle 提供的免费深度学习课程
- Yann LeCun 在 CDS 的深度学习课程- DS-GA 1008 · 2021 年春季学期
- 神经网络与深度学习- COMP9444 19T3
- 深度学习 A.I.Shelf
视频和讲座
- 如何创造一个心智by Ray Kurzweil
- 深度学习、自学习与无监督特征学习by Andrew Ng
- 深度学习的最新进展by Geoff Hinton
- 深度学习的不合理有效性by Yann LeCun
- 表示学习的深度学习by Yoshua Bengio
- 分层时间记忆原理by Jeff Hawkins
- 机器学习讨论组 - 斯坦福 AI 实验室深度学习by Adam Coates
- 用深度学习理解世界By Adam Coates
- 揭开无监督特征学习的神秘面纱by Adam Coates
- 深度学习与视觉感知by Yann LeCun
- 神经网络的下一代by Geoffrey Hinton at GoogleTechTalks
- 能够学习的计算机的奇妙与可怕之处by Jeremy Howard at TEDxBrussels
- 无监督深度学习 - 斯坦福大学由 Andrew Ng 在斯坦福大学 (2011)
- 自然语言处理由 Chris Manning 在斯坦福大学
- 深度神经网络入门指南由 Natalie Hammel 和 Lorraine Yurshansky
- 深度学习:从大数据中获取智能由 Steve Jurvetson(及小组)在斯坦福大学的 VLAB
- 《人工智能神经网络与深度学习入门》by Leo Isikdogan at Motorola Mobility HQ
- NIPS 2016 讲座和研讨会视频- NIPS 2016
- 深度学习速成课程: 由 Leo Isikdogan 在 YouTube 上发布的一系列微型讲座 (2018)
- 深度学习速成课程by Oliver Zeigermann
- R 语言动态深度学习:一个实时视频课程,教授如何使用强大的 Keras 库及其 R 语言接口将深度学习应用于文本和图像。
- 深度学习医学影像教程:这个教程以研究生讲座的风格介绍深度学习在医学影像中的应用。这将涵盖流行医学图像领域(胸部 X 光和组织学)的背景,以及处理多模态/视图、分割和计数任务的方法。
- Deepmind x UCL 深度学习:2020 版本
- Deepmind x UCL 强化学习:深度强化学习
- CMU 11-785 深度学习入门 Spring 2020课程:11-785,深度学习入门,Bhiksha Raj
- 机器学习 CS 229:后半部分专注于深度学习,Andrew Ng
- Andrew Ferlitsch 讲解什么是结构化学习
- Andrew Ferlitsch 讲解深度学习设计模式
- 现代 CNN 架构:Andrew Ferlitsch 的设计模式方法
- Andrew Ferlitsch 的 CNN 元参数
- Andrew Ferlitsch 的多任务 CNN:一个实际案例
- Luis Serrano 的深度强化学习入门
- 什么是 GAN 以及它们如何工作?由 Edward Raff
- 在 PyTorch 中编写基本的 WGAN 由 Edward Raff
- 由 Miguel Morales 训练强化学习智能体
- 理解什么是深度学习
论文
您也可以从 这里找到最被引用的深度学习论文- 使用深度卷积神经网络进行 ImageNet 分类
- 使用非常深的自动编码器进行基于内容的图像检索
- 学习深度架构用于人工智能
- CMU 的论文列表
- 用于命名实体识别的神经网络zip
- YB 的训练技巧
- Geoff Hinton 的阅读清单(所有论文)
- 使用循环神经网络进行监督序列标注
- 基于神经网络的统计语言模型
- 循环神经网络的训练
- 用于自然语言处理和计算机视觉的递归深度学习
- 双向 RNN
- LSTM
- GRU - 门控循环单元
- GFRNN. .
- LSTM: A Search Space Odyssey
- A Critical Review of Recurrent Neural Networks for Sequence Learning
- Visualizing and Understanding Recurrent Networks
- Wojciech Zaremba, Ilya Sutskever, 《循环网络架构的实证探索》
- 基于循环神经网络的语言模型
- 循环神经网络语言模型的扩展
- 会议识别中的基于循环神经网络的语言模型
- 用于语音识别的声学模型深度神经网络
- 使用深度循环神经网络进行语音识别
- 强化学习神经图灵机
- 使用 RNN 编码器-解码器学习短语表示进行统计机器翻译
- Google - 使用神经网络进行序列到序列学习
- 记忆网络
- 用于部分观察机器人控制的连续记忆状态策略学习
- Microsoft - 联合建模嵌入和翻译以连接视频和语言
- 神经图灵机
- 随时问我:用于自然语言处理的动态记忆网络
- 使用深度神经网络和树搜索掌握围棋游戏
- 批量归一化
- 残差学习
- 基于条件对抗网络的图像到图像翻译
- 伯克利人工智能研究实验室 (BAIR)
- Google 的 MobileNets
- 在野外使用深度学习进行跨视听识别
- 胶囊之间的动态路由
- 带有 Em 路由的矩阵胶囊
- 高效的 BackProp
- 生成对抗网络
- Fast R-CNN
- FaceNet: 一种用于人脸识别和聚类的统一嵌入
- 用于一次性图像识别的 Siamese 神经网络
- 编程语言的无监督翻译
- 用于一次性学习的匹配网络
- VOLO:视觉识别的视觉展望者
- ViT:一张图胜过 16x16 个词:用于大规模图像识别的 Transformer
- 批量归一化:通过减少内部协变量偏移来加速深度网络训练
- DeepFaceDrawing:从草图深度生成人脸图像
教程
- UFLDL 教程 1
- UFLDL 教程 2
- 用于 NLP 的深度学习(无魔法)
- 深度学习教程:从感知器到深度网络
- 从底层开始的深度学习
- Theano 教程
- Matlab 神经网络
- 使用卷积神经网络检测面部关键点教程
- Torch7 教程
- 网络上的最佳机器学习教程
- VGG 卷积神经网络实践
- TensorFlow 教程
- 更多 TensorFlow 教程
- TensorFlow Python 笔记本
- Keras 和 Lasagne 深度学习教程
- 在 TensorFlow 中使用 LSTM RNN 对原始时间序列进行分类
- 使用卷积神经网络检测面部关键点的教程
- TensorFlow-World
- Python 深度学习
- 深入浅出深度学习
- 深度学习与搜索
- Keras 教程:使用卷积去噪自编码器进行基于内容的图像检索
- Yunjey Choi 的 Pytorch 教程
- 通过 Tensorflow 和 Keras 中的实际案例理解深度卷积神经网络
- 文本分类中传统和深度学习模型的概述和基准测试
- AI 硬件:理解计算机硬件 & 自行组装电脑
- 编程社区精选资源
- 图解自监督学习
- 视觉论文摘要:ALBERT (A Lite BERT)
- 使用 GAN 的半监督深度学习进行黑色素瘤检测
- 使用 Reformers 进行命名实体识别
- 莎士比亚作品中的深度 N-gram 模型
- 宽残差网络
- 使用 Flax 的 Fashion MNIST
- 假新闻分类(带 streamlit 部署)
- 原发性胆汁性肝硬化的回归分析
- 天文目录的交叉匹配方法
- 使用双向 LSTM 进行命名实体识别
- 使用 Tflite 和 Flutter 进行图像识别应用
研究人员
- Aaron Courville
- Abdel-rahman Mohamed
- Adam Coates
- Alex Acero
- Alex Krizhevsky
- Alexander Ilin
- Amos Storkey
- Andrej Karpathy
- Andrew M. Saxe
- Andrew Ng
- Andrew W. Senior
- Andriy Mnih
- Ayse Naz Erkan
- Benjamin Schrauwen
- Bernardete Ribeiro
- Bo David Chen
- Boureau Y-Lan
- Brian Kingsbury
- Christopher Manning
- Clement Farabet
- Dan Claudiu Cireșan
- David Reichert
- Derek Rose
- Dong Yu
- Drausin Wulsin
- Erik M. Schmidt
- Eugenio Culurciello
- Frank Seide
- Galen Andrew
- Geoffrey Hinton
- George Dahl
- Graham Taylor
- Grégoire Montavon
- Guido Francisco Montúfar
- Guillaume Desjardins
- Hannes Schulz
- Hélène Paugam-Moisy
- Honglak Lee
- Hugo Larochelle
- Ilya Sutskever
- Itamar Arel
- James Martens
- Jason Morton
next_post (fid,tid,is_thread,uid,dateline,message,ip) VALUES (:fid,:tid,:is_thread,:uid,:dateline,:message,:ip) error=SQLSTATE[22007]: Invalid datetime format: 1366 Incorrect string value: '\x97 Seni...' for column xiaobd.next_post.message at row 1- Jeff Dean
- Jiquan Mgiam
- Joseph Turian
- Joshua Matthew Susskind
- Jürgen Schmidhuber
- Justin A. Blanco
- Koray Kavukcuoglu
- KyungHyun Cho
- Li Deng
- Lucas Theis
- Ludovic Arnold
- Marc'Aurelio Ranzato
- Martin Längkvist
- Misha Denil
- Mohammad Norouzi
- Nando de Freitas
- Navdeep Jaitly
- Nicolas Le Roux
- Nitish Srivastava
- Noel Lopes
- Oriol Vinyals
- Pascal Vincent
- Patrick Nguyen
- Pedro Domingos
- Peggy Series
- Pierre Sermanet
- Piotr Mirowski
- Quoc V. Le
- Reinhold Scherer
- Richard Socher
- Rob Fergus
- Robert Coop
- Robert Gens
- Roger Grosse
- Ronan Collobert
- Ruslan Salakhutdinov
- Sebastian Gerwinn
- Stéphane Mallat
- Sven Behnke
- Tapani Raiko
- Tara Sainath
- Tijmen Tieleman
- Tom Karnowski
- Tomáš Mikolov
- Ueli Meier
- Vincent Vanhoucke
- Volodymyr Mnih
- Yann LeCun
- Yichuan Tang
- Yoshua Bengio
- Yotaro Kubo
- Youzhi (Will) Zou
- Fei-Fei Li
- Ian Goodfellow
- Robert Laganière
- Merve Ayyüce Kızrak
网站
- deeplearning.net
- deeplearning.stanford.edu
- nlp.stanford.edu
- ai-junkie.com
- cs.brown.edu/research/ai
- eecs.umich.edu/ai
- cs.utexas.edu/users/ai-lab
- cs.washington.edu/research/ai
- aiai.ed.ac.uk
- www-aig.jpl.nasa.gov
- csail.mit.edu
- cgi.cse.unsw.edu.au/~aishare
- cs.rochester.edu/research/ai
- ai.sri.com
- isi.edu/AI/isd.htm
- nrl.navy.mil/itd/aic
- hips.seas.harvard.edu
- AI Weekly
- stat.ucla.edu
- deeplearning.cs.toronto.edu
- jeffdonahue.com/lrcn/
- visualqa.org
- www.mpi-inf.mpg.de/departments/computer-vision...
- Deep Learning News
- Machine Learning is Fun! Adam Geitgey's Blog
- 机器学习指南
- 深度学习入门
- 机器学习精通博客
- ML 编译
- 编程社区精选资源
- 初学者指南:理解卷积神经网络
- ahmedbesbes.com
- amitness.com
- AI Summer
- AI Hub - 由 AAAI、NeurIPS 支持
- CatalyzeX: 建造者和创客的机器学习中心
- The Epic Code
- 所有 AI 新闻
数据集
- MNIST手写数字
- Google 房屋编号来自街景
- CIFAR-10 和 CIFAR-100
- IMAGENET
- Tiny Images8000 万张小型图像
- Flickr Data1 亿张 Yahoo 数据集
- Berkeley Segmentation Dataset 500
- UC Irvine Machine Learning Repository
- Flickr 8k
- Flickr 30k
- Microsoft COCO
- VQA
- Image QA
- AT&T Laboratories Cambridge 人脸数据库
- AVHRR Pathfinder
- Air Freight- Air Freight 数据集是一个光线追踪图像序列以及基于纹理特征的地面真实分割。(455 张图像+GT,每张 160x120 像素)。(格式:PNG)
- Amsterdam Library of Object Images- ALOI 是一个包含一千个小物体的彩色图像集合,用于科学目的。为了捕捉物体记录中的感官变化,我们对每个物体系统地改变了观察角度、照明角度和照明颜色,并额外捕获了宽基线立体图像。我们对每个物体记录了一百多张图像,该集合总共包含 110,250 张图像。(格式:png)
- Annotated face, hand, cardiac & meat images- 大多数图像和注释通过使用 AAM-API 进行各种 ASM/AAM 分析来补充。(格式:bmp,asf)
- 图像分析与计算机图形学
- 布朗大学刺激数据集- 包含多种数据集,如 geons、物体和"greebles"。适用于测试识别算法。(格式:pict)
- CAVIAR 商场和公共场所行为视频序列- 90 个序列中包含 90K 视频帧,涵盖各种人类活动,并提供检测和行为分类的 XML 标注(格式:MPEG2 & JPEG)
- 机器视觉单元
- CCITT Fax 标准图像- 8 张图像 (格式:gif)
- CMU CIL 的立体数据与真实数据 - 3 组 11 张图像,包括彩色 tiff 图像和光谱辐射测量 (格式:gif, tiff)
- CMU PIE 数据库- 一个包含 68 个人在 13 种姿势、43 种照明条件和 4 种不同表情下拍摄的 41,368 张面部图像的数据库。
- CMU VASC 图像数据库- 图像、序列、立体对(数千张图像) (格式:Sun Rasterimage)
- Caltech Image Database- 约 20 张图像 - 主要为小物体和玩具的俯视图。(格式:GIF)
- Columbia-Utrecht Reflectance and Texture Database- 对 60 多个 3D 纹理样本进行反射率测量,观测方向超过 200 种不同的组合。(格式:bmp)
- Computational Colour Constancy Data- 一个面向计算色恒常性的数据集,但也可用于计算机视觉。包括合成数据、相机传感器数据以及 700 多张图像。(格式:tiff)
- Computational Vision Lab
- 基于内容的图像检索数据库- 11 套彩色图像用于测试基于内容的检索算法。大多数套件都包含一个描述文件,其中包含每张图像中对象的名称。(格式:jpg)
- 高效基于内容的检索小组
- 密集采样视图球体- 密集采样视图球体 - 两个玩具对象的视图球体的上半部分,每个对象有 2500 张图像。(格式:tiff)
- 计算机科学 VII(图形系统)
- 数字胚胎- 数字胚胎是新型对象,可用于开发和测试对象识别系统。它们具有有机的外观。(格式:可按需提供多种格式)
- 明尼苏达大学视觉实验室
- 萨尔瓦多胃肠道视频内窥镜图谱- 包含从胃肠道视频内窥镜研究中获取的高分辨率图像和视频。(格式:jpg、mpg、gif)
- FG-NET 面部老化数据库- 数据库包含 1002 张面部图像,展示不同年龄的受试者。(格式:jpg)
- FVC2000 指纹数据库- FVC2000 是指纹验证算法的第一个国际竞赛。FVC2000 基准测试由四个指纹数据库构成(总共 3520 个指纹)。
- 生物识别系统实验室- 博洛尼亚大学
- 面部和手势图像及图像序列- 包含面部和手势的多个图像数据集,用于基准测试的标注真实数据
- 德国手指语数据库- 该数据库包含 35 个手势,由 1400 个图像序列组成,这些序列记录了 20 个不同的人在非均匀日光条件下做出的手势。(格式:mpg,jpg)
- 语言处理与模式识别
- Groningen 自然图像数据库- 4000+ 1536x1024 (16 位) 校准户外图像 (格式:自制)
- ICG 测试屋序列- 2 个不同视点高度的转盘序列,每个 36 张图像,分辨率 1000x750,彩色 (格式:PPM)
- 计算机图形与视觉研究所
- IEN 图像库- 1000+张图像,主要为户外序列(格式:raw, ppm)
- INRIA 的 Syntim 图像数据库- 15 张简单物体的彩色图像(格式:gif)
- INRIA
- INRIA 的 Syntim 立体数据库- 34 对校准彩色立体图像(格式:gif)
- 图像分析实验室- 从各种成像模式获取的图像——原始 CFA 图像、距离图像和大量的“医学图像”。(格式:自制)
- 图像分析实验室
- 图像数据库- 包含一些纹理的图像数据库
- JAFFE 面部表情图像数据库- JAFFE 数据库包含 213 张日本女性受试者的图像,她们摆出 6 种基本面部表情以及中性姿态。还免费提供情绪形容词的评分,供研究使用。(格式:TIFF 灰度图像。)
- ATR Research, Kyoto, Japan
- JISCT Stereo Evaluation - 44 image pairs. These data have been used in an evaluation of stereo analysis, as described in the April 1993 ARPA Image Understanding Workshop paper ``The JISCT Stereo Evaluation'' by R.C.Bolles, H.H.Baker, and M.J.Hannah, 263--274 (Formats: SSI)
- MIT Vision Texture- Image archive (100+ images) (Formats: ppm)
- MIT face images and more - hundreds of images (Formats: homebrew)
- 机器视觉- 来自 Jain、Kasturi、Schunck 教材的图像 (20+ 张图像) (格式:GIF TIFF)
- 乳腺 X 光图像数据库- 100 张或更多乳腺 X 光图像,包含真实标签。可根据请求提供更多图像,并提供到其他几个乳腺 X 光图像数据库的链接。(格式:自制)
- ftp://ftp.cps.msu.edu/pub/prip - 许多图像 (格式:未知)
- Middlebury 立体数据集与真实标签- 六个包含平面区域的场景的多帧立体数据集。每个数据集包含 9 张彩色图像和亚像素精度真实标签数据。(格式:ppm)
- Middlebury 立体视觉研究页面- Middlebury 学院
- Modis 机载模拟器,画廊和数据集- 支持 NASA EOS 计划的环境建模全球高空影像(格式:JPG 和 HDF)
- NIST 指纹和手写 - 数据集 - 数千张图像(格式:未知)
- NIST 指纹数据 - 压缩的多部分 uu 编码 tar 文件
- 美国国立医学图书馆可见人体项目- 颜色、CAT 和 MRI 图像样本 - 超过 30 张图像(格式:jpeg)
- 国家设计资源库- 超过 55,000 个 3D CAD 和实体模型,主要为机械/加工工程设计。(格式:gif,vrml,wrl,stp,sat)
- 几何与智能计算实验室
- 俄亥俄州立大学(密歇根州立大学)3D 对象模型数据库- 在多年收集的几组 3D 对象模型,用于对象识别研究(格式:homebrew, vrml)
- OSU (MSU/WSU) 距离图像数据库- 数百张真实和合成图像(格式:gif,homebrew)
- OSU/SAMPL 数据库:距离图像、3D 模型、静态图像、运动序列- 超过 1000 张距离图像、3D 物体模型、静态图像和运动序列(格式:gif,ppm,vrml,homebrew)
- 信号分析与机器感知实验室
- 奥塔哥光流评估序列- 包含机器可读的真实和合成序列光流场,以及用于为新序列生成光流场的工具。(格式:ppm,tif,homebrew)
- 视觉研究组
- ftp://ftp.limsi.fr/pub/quenot/opflow/testdata/piv/ - 用于测试粒子图像测速应用的真实和合成图像序列。这些图像可用于光流和图像匹配算法的测试。(格式:pgm(原始))
- LIMSI-CNRS/CHM/IMM/vision
- LIMSI-CNRS
- 光度三维表面纹理数据库- 这是第一个提供完整真实表面旋转和注册光度立体数据的 3D 纹理数据库(30 种纹理,1680 张图像)。(格式:TIFF)
- 用于光流分析的序列(SOFA)- 9 个为测试运动分析应用而设计的合成序列,包括完整的运动真实值和相机参数。(格式:gif)
- 计算机视觉组
- 用于基于流的重建的序列- 用于测试运动结构算法的合成序列(格式:pgm)
- 带有真实深度图和遮挡的立体图像- 一小部分带有不同噪声量的走廊合成图像。使用这些图像来评估你的立体算法。(格式:raw、viff (khoros) 或 tiff)
- 斯图加特范围图像数据库- 来自网络上的高分辨率多边形模型的合成范围图像集合(格式:homebrew)
- 部门图像理解
- AR 人脸数据库- 包含超过 4,000 张彩色图像,对应 126 个人的面部(70 名男性和 56 名女性)。正面视图,具有面部表情、照明和遮挡的变化。(格式:RAW (RGB 24 位))
- Purdue 机器人视觉实验室
- MIT-CSAIL 物体和场景数据库- 用于测试多类别物体检测和场景识别算法的数据库。超过 72,000 张图像,2873 个标注帧。超过 50 个标注物体类别。(格式:jpg)
- RVL SPEC-DB (SPECularity DataBase)- 收集了在三种不同照明条件(漫射/环境/定向)下拍摄的 100 个物体的 300 多张真实图像。-- 使用这些图像来测试用于检测和补偿彩色图像中高光算法。(格式:TIFF )
- 机器人视觉实验室
- Xm2vts 数据库- XM2VTSDB 包含 295 人在四个月内录制的四个数字录音。该数据库包含面部图像和视频数据。
- 视觉、语音和信号处理中心
- 交通图像序列和 '大理石块' 序列- 数千帧数字化交通图像序列以及 '大理石块' 序列(灰度图像)(格式:GIF)
- IAKS/KOGS
- U Bern 人脸图像 - 数百张图像(格式:Sun rasterfile)
- U Michigan 纹理(格式:压缩原始格式)
- U Oulu 木材和结数据库- 包括分类 - 1000 多张彩色图像(格式:ppm)
- UCID - 一个未压缩的彩色图像数据库- 一个具有预定义真实标签的图像检索基准数据库。(格式:tiff)
- UMass Vision Image Archive- 大型图像数据库,包含航拍、太空、立体、医学图像等。(格式:自制)
- UNC's 3D image database - 包含大量图像。(格式:GIF)
- USF Range Image Data with Segmentation Ground Truth- 80 个图像集。(格式:Sun rasterimage)
- University of Oulu Physics-based Face Database- 包含在不同光源和相机校准条件下的人脸彩色图像,以及每个人的皮肤光谱反射率测量数据。
- 机器视觉与媒体处理单元
- 奥卢大学纹理数据库- 包含 320 种表面纹理的数据库,每种纹理在三种光源、六种空间分辨率和九种旋转角度下进行捕获。还提供了一套测试套件,以便以标准方式测试纹理分割、分类和检索算法。(格式:bmp、ras、xv)
- 机器视觉小组
- Usenix 人脸数据库 - 来自许多不同网站的人脸图像(约 994 张)
- 查看球面数据库- 8 个物体从许多不同视点看到的图像。球面视图使用 172 张/球面的测地线进行采样。提供两个用于训练和测试的数据集。(格式:ppm)
- PRIMA, GRAVIR
- Vision-list 图像档案 - 许多图像,多种格式
- Wiry 物体识别数据库- 数千张购物车、梯子、凳子、自行车、椅子和杂乱场景的图像,带有边缘和区域的地面真实标注。(格式:jpg)
- 3D Vision Group
- Yale Face Database- 165 张图像(15 个人)具有不同的光照、表情和遮挡配置。
- Yale Face Database B- 每个受试者有 5760 张单光源图像,在 576 种观看条件下(9 个姿势 x 64 种照明条件)拍摄。(格式:PGM)
- Computational Vision and Control Center
- DeepMind QA Corpus- 来自 CNN 和 DailyMail 的文本问答语料库。总文档量超过 30 万份。论文供参考。
- YouTube-8M Dataset- YouTube-8M 是一个大规模标记视频数据集,包含 800 万个 YouTube 视频 ID 以及来自 4800 个视觉实体词汇的标签。
- Open Images dataset- Open Images 是一个包含约 900 万张图像 URL 的数据集,这些图像已被标记超过 6000 个类别。
- Visual Object Classes Challenge 2012 (VOC2012)- VOC2012 数据集包含 12k 张图像,有 20 个标注类别用于目标检测和分割。
- Fashion-MNIST- 一个类似于 MNIST 的时尚产品数据集,包含 60,000 个训练样本和 10,000 个测试样本。每个样本是一个 28x28 的灰度图像,并关联一个来自 10 个类别的标签。
- 大规模时尚(DeepFashion)数据库- 包含超过 800,000 张多样化的时尚图像。该数据集中的每张图像都标记有 50 个类别、1,000 个描述性属性、边界框和服装关键点。
- FakeNewsCorpus- 包含约 1000 万篇使用opensources.co类型分类的新闻文章。
- LLVIP- 用于低光视觉研究的 15,488 对可见光-红外图像(共 30,976 张图像),项目页面
- MSDA- 超过 500 万张来自 5 个不同领域的图像,用于多源 OCR/文本识别 DA 研究,项目页面
- SANAD: 用于自动文本分类的单标签阿拉伯新闻文章数据集- SANAD 数据集是一个包含大量阿拉伯新闻文章的大型集合,可用于不同的阿拉伯 NLP 任务,如文本分类和词嵌入。这些文章是使用为三个流行的新闻网站(阿尔哈利吉、阿尔阿拉比亚和 akhbarona)专门编写的 Python 脚本收集的。
- Referit3D- 两个大规模且互补的视觉-语言数据集(即 Nr3D 和 Sr3D),用于在 ScanNet 场景中识别细粒度 3D 物体。Nr3D 包含 41.5K 自然自由形式的语句,而 Sr3d 包含 83.5K 基于模板的语句。
- SQuAD- 斯坦福发布了约 10 万个英文问答对和约 5 万个无解问题
- FQuAD- Illuin Technology 发布了约 25,000 个法语问答对
- GermanQuAD 和 GermanDPR- deepset 发布了约 14,000 个德语问答对
- SberQuAD- Sberbank 发布了约 90,000 个俄语问答对
- ArtEmis- 包含 80,000 件 WikiArt 艺术品的 450K 个情感反应标注和语言解释
会议
- CVPR - IEEE 计算机视觉与模式识别会议
- AAMAS - 国际自主代理与多代理系统联合会议
- IJCAI - 国际人工智能联合会议
- ICML - 国际机器学习会议
- ECML - 欧洲机器学习会议
- KDD - 知识发现与数据挖掘
- NIPS - 神经信息处理系统
- O'Reilly AI Conference - O'Reilly 人工智能会议
- ICDM - 国际数据挖掘会议
- ICCV - 国际计算机视觉会议
- AAAI - 人工智能进步协会
- MAIS - Montreal AI Symposium
框架
- Caffe
- Torch7
- Theano
- cuda-convnet
- convetjs
- Ccv
- NuPIC
- DeepLearning4J
- Brain
- DeepLearnToolbox
- Deepnet
- Deeppy
- JavaNN
- hebel
- Mocha.jl
- OpenDL
- cuDNN
- MGL
- Knet.jl
- Nvidia DIGITS - 基于 Caffe 的 Web 应用
- Neon - 基于 Python 的深度学习框架
- Keras - 基于 Theano 的深度学习库
- Chainer - 一个用于深度学习的灵活神经网络框架
- RNNLM Toolkit
- RNNLIB - 一个循环神经网络库
- char-rnn
- MatConvNet: MATLAB 的 CNN
- Minerva - 一种快速且灵活的多 GPU 深度学习工具
- Brainstorm - 快速、灵活且有趣的神经网络。
- Tensorflow - 一种使用数据流图进行数值计算的开源软件库
- DMTK - Microsoft 分布式机器学习工具包
- Scikit Flow - TensorFlow 的简化接口(模仿 Scikit Learn)
- MXnet - 轻量级、便携、灵活的分布式/移动深度学习框架
- Veles - 三星分布式机器学习平台
- Marvin - 一个仅使用 GPU 的极简 N 维卷积网络框架
- Apache SINGA - 一个通用的分布式深度学习平台
- DSSTNE - 亚马逊用于构建深度学习模型的库
- SyntaxNet - Google 的句法解析器 - 一个 TensorFlow 依赖库
- mlpack - 一个可扩展的机器学习库
- Torchnet - 基于 Torch 的深度学习库
- Paddle - 百度并行分布式深度学习
- NeuPy - 基于 Theano 的用于人工神经网络和深度学习的 Python 库
- Lasagne - 一个轻量级库,用于在 Theano 中构建和训练神经网络
- nolearn - 现有神经网络库的包装器和抽象,尤其是 Lasagne
- Sonnet - Google DeepMind 构建神经网络的库
- PyTorch - 在 Python 中进行张量和动态神经网络的库,具有强大的 GPU 加速
- CNTK - Microsoft Cognitive Toolkit
- Serpent.AI - Game agent framework: Use any video game as a deep learning sandbox
- Caffe2 - A New Lightweight, Modular, and Scalable Deep Learning Framework
- deeplearn.js - Hardware-accelerated deep learning and linear algebra (NumPy) library for the web
- TVM - 面向 CPU、GPU 和专用加速器的端到端深度学习编译器栈
- Coach - 英特尔® AI 实验室的强化学习教练
- albumentations - 一个快速且框架无关的图像增强库
- Neuraxle - 一个通用的机器学习流水线框架
- Catalyst:PyTorch DL & RL 研究的高级工具库。它专注于可复现性、快速实验和代码/想法的复用
- garage - 可复现强化学习研究的工具包
- Detecto - 用 5-10 行代码训练和运行目标检测模型
- Karate Club - 用于图结构数据的无监督机器学习库
- Synapses - 一个轻量级的神经网络库,可在任何地方运行
- TensorForce - 一个用于强化学习的 TensorFlow 库
- Hopsworks - 一个用于机器学习和数据密集型 AI 的特征存储库
- Feast - 由 Gojek/Google 为 GCP 开发的机器学习特征存储库
- PyTorch Geometric Temporal - 动态图上的表示学习
- lightly - 用于自监督学习的计算机视觉框架
- Trax — 清晰代码和速度的深度学习
- Flax - 为 JAX 设计的灵活神经网络生态系统
- QuickVision
- Colossal-AI - An Integrated Large-scale Model Training System with Efficient Parallelization Techniques
- haystack: an open-source neural search framework
- Maze- 面向实际应用的深度强化学习框架,解决现实世界中的决策问题。
- InsNet - 一个用于构建基于实例的 NLP 模型的神经网络库,支持无填充的动态批处理
工具
- Nebullvm- 易于使用的库,通过利用多个深度学习编译器来加速深度学习推理。
- Netron- 深度学习和机器学习模型的可视化工具
- Jupyter Notebook- 基于网络的交互式计算笔记本环境
- TensorBoard- TensorFlow 的可视化工具
- Visual Studio Tools for AI- 开发、调试和部署深度学习和人工智能解决方案
- TensorWatch- 深度学习的调试和可视化
- ML Workspace- 一站式基于网络的机器学习和数据科学集成开发环境。
- dowel- 机器学习研究的小型日志记录器。只需一次调用
logger.log(),即可将任何对象记录到控制台、CSV 文件、TensorBoard、文本日志文件等。 - Neptune- 轻量级实验跟踪和结果可视化工具。
- CatalyzeX- 浏览器扩展(Chrome 和 Firefox),可自动查找并链接到在线 ML 论文的代码实现:Google、Twitter、Arxiv、Scholar 等。
- Determined- 集成分布式训练、超参数调优、智能 GPU 调度、实验跟踪和模型注册功能的深度学习训练平台。
- DAGsHub- 开源机器学习社区平台——轻松管理实验、数据和模型,并创建协作机器学习项目。
- hub- activeloop.ai 提供的 TensorFlow/PyTorch 最快非结构化数据集管理工具。支持数据流和版本控制。将大型数据转换为云端单一 numpy-like 数组,可在任何机器上访问。
- DVC- DVC 旨在使机器学习模型可共享和可复现。它设计用于处理大型文件、数据集、机器学习模型和指标,以及代码。
- CML- CML 帮助您将最喜欢的 DevOps 工具带到机器学习领域。
- MLEM- MLEM 是一个易于打包、部署和提供机器学习模型的工具。它无缝支持实时服务、批量处理等多种场景。
- Maxim AI- 用于 AI 代理模拟、评估和可观察性的工具。
其他
- Caffe Webinar
- Github 上的 100 个最佳 DL 资源
- Word2Vec
- Caffe DockerFile
- TorontoDeepLEarning convnet
- gfx.js
- Torch7 Cheat sheet
- MIT 'Advanced Natural Language Processing'课程的其他资源
- MIT《机器学习》课程杂项
- MIT《学习网络:回归与分类》课程杂项
- MIT《神经编码与声音感知》课程杂项
- 在 Spark 上实现分布式深度学习网络
- 一个使用深度学习学习下棋的棋类 AI。
- 复现 DeepMind 的"Playing Atari with Deep Reinforcement Learning"实验结果
- Wiki2Vec。从维基百科转储中获取实体和词的 Word2vec 向量
- DeepMind 文章的原始代码+调整
- Google deepdream - 神经网络艺术
- 一个高效的、批处理的 LSTM。
- 一个用于生成古典音乐的循环神经网络。
- 记忆网络实现 - Facebook
- 使用 Google 的 FaceNet 深度神经网络进行人脸识别。
- 基本数字识别神经网络
- 情感识别 API 演示 - Microsoft
- 在 TensorFlow 中加载 Caffe 模型的概念验证
- YOLO: 实时目标检测
- YOLO: 使用 Python 的实用实现
- AlphaGo - 对 DeepMind 2016 年《自然》杂志发表的论文“使用深度神经网络和树搜索掌握围棋游戏”的复现
- 软件工程师的机器学习
- 机器学习很有趣!
- Siraj Raval 的深度学习教程
- Dockerface- 易于安装和使用的深度学习 Faster R-CNN 人脸检测,适用于图像和视频的 Docker 容器。
- Awesome Deep Learning Music- 与深度学习科学研究中应用于音乐的精选文章列表
- Awesome Graph Embedding- 精选与图结构数据在图层面的深度学习科学研究相关的文章列表。
- Awesome Network Embedding- 精选与图结构数据在节点层面的深度学习科学研究相关的文章列表。
- Microsoft Recommenders包含构建推荐系统的示例、工具和最佳实践。为自学和在自己的应用程序中自定义提供了多种最先进算法的实现。
- 循环神经网络的无与伦比的有效性- Andrej Karpathy 的博客文章,关于使用 RNN 生成文本。
- Ladder Network- 用于半监督学习的 Ladder Network Keras 实现
- toolbox: 精选的机器学习库列表
- CNN 解释器
- AI 专家路线图- 成为人工智能专家的路线图
- 超棒药物相互作用、协同作用和多药治疗预测