深度学习概览
一、基本概念
1、神经网络由大量的神经元构成,神经元之间分层次,也有连接。神经元有可能起作用或不起作用(激活函数)。大量神经元的组合和参数,可以模拟任意复杂的函数。人的大脑通过学习刺激神经元而学习技能和知识,机器学习里用人工神经网络来模拟人类大脑的活动过程。
2、深度学习:神经元有多个层次,可以表达不同的抽象层次,可以实现降维、特征选择和标记等效果。
3、神经元具有学习的特征:即权重和batis可以根据环境来变化,这样就实现了根据数据来调整算法。
4、迁移学习,强化学习(自动驾驶、玩游戏等)
二、特点
1、不是从数学上想算法,而是通过不断的训练来调整参数,从整体上实现“积累经验”的效果(形象思维)。
2、训练结果存储在网络的架构和参数中,很多时候无法写出真正的函数解析式或生成式(所以叫做ai黑盒)。不管是网络结构还是参数优化,更多的依靠工程经验而不是严格的数学方法
3、基本假设 算法+数据 好于想出来的模型
三、激活函数
1、要求:非线性(网络体现的线性);可微性(基于梯度优化);单调性(保证是凸函数);f(x)≈x(可以随机设置初始值);值域有限,算法稳定,值域无限,容易die,但是计算效率高(learning rate要小点)
2、感知器(Perceptron)
wx+b> 0 -->1 else 0 描述能力至少等于布尔代数(对人脑直接模拟)
2、S型神经元(sigmoid)
1/1+e^-z z = wx+b 0-1之间的值表示可能性(便于微分)
3、tanh 函数 tanh(x)=2sigmoid(2x)−1 效果好于 sigmoid
4、ReLU(校正线性单元:Rectified Linear Unit) f(z) = max(0, z) (解决跨越多层时的梯度消失)
5、PReLU(Parametric Rectified Linear Unit) 添加了一个参数
6、Maxout 参数更多了
四、网络模型
1、前馈网络
2、卷积网络(CNN ):考虑图像的空间信息的特点。适用于 存在非常大型的数据集、大量特征和复杂的分类任务时。比如图像识别、文本转语音、药物发现等。第1个隐藏层中的每个神经元会连接到输入神经元的1个小区域。全连接变成一块对一个(训练更快)。
跨距:向右和向下移动几个像素
前提:局部感受域(local receptive fields)
特征映射:共享权重、共享偏置 (卷积核、滤波器),实现图像的平移识别效果
混合:简化特征映射的输出 max-polling L2-polling
3、RNN(Recurrent neural network)循环神经网络,与大脑更类似,拥有时间相关行为特性的神经网络,存储大量有序信息时。例子:图像分类与字幕添加、政治情感分析、语音识别(同音字和词语)和自然语言处理natural language processing(理解python,排序等,翻译)
长短期记忆单元(Long short-term memory units,LSTMs):简化了RNN的训练
4、深度信念网络,生成式模型和Boltzmann 机(网络+概率)
深度信念网络(DBN)
5、自动编码器 Autoencoder
6、生成对抗网络(GANs )
https://www.leiphone.com/news/201702/NcdoDmmOn1RgeCIL.html
五、优化、调参的方法
1、基本原理:微调结果,看看参数怎么变化(基于梯度微分)
2、梯度下降算法(Batch gradient descent):小球往山下滚(搜索迭代的办法找最小值)
3、随机梯度下降 (Stochastic gradient descent)SGD:(不去找最陡峭的坡)不使用全部的数据来计算偏导数
4、BP、反向传播(backpropagation) :计算大量偏导数的方法
5、深度学习梯度消失的原因:随机的初始化、S型函数、网络结构
6、规范化: 损失函数中添加一个惩罚项,避免过拟合
相关推荐
机器视觉-深度学习
第五章 深度学习预备知识和深度学习概览 5.1_深度学习预备知识 5.2_深度学习预备知识 5.3_深度学习预备知识 5.4_神经网络定义与发展 5.5_感知器及训练法则 5.6_激活函数 5.7_神经网络的种类 5.8_深度学习中的正则化 ...
Michaël Defferrard作者写的一个关于在graph上做深度学习的概览,包含了图的卷积、图粗化、图pooling等过程。
第五章 深度学习预备知识和深度学习概览 5.1_深度学习预备知识 5.2_深度学习预备知识 5.3_深度学习预备知识 5.4_神经网络定义与发展 5.5_感知器及训练法则 5.6_激活函数 5.7_神经网络的种类 5.8_深度...
Apache SINGA 是 Apache 在 2015 年 3 月 17 日接纳的一个孵化项目,是个分布式深度学习平台。SINGA 是基于大型数据集训练大型深度学习模块的常规分布式学习平台。SINGA 支持各种流行的深度学习模块,其中的 feed-...
基于锚框的深度学习物体目标检测算法概览.docx
Deeplearning4j(简称DL4J)是为Java和Scala编写的首个商业级开源分布式深度学习库。DL4J与Hadoop和Spark集成,为商业环境(而非研究工具目的)所设计。Skymind是DL4J的商业支持机构。Deeplearning4j技术先进,以即...
机器学习概览-漏洞银行大咖面对面28-徒手红黑树
此资源为华为HCNA-AI认证教材。 章节目录: 1、AI概览 2、Python编程基础 3、数学基础知识 4、TensorFlow介绍 5、深度学习预备知识和深度学习概览 6、华为云EI概览
此资源为华为HCNA-AI认证的视频讲义 章节目录: 1、AI概览 2、Python编程基础 3、数学基础知识 4、TensorFlow介绍 5、深度学习预备知识和深度学习概览 6、华为云EI概览
如何提升深度学习性能?数据、算法、模型一个都不能少 你是如何提升深度学习模型的效果? 这是我经常被问到的一个问题。 有时候也会换一种问法: 我该如何提高模型的准确率呢? ……或者反过来问: 如果我的...
本篇综述的出发点一方面是希望给检测方向的入门研究人员提供一个技术概览,帮助大家快速了解目标检测技术上下文;另一方面是给工业界应用人员提供一些参考,通过本篇综述,读者可以根据实际业务场景,找到合适的目标...
本文档我学习梯度下降优化算法的总结,开头是深度学习的基本介绍,了解为什么要用梯度下降算法,以及传统的梯度下降算法的弊端,后面的主要章节是从momentum和adaptive两方面,进行梯度下降优化算法的展开,有详细的...
一文概览 CVPR2021 最新18篇 Oral 论文 如何入门多视角人脸正面化生成?不得不看的超详细最新综述! 万字长文细说工业缺陷检测 进可暴力提性能,退可无损做压缩:结构重参数化技术综述 如何入门多视角3D目标识别?超...
学习和实施深度学习方法 奥马尔·奥瓦德(Omar Awwad) 还没有 2020年 使用遗传算法生成CNN 列夫·马丁·扎查尔 还没有 2020年 用神经进化方法发展用于形态变化四足机器人的柔性神经控制器 -李文浩 还没有 2020年 ...
系列的第一篇概览了一下深度学习中的基本概念。第二篇介绍了深度学习的历史背景,以及如何高效地训练神经网络。而这一篇当中,我们将一起认识自然语言处理领域的核心:序列学习。图1:长短期记忆(LSTM)单元。 LSTM有...
图小波变换matlab代码通过域变换流形学习进行图像重建的深度学习并不稳健 与论文“通过域变换流形学习进行图像重建的深度学习并不稳健”相关的代码。 设置 论文中用到的数据可以从 下载,AUTOMAP网络权重可以下载...
一、人工智能与深度学习 超越黑匣子:为深度学习注入结构 持久性 CUDA GPU 编程及其应用 从框架到平台,AWS 的深度学习实践 大规模算力平台构建和多机多卡线性扩展 滴滴端到端语音 AI 技术实践——从算法到应用 飞桨...