【免费】权重初始化1资源-CSDN文库

需积分: 0 31 浏览量更新于2022-08-08 收藏 45KB DOCX 举报

权重初始化在深度学习模型训练中扮演着至关重要的角色，它直接影响到神经网络的收敛速度和性能。正确地初始化权重能够避免梯度消失或梯度爆炸问题，使得模型更有效地学习特征。以下是各种常见的权重初始化方法及其背后的理论： 1. **全部初始化为零**：这种方法简单直观，但会导致所有神经元在训练初期学习到同样的信息，因为它们的梯度相同。这可能会导致网络在早期阶段迅速收敛，但在后期停滞不前。 2. **初始化为相同的随机数**：这种做法与全零初始化类似，同样会引发对称问题，即神经元的输出过于相似，无法学习到输入的不同特征。 3. **初始化为较小的随机数**：通常是从均值为零、方差为1的高斯分布或均匀分布中采样，如`np.random.randn`和`np.random.uniform`。这样的初始化有助于打破对称性，但较小的随机值可能导致在前向传播时方差减小，导致梯度消失，特别是当使用sigmoid或tanh激活函数时。 4. **初始化为较大的随机数**：虽然能够打破对称性，但可能会导致梯度爆炸，尤其是当输入较大且使用sigmoid激活函数时，输出可能过度饱和在0或1，进一步加剧问题。 5. **Xavier/Glorot初始化**：由Xavier和Bengio提出的初始化方法，目的是保持正向传播和反向传播中激活值或梯度的方差不变。适用于如softsign和tanh这类在零点附近近似线性的激活函数。初始化公式考虑了输入和输出节点的数量，确保在不同层间信息传递的稳定性。实现代码可使用`np.random.randn`或`np.random.uniform`，并乘以适当的方差因子。 6. **MSRA/He初始化**：针对ReLU激活函数设计，由Microsoft Research Asia提出。在ReLU激活下，正向传播时状态值的方差保持不变，反向传播时关于激活值的梯度方差保持不变。He初始化的方差是输入节点数量的两倍。与Xavier初始化相比，它更适合ReLU的非线性特性。每种初始化方法都有其适用的场景和局限性。在实际应用中，应根据网络结构和激活函数选择合适的初始化策略。同时，随着深度学习研究的深入，还有其他更先进的初始化技术，如Kaiming初始化（与He初始化类似）、Layer Normalization、Batch Normalization等，它们进一步优化了模型训练的效率和效果。了解和掌握这些初始化方法对于构建高效、稳定的深度学习模型至关重要。

权重初始化

1. 全部初始化为零

实现代码：

W = np.zeros(input_layer_neurons, hidden_layer_neurons)

将权重全部初始化为零，每一层所学到的参数一样，因为梯度一样，所以在反响传播过

程中，每一层神经元相同。所以会导致代价函数在一开始明显下降，一段时间后停止下

降。

2. 初始化为相同的随机数：

将权重 w 初始化为相同的随机数与全部初始化为零的效果一样，会出现 Symmetry

problem

实现代码：

W = np.zeros(input_layer_neurons, hidden_layer_neurons)*T

随机初始化可以打破对称。在随机初始化后，每个神经元可以继续学习其输入的不同功

能。

3. 初始化为较小的随机数

权重参数随机初始化为服从均值为零和方差为 1 的高斯分布函数

对于含有

𝑛

𝑖𝑛

个输入和

out

个输出的全连接层：

standard_normal：

𝑊

𝑖,𝑗

∼

𝑁(0,

𝑛

𝑖𝑛

)

standard_uniform:

𝑊

𝑖,𝑗

∼

𝑁(0,

𝑛

𝑖𝑛

)

实现代码：

W = np.random.randn(input_layer_neurons, hidden_layer_neurons)*0.01

随着时间增加，前向传播时，方差开始减少，梯度也开始向零靠近，会导致梯度消失。

当激活函数使用 sigmoid 时，梯度接近 0.5；当激活函数使用 tanh 时，梯度接近 0

4. 初始化为较大的随机数

实现代码：

下载后可阅读完整内容，剩余2页未读，立即下载

身份认证购VIP最低享 7 折!

30元优惠券

资源推荐

资源评论

KateZeng

粉丝: 27
资源: 330

权重初始化1

keras之权重初始化方式

RFBNet模型初始化权重

Pytorch 实现权重初始化

32. 权重初始化方法1

lambda666#MyDLWorld#机器学习笔记：权重初始化1

TensorFlow中权重的随机初始化的方法

deeplearning.ai第二门课——权重初始化

vgg16网络初始化权重

pytorch网络参数 weight bias 初始化详解

神经网络中权重初始化的示例.zip

Pytorch——梯度下降的变化，数据预处理，权重初始化，防止过拟合

初始化头

权重文件权重文件权重文件权重文件

pr站和权重站

熵权法求权重

类初始化和实例初始化1

Weights-Initialization-in-Nueral-Networks:神经网络中的权重初始化技术

2-机器学习系列（2）：提高深度神经网络性能之--合理初始化及python实现2

忘掉Xavier初始化吧！最强初始化方法ZerO来了.rar

深度学习中激活函数权重初始值的选取.pdf

基于权重初始化-多层卷积神经网络滑动窗口融合的高等教育办学规模预测算法.pdf

yolov8初始化权重文件

信息熵求权重

openpose及权重

detnet59权重

STM32IO初始化 初始化

最新资源

STM32IO初始化初始化