【免费】CS231n课程笔记翻译：卷积神经网络笔记1资源-CSDN文库

需积分: 0 159 浏览量更新于2022-08-03 收藏 1.19MB PDF 举报

卷积神经网络（CNNs/ConvNets）是深度学习领域中用于图像处理的重要模型，其设计灵感来源于生物视觉系统，特别适合处理二维图像数据。相比于传统的全连接神经网络，CNNs具有以下特点： 1. **卷积层**：卷积层是CNNs的核心组成部分，每个神经元仅与其感受野内的输入数据相连，而非全连接。这样可以减少大量参数，避免过拟合，并保持网络结构紧凑。在处理图像时，卷积层通常使用滤波器（或称核）对输入数据进行卷积运算，提取特征。例如，一个在CIFAR-10任务中的卷积层可能使用12个滤波器，将32x32x3的输入数据转化为32x32x12的特征图。 2. **滤波器数量**：输出数据体的深度（特征图的通道数）是一个超参数，它等于所用滤波器的数量。每个滤波器在输入数据上滑动，生成对应通道的特征。 3. **步长**：在应用滤波器时，需要指定步长，即滤波器每次移动的距离。步长的选择影响输出数据体的大小。例如，如果步长为1，滤波器将在每个位置进行卷积；若步长为2，则每两步才会进行一次卷积，导致输出尺寸减半。 4. **池化层**：汇聚层（Pooling Layer）用于降低数据的维度，减少计算量，同时保持关键信息。常见的池化操作有最大池化和平均池化，前者保留每个区域的最大特征，后者取平均值。池化层也可以调整步长，但通常不会改变输出深度。 5. **归一化层**：这些层有助于加速训练过程和提高网络稳定性，如局部响应归一化（Local Response Normalization）层，它对神经元的激活值进行局部归一化。 6. **全连接层**：在卷积层和池化层之后，通常会接一个或多个全连接层，用于将特征图转换为分类得分。全连接层的神经元与前一层的所有神经元相连，类似于传统神经网络。 7. **结构优化**：为了进一步减小参数数量，有时会将全连接层转换为卷积层，如在AlexNet中引入的1x1卷积，它可以在保持计算量的同时减少参数。 8. **案例研究**：LeNet、AlexNet、ZFNet、GoogLeNet和VGGNet是CNNs发展中的里程碑，它们各有创新，如LeNet首次提出卷积层和池化层的概念，AlexNet引入ReLU激活和GPU并行计算，GoogLeNet的Inception模块提高了计算效率，VGGNet则通过极深的网络结构（很多3x3卷积层）提升了性能。 9. **计算考虑**：随着图像尺寸的增大，全连接层的参数数量急剧增长，导致计算成本和内存需求增加。CNNs通过卷积和池化降低了这一负担，使得处理大规模图像成为可能。 10. **拓展资源**：除了课程笔记，还有许多其他资源，如论文、开源代码和教程，可以帮助深入理解和应用卷积神经网络。通过上述结构和设计，卷积神经网络在图像识别、物体检测、图像分割等任务中表现出色，成为现代计算机视觉领域不可或缺的工具。

译

者

注

：

本

文

翻

译

自

斯

坦

福

231

课

程笔

记

，

由

课

程

教

师

授

权

进

行

翻

译

。

本

篇

教

程

由

杜

客

和

猴

子

翻

译

完

成

，

堃堃

和

李

艺

颖

进

行

校

对

修

改

。

原

文

如

下

内

容

列

表

：

结

构

概

述

用

来构

建

卷

积神

经网络

的

各

种

层

卷

积

层

汇

聚

层

归

一

化

层

全

连

接

层

将

全

连

接

层

转

化

成

卷

积

层

卷

积神

经网络

的

结

构

231

课

程笔

记

翻

译

：

卷

积神

经网络

笔

记

猴

子

年

前

适

用

于

更

大

尺寸

的

图

像

。

举例

说

来

，一个

尺寸

为

200

的

图

像

，

会

让

神

经

元包

含

200

120,000

个

权

重

值

。

而

网络

中

肯

定

不

止

一个

神

经

元

，

那

么

参

数

的

量

就

会

快

速

增

加

！

显

而

易

见

，

这

种

全

连

接方

式

效

率

低

下，

大

量

的

参

数

也

很快

会

导

致

网络

过

拟

合

。

神

经

元

的

三

维

排

列

。

卷

积神

经网络

针

对

输

入全

部

是

图

像

的

情

况

，

将

结

构

调

整

得

更

加

合

理

，

获

得

了

不

小

的

优

势

。

与

常

规

神

经网络

不

同

，

卷

积神

经网络

的

各

层

中

的

神

经

元

是

维

排

列

的

：

宽

度

、

高

度

和

深

度

（

这

里

的

深

度

指

的

是

激

活

数据

体

的

第

三个

维

度

，

而

不

是

整

个

网络

的

深

度

，

整

个

网络

的

深

度

指

的

是

网络

的

层

数

）

。

举

个

例

子

，

CIFAR

‑10

中

的

图

像

是

作为

卷

积神

经网络

的

输

入

，

该

数据

体

的

维

度

是

（

宽

度

，

高

度

和

深

度

）

。

我

们

将

看

到

，

层

中

的

神

经

元

将

只

与

前

一

层

中

的

一

小

块

区

域

连

接

，

而

不

是

采

取

全

连

接方

式

。

对

于

用

来

分

类

CIFAR

‑10

中

的

图

像

的

卷

积

网络

，

其

最

后

的

输

出

层

的

维

度

是

，

因

为

在

卷

积神

经网络结

构

的

最

后

部

分

将

会

把

全

尺寸

的

图

像

压

缩

为

包

含

分

类

评

分

的

一

个

向

量

，

向

量

是

在

深

度

方

向

排

列

的

。

下

面

是

例

子

：

左

边

是

一个

层

的

神

经网络

。

右

边

是

一个

卷

积神

经网络

，

图

例中

网络

将它

的

神

经

元

都

排

列

成

个

维

度

（

宽

、

高

和

深

度

）

。

卷

积神

经网络

的

每

一

层

都

将

的

输

入

数据

变

化

为

神

经

元

的

激

活

数据

并

输

出

。

在

这

个

例

子

中

，

红

色

的

输

入

层

装

的

是

图

像

，

所

以

它

的

宽

度

和

高

度

就

是

图

像

的

宽

度

和

高

度

，

它

的

深

度

是

（

代

表

了

红

、

绿

、

蓝

种

颜

色

通道

）

。

卷

积神

经网络

是

由

层

组

成

的

。

每

一

层

都

有

一个

简

单

的

API

：

用

一

些

含

或

者

不

含参

数

的

可

导

的

函

数

，

将

输

入

的

数据

变

换

为

的

输

出

数据

。

用

来构

建

卷

积

网络

的

各

种

层

一个

简

单

的

卷

积神

经网络

是

由

各

种

层

按

照

顺

序

排

列

组

成

，

网络

中

的

每

个

层

使

用

一个

可

以

微

分

的

函

数

将

激

活

数据

从

一个

层

传

递

到

另

一个

层

。

卷

积神

经网络

主

要

由

三

种

类

型

的

层

构

成

：

卷

积

层

，

汇

聚

（

ling

）

层

和

全

连

接

层

（

全

连

接

层

和

常

规

神

经网络

中

的

一

样

）

。

通过

将

这

些

层

叠

加

起

来

，

就

可

以

构

建

一个

完

整

的

卷

积神

经网络

。

网络结

构

例

子

：

这

仅仅

是

个

概

述

，下

面

会

更

详解

的

介

绍细

节

。

一个

用

于

CIFAR

‑10

图

像

数据

分

类

的

卷

积神

经网络

的

结

构

可

以

是

[

输

入

层

‑

卷

积

层

‑

层

‑

汇

聚

层

‑

全

连

接

层

]

。

细

节

如

下：

输

入

[32

存

有

图

像

的

原

始

像

素

值

，

本

例中

图

像

宽

高

均

为

，

有

个

颜

色

通道

。

卷

积

层

中

，

神

经

元

与

输

入

层

中

的

一个

局

部

区

域

相

连

，

每

个

神

经

元

都

计

算

自

己

与

输

入

层

相

连

的

小

区

域

与

自

己

权

重

的

内

积

。

卷

积

层

会

计

算

所

有

神

经

元

的

输

出

。

如

果

我

们使

用

个

滤

波

器

（

也

叫

作

核

），

得

到

的

输

出

数据

体

的

维

度

就

是

[32

12]

。

层将

会

逐

个

元

素

地

进

行

激

活

函

数操

作

，

比

如

使

用

以

为

阈

值

的

作为

激

活

函

数

。

该

层对

数据

尺寸

没

有

改

变

，

还

是

[32

12]

。

汇

聚

层

在在

空

间

维

度

（

宽

度

和

高

度

）上

进

行

降

采

样

（

ling

）

操

作

，

数据

尺寸

变

为

[16

12]

。

全

连

接

层将

会

计

算

分

类

评

分

，

数据

尺寸

变

为

10]

，

其

中

个

数

字对

应

的

就

是

CIFAR

‑10

中

个

类

别

的

分

类

评

分

值

。

正

如

其

名

，

全

连

接

层

与

常

规

神

经网络

一

样

，

其

中

每

个

神

经

元

都

与

前

一

层

中

所

有

神

经

元

相

连

接

。

由

此

看

来

，

卷

积神

经网络

一

层

一

层

地

将

图

像

从

原

始

像

素

值

变

换

成

最

终

的

分

类

评

分

值

。

其

中

有

的

层

含

有

参

数

，

有

的

没

有

。

具

体

说

来

，

卷

积

层

和

全

连

接

层

（

CON

）

对

输

入

执

行

变

换操

作

的

时

候

，不

仅会

用

到

激

活

函

数

，

还

会

用

到

很

多

参

数

（

神

经

元

的

突

触

权

值

和

偏

差

）

。

而

层

和

汇

聚

层

则

是

进

行

一个

固

定

不

变

的

函

数操

作

。

卷

积

层

和

全

连

接

层

中

的

参

数

会

随

着

梯

度

下

降

被训

练

，

这

样

卷

积神

经网

络

计

算

出

的

分

类

评

分

就

能

和

训

练

集

中

的

每

个

图

像

的

标

签

吻合

了

。

小

结

：

简

单

案

例中

卷

积神

经网络

的

结

构

，

就

是

一

系

列

的

层将

输

入

数据

变

换

为

输

出

数据

（

比

如

分

类

评

分

）

。

卷

积神

经网络结

构

中

有

几

种

不

同

类

型

的

层

（

目

前

最

流

行

的

有

卷

积

层

、

全

连

接

层

、

层

和

汇

聚

层

）

。

每

个

层

的

输

入

是

数据

，

然

后

使

用

一个

可

导

的

函

数

将

其

变

换

为

的

输

出

数据

。

有

的

层

有

参

数

，

有

的

没

有

（

卷

积

层

和

全

连

接

层

有

，

层

和

汇

聚

层

没

有

）

。

有

的

层

有

额

外

的

超

参

数

，

有

的

没

有

（

卷

积

层

、

全

连

接

层

和

汇

聚

层

有

，

层

没

有

）

。

剩余21页未读，继续阅读

身份认证购VIP最低享 7 折!

30元优惠券

资源推荐

资源评论

大禹倒杯茶

粉丝: 24
资源: 331

CS231n课程笔记翻译：卷积神经网络笔记1

CS231n课程笔记翻译

cs231n 课程笔记

cs231n课程笔记

CS231n课程笔记翻译：卷积神经网络笔记 - 知乎专栏1

CS231n课程笔记翻译：神经网络笔记1（上） - 知乎1

CS231n课程笔记翻译：卷积神经网络笔记.pdf

CS231n课程笔记翻译：神经网络笔记1（下） - 知乎专栏1

CS231n课程笔记翻译：最优化笔记（上） - 知乎专栏1

CS231n课程笔记翻译：线性分类笔记1

CS231n课程笔记翻译：线性分类笔记（上） - 知乎专栏1

卷积神经网络学习笔记

卷积神经网络知识学习笔记

卷积神经网络和机器翻译笔记

卷积神经网络笔记

cs231N中文版笔记

CS231n课程笔记翻译：线性分类笔记（下） - 知乎专栏1

2023最新CS231N课程笔记

cs231n-卷积神经网络-视频教程-文档等等

斯坦福 CS231n 卷积神经网络课程笔记翻译. epub

新版CS231n斯坦福面向视觉识别的卷积神经网络课程笔记全（中英双语）

cs231n卷积神经网络

神经网络学习笔记1

CS231卷积神经网络

卷积神经网络学习笔记.pdf

卷积神经网络 深度学习笔记1

斯坦福cs231n课程笔记pdf版本，包括note，assignment

斯坦福大学cs231n课堂笔记翻译 最优化笔记

CS231n课程笔记.md

最全的李菲菲斯坦福CS231n课程资料，包括中英文课程笔记 assignment中英文以及assignment代码资料等

CS231：CS231n：用于视觉识别的卷积神经网络的完整分配

最新资源

卷积神经网络深度学习笔记1

斯坦福大学cs231n课堂笔记翻译最优化笔记