您当前的位置:首页 > 生活热点

enet *** 学院(enet硅谷动力学院)

时间:2022-03-30 08:21:23

Enet *** 学院(enet硅谷动力学院)雷锋网2019-02-26 10:14:15

本文是为AI研究院整理的技术博客。原标题:

ENet——一种用于实时语义分割的深度神经架构

作者|阿鲁纳瓦

翻译| callofduty890

校对|酱梨回顾|皮塔整理|鲤鱼网

原始链接:

https://towardsdatascience . com/enet-a-deep-neural-architecture-for-real-time-semantic-segmentation-2 baa 59 cf 97 e 9

图一。一个语义分段的家伙和一个卡通之间的对话

这是本文的摘要:

ENet:用于实时语义分割的深度神经 *** 架构

作者:亚当·帕兹克

论文:https://arxiv.org/abs/1606.02147

介绍

ENet(高效神经 *** )提供了实时按像素进行语义分割的能力。ENet的速度提高了18倍,对FLOP的要求降低了75倍,参数减少了79倍,为现有模型提供了相似或更好的精度。在CamVid、CityScapes和SUN数据集上的测试。

*** :

图3。ENet架构

以上是完整的 *** 架构。

它分为几个阶段,通过表格中的水平线和每个块名称后的之一个数字突出显示。报告的输出大小是输入图像分辨率512 * 512。

图4。详细描述了enet的各个模块。

视觉表达:

-初始模块是(a)中所示的模块-瓶颈模块显示在(b)中

每个瓶颈模块包括:

-1x1投影,减少尺寸

-主卷积层(conv)(-正常、扩展或完整)(3x3)

-1x1扩展

并且他们在所有卷积层之间放置批量标准化和PReLU。

如果瓶颈模块正在缩减采样,则将更大池层添加到主分支。此外,之一个1x1投影被替换为2x2卷积,跨距= 2。

它们不会激活任何填充来匹配要素地图的数量。

Conv有时是非对称卷积,即5 * 1和1 * 5卷积的序列。

对于正则项,他们使用空间落差:

瓶颈2.0之前,p = 0.01

-完成后p = 0.1

所以,

阶段1,2,3-编码器-由五个瓶颈模块组成(除了阶段3,没有下采样)。

阶段4,5-解码器-阶段4包含3个瓶颈,阶段5包含2个瓶颈模块。

接下来是一个fullconv,它输出最终输出-C * 512 * 512大小,其中C是滤波器的数量。

有一些事实:

-他们在任何预测中都没有使用偏见术语。

-在每个卷积层和激活之间,他们使用批量标准化。

-在解码器中,MaxPooling被MaxUnpooling代替。

-在解码器中,填充被无偏差地替换为空间卷积。

-在最后一个(5.0)上采样模块中不使用池化索引。

- *** 的最后一个模块是裸完全卷积,占用了解码器的大部分处理时间。

-每个侧支缺少一个空,之一级p = 0.01,下一级p = 0.1。

结果

测试ENet的性能。

-CamVid(道路场景)

-城市景观(道路场景)

-太阳RGB-D(室内场景)

使用SegNet [2]作为基线,因为它是最快的分段模型之一。使用cuDNN后端来使用Torch7库。

使用英伟达Titan X GPU和英伟达TX1嵌入式系统模块记录推理速度。输入图像大小为640x360,速度超过10fps。

图5。以SegNet为基线的两种不同GPU推理时间的比较

图6。segnet和ENet的硬件要求

基准和亚当一起。ENet,融合非常快。每个数据集上使用4个Titan X GPU,训练只需要3-6个小时。

分两个阶段:

首先,他们训练编码器对输入图像的降采样区域进行分类。

然后附加一个解码器,训练 *** 进行上采样和像素分类。

学习率-5e-4

L2重量衰减是2e-4

批量为10。

自定义类别权重方案定义为

图7显示了。自定义类别权重方案的公式

其中c = 1.02,类别权重限制在[1.50]的区间内

图8。Cityscaps数据集的性能

图9。Camvid数据集的性能

参考:

A.Paszke、A. Chaurasia、S. Kim和E. Culurciello。Enet:用于实时语义分割的深度神经 *** 架构。arXiv预印本arXiv:1606.02147,2016。

动词 (verb的缩写)Badrinarayanan,A. Kendall和R. Cipolla,“Segnet:用于图像分割的深度卷积编码器-解码器架构”,arXiv预印本arXiv:1511.00561,2015年。

我最近转载了这篇论文,可以在这里找到:

https://github . com/iArunava/ENet-实时-语义-分段

想继续查看本文的相关链接和参考文献?

点击【enet——实时语义分段的深度神经架构】或长按下面的地址进入:

https://ai.yanxishe.com/page/TextTranslation/1468

艾研究院今日推荐:雷锋网雷锋网雷锋网

卡耐基梅隆大学2019年春季的“神经 *** 自然语言处理”是CMU语言技术学院和计算机学院的联合课程。其主要内容是教学生如何利用神经 *** 做自然语言处理。神经 *** 为语言建模任务提供了强有力的新工具。同时,神经 *** 可以改进许多任务中的最新技术,使过去不容易解决的问题变得容易和简单。

加入群免费看视频:https://ai.yanxishe.com/page/groupDetail/33

收集3条评论

卷积 模块 语义 神经 瓶颈

最新文章