enet *** 学院(enet硅谷动力学院)
Enet *** 学院(enet硅谷动力学院)雷锋网2019-02-26 10:14:15
本文是为AI研究院整理的技术博客。原标题:
ENet——一种用于实时语义分割的深度神经架构
作者|阿鲁纳瓦
翻译| callofduty890
校对|酱梨回顾|皮塔整理|鲤鱼网
原始链接:
https://towardsdatascience . com/enet-a-deep-neural-architecture-for-real-time-semantic-segmentation-2 baa 59 cf 97 e 9
图一。一个语义分段的家伙和一个卡通之间的对话
这是本文的摘要:
ENet:用于实时语义分割的深度神经 *** 架构
作者:亚当·帕兹克
论文:https://arxiv.org/abs/1606.02147
介绍ENet(高效神经 *** )提供了实时按像素进行语义分割的能力。ENet的速度提高了18倍,对FLOP的要求降低了75倍,参数减少了79倍,为现有模型提供了相似或更好的精度。在CamVid、CityScapes和SUN数据集上的测试。
*** :图3。ENet架构
以上是完整的 *** 架构。
它分为几个阶段,通过表格中的水平线和每个块名称后的之一个数字突出显示。报告的输出大小是输入图像分辨率512 * 512。
图4。详细描述了enet的各个模块。
视觉表达:
-初始模块是(a)中所示的模块-瓶颈模块显示在(b)中
每个瓶颈模块包括:
-1x1投影,减少尺寸
-主卷积层(conv)(-正常、扩展或完整)(3x3)
-1x1扩展
并且他们在所有卷积层之间放置批量标准化和PReLU。
如果瓶颈模块正在缩减采样,则将更大池层添加到主分支。此外,之一个1x1投影被替换为2x2卷积,跨距= 2。
它们不会激活任何填充来匹配要素地图的数量。
Conv有时是非对称卷积,即5 * 1和1 * 5卷积的序列。
对于正则项,他们使用空间落差:
瓶颈2.0之前,p = 0.01
-完成后p = 0.1
所以,
阶段1,2,3-编码器-由五个瓶颈模块组成(除了阶段3,没有下采样)。
阶段4,5-解码器-阶段4包含3个瓶颈,阶段5包含2个瓶颈模块。
接下来是一个fullconv,它输出最终输出-C * 512 * 512大小,其中C是滤波器的数量。
有一些事实:
-他们在任何预测中都没有使用偏见术语。
-在每个卷积层和激活之间,他们使用批量标准化。
-在解码器中,MaxPooling被MaxUnpooling代替。
-在解码器中,填充被无偏差地替换为空间卷积。
-在最后一个(5.0)上采样模块中不使用池化索引。
- *** 的最后一个模块是裸完全卷积,占用了解码器的大部分处理时间。
-每个侧支缺少一个空,之一级p = 0.01,下一级p = 0.1。
结果测试ENet的性能。
-CamVid(道路场景)
-城市景观(道路场景)
-太阳RGB-D(室内场景)
使用SegNet [2]作为基线,因为它是最快的分段模型之一。使用cuDNN后端来使用Torch7库。
使用英伟达Titan X GPU和英伟达TX1嵌入式系统模块记录推理速度。输入图像大小为640x360,速度超过10fps。
图5。以SegNet为基线的两种不同GPU推理时间的比较
图6。segnet和ENet的硬件要求
基准和亚当一起。ENet,融合非常快。每个数据集上使用4个Titan X GPU,训练只需要3-6个小时。分两个阶段:
首先,他们训练编码器对输入图像的降采样区域进行分类。
然后附加一个解码器,训练 *** 进行上采样和像素分类。
学习率-5e-4
L2重量衰减是2e-4
批量为10。
自定义类别权重方案定义为
图7显示了。自定义类别权重方案的公式
其中c = 1.02,类别权重限制在[1.50]的区间内
图8。Cityscaps数据集的性能
图9。Camvid数据集的性能
参考:A.Paszke、A. Chaurasia、S. Kim和E. Culurciello。Enet:用于实时语义分割的深度神经 *** 架构。arXiv预印本arXiv:1606.02147,2016。
动词 (verb的缩写)Badrinarayanan,A. Kendall和R. Cipolla,“Segnet:用于图像分割的深度卷积编码器-解码器架构”,arXiv预印本arXiv:1511.00561,2015年。
我最近转载了这篇论文,可以在这里找到:
https://github . com/iArunava/ENet-实时-语义-分段
想继续查看本文的相关链接和参考文献?
点击【enet——实时语义分段的深度神经架构】或长按下面的地址进入:
https://ai.yanxishe.com/page/TextTranslation/1468
艾研究院今日推荐:雷锋网雷锋网雷锋网
卡耐基梅隆大学2019年春季的“神经 *** 自然语言处理”是CMU语言技术学院和计算机学院的联合课程。其主要内容是教学生如何利用神经 *** 做自然语言处理。神经 *** 为语言建模任务提供了强有力的新工具。同时,神经 *** 可以改进许多任务中的最新技术,使过去不容易解决的问题变得容易和简单。
加入群免费看视频:https://ai.yanxishe.com/page/groupDetail/33
收集3条评论
- 1bat的大数据(BAT的大数据来源)
- 2三星s8屏幕上端2(三星s8屏幕上端2个按键)
- 3三星屏幕坏了如何导出(三星屏幕摔坏了如何导出数据么)
- 4红米3x怎么关闭自动更新(红米k40s怎么关闭自动更新)
- 5微信上防止app自动下载软件怎么办(微信上防止app自动下载软件怎么办啊)
- 6押镖多少钱(押镖一个月有多少储备金)
- 7瑞星个人防火墙胡功能(瑞星个人防火墙协议类型有哪些)
- 8cf现在等级是多少(cf等级2020最新)
- 9老滑头多少条鱼(钓鱼老滑头有什么用)
- 10WPS自动调整语法(wps如何修改语法)
- 11dell控制面板防火墙(dell的防火墙怎么关闭)
- 12丑女技能升多少(丑女技能需要满级吗)
- 13智能家居系统怎么样(智能家居系统好吗)
- 14戴尔屏幕(戴尔屏幕闪烁)
- 15y85屏幕信息(vivoy85息屏显示时间怎么设置)
- 16魅蓝note3屏幕出现方格(魅蓝note屏幕竖条纹)
- 17v8手指按屏幕(触屏手指)
- 18金为液晶广告机(液晶广告机lb420)
- 19三星显示器怎么校色(三星显示器 调色)
- 20hkc显示器dvi音频(hkc显示器有音响么)
- 21康佳液晶智能电视机(康佳液晶智能电视机怎么样)
- 22做液晶画板电脑(做液晶画板电脑怎么操作)
- 23液晶屏极化现象原理(液晶屏极化现象原理是什么)
- 24企业网络安全防火墙(企业网络防护)
- 256splus黑屏屏幕不亮(苹果6s plus屏幕突然黑屏)
- 26充电导致屏幕失灵(充电导致屏幕失灵怎么办)
- 27超极本屏幕旋转(笔记本电脑屏幕旋转,怎么转过来?)
- 28igmp防火墙(防火墙配置ipv6)
- 29荣耀王者多少经验(王者荣耀经验多少一级)
- 30lol老将还剩多少(qg老将)