重磅干货,第一时间送达 本文包括以下4个部分,大家可以根据自己的需求,跳到相应小节仔细阅读。
方法简介
代码下载与使用
数据库下载与简介 总结 网络结构如上图所示,可以用netscope(http://ethereon./netscope/#/editor)看源码中网络结构中的各个layer的参数。这是一个end-to-end的网络,网络输入为测试图片,输出有3个head:bbox、label、mask,整个网络也属于one-stage实例分割网络。一些结果如下: 代码下载:https://github.com/LoveBaldwin/TrafficSign模型下载:链接:https://pan.baidu.com/s/1_yawJa_KUbfv0Bs2VqR4JA数据下载完后,解压到与TrafficSign文件同目录下。2,生成数据:mkdir -p ../../data/lmdb../caffe/build/tools/caffe train --solver../model/solver.prototxt --gpu 0数据来自某公司街景数据,场景相当丰富,数据库共有100000张图,采自中国5个不同的城市的10个不同场景,包含了不同的光照和季节的照片。数据的标注包含了:bbox(bounding box)、label和mask,如上图。数据分成了4个大类:warnings 、prohibitions、mandatory、Other,如下图所示,正如图中所示,除了这4个大类,还根据信息内容进行了细分类。模型的训练与测试仅使用了其中一部分图片,约占15%,目前仅开源程序中使用的图像。关于mask的标注,使用了两种模型去拟合目标边界:三角和椭圆,其中三角在标定时使用了3个角点,如果图像畸变比较严重,会增加标注点,椭圆标注了5个点来拟合椭圆方程,json字段含义如下:path: 图像相对路径 objects:[], 图像中的所有目标 category: 目标类别. bbox: {xmin,ymin,xmax,ymax:float}, 目标框 ellipse_org: [[x1,y1],[x2,y2],...], 非必须, 椭圆的标注点 ellipse: [[x_o,y_o],[r_l,r_s],angle], 非必须, 根据椭圆标注点拟合的椭圆,[x_o,y_o] 是椭圆圆心, [r_l,r_s]是椭圆长短轴, angle椭圆旋转角. polygon: [[x1,y1],[x2,y2],...], 非必须, 三角形的标注点 链接:https://pan.baidu.com/s/1B0Rz2HBLIoVTAIFXxfxnPA提取码:xam3训练程序的数据集下载方式:关注本公众号,将本文发到朋友圈,收集7个赞,在后台截图发给小编,小编会在24小时内将下载链接发给你。代码是以caffe为基础的,可能环境配置要花一些时间。小编最近在整理代码,环境编译相关的问题,希望大家可以通过google/baidu来解决。也欢迎大家实现pytorch和tensorflow版本的代码。小白团队出品:零基础精通语义分割↓↓↓ 下载1:OpenCV-Contrib扩展模块中文版教程
|