您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页基于改进SSD算法的安全驾驶行为识别方法研究

基于改进SSD算法的安全驾驶行为识别方法研究

来源:意榕旅游网
2021年6月1日第44卷第11期

现代电子技术

ModernElectronicsTechniqueJun.2021Vol.44No.11引用格式:施冬梅.基于改进SSD算法的安全驾驶行为识别方法研究[J].现代电子技术,2021,44(11):67⁃72.

DOI:10.16652/j.issn.1004⁃373x.2021.11.014

67基于改进SSD算法的安全驾驶行为识别方法研究

施冬梅

(苏州信息职业技术学院计算机科学与技术系,江苏苏州

215200)

要:提出一种基于改进的SSD网络的安全驾驶行为识别方法。针对SSD目标检测算法VGG16网络结构的不足之

处,用表征能力更强的Inception⁃ResNet网络进行替换;用残差学习算法减少网络学习维度,降低网络训练难度;引入多层特征金字塔结构,用改进三分支残差网络对小目标的语义进行多特征融合,从而在反向传播时可以获得后续多层的梯度信息,提高目标检测精度。给出了Tensorflow平台下具体的实现过程,测试结果表明,该方法能够实时有效地识别驾驶员疲劳状态,提高驾驶安全系数,减少交通事故。

关键词:安全驾驶;行为识别;改进SSD算法;Inception⁃ResNet;网络训练;多特征融合中图分类号:TN911.1⁃34;TP391

文献标识码:A

文章编号:1004⁃373X(2021)11⁃0067⁃06

ResearchonsafedrivingbehaviorrecognitionmethodbasedonimprovedSSDalgorithm

(DepartmentofComputerScienceandTechnology,SuzhouCollegeofInformationTechnology,Suzhou215200,China)

SHIDongmei

Abstract:AsafedrivingbehaviorrecognitionmethodbasedontheimprovedSSD(single⁃shotmultiboxdetector)networkisproposed.SincetherearedeficienciesinthestructureofVGG16networkwiththeSSDobjectdetectionalgorithm,theVGG16isreplacedwiththeInception⁃ResNetwhichisofstrongerrepresentationalability.Theresiduallearningalgorithmisusedtoreducethenetworklearningdimensionandlowerthedifficultyofnetworktraining.Themulti⁃layerfeaturepyramidstructureis

introduced.Theimprovedresidualnetworkwiththreebranchesisusedtoimplementthemulti⁃featurefusionofsemanticsforobjectdetectionaccuracy.ThespecificimplementationprocessontheTensorflowplatformisshown.Thetestresultsshowthatandreducetrafficaccidents.fusion

smallobjects,soastoobtainthesubsequentmulti⁃layergradientinformationinthebackpropagation,whichimprovesthetheproposedmethodcaneffectivelyidentifythefatiguestatesofdriversinrealtime,whichcanimprovethedrivingsafetyfactor

Keywords:safedriving;behaviorrecognition;improvedSSDalgorithm;Inception⁃ResNet;networktraining;multi⁃feature

0引言

损失不可估计[3]。目前全球汽车产业生态正加快重塑,智能化将成为未来汽车发展的重要方向。2019年的政府工作报告明确提出:支持企业拓展“智能+”,为制造业转型升级赋能,在2019年的全国人民代表大会上也提出了《加快智能驾驶在城市快速公交和环卫领域建立示范工程》,大力推广人工智能技术在汽车行业的应用。采用现代技术手段和先进检测算法监测驾驶员动作、人脸表情、眼睛动作,及时发现疲劳、异常行为,及时报警提醒,对保障驾驶安全、减少交通事故有着极其重要的意义[4]。

国内外学者对驾驶安全行为进行了深入的研究,已经从普通传感器检测发展到通过机器视觉算法对面部表情、生理参数、操作行为的检测判断[5⁃7]。人的行为识

随着我国经济的快速发展和电商行业的增长,物流货运量随之增加,同时家用轿车作为人们的代步工具已经进入了千家万户,数量与日俱增,保有量增长,造成我国的交通日益繁忙,交通事故频发。据统计,70%~80%的交通事故都与驾驶员疲劳驾驶、分神、失误等行为有关

[1⁃2]

,且近年来每年有5%~6%的事故增长率,事故给家

庭和运输企业带来了严重的后果,每年事故造成的经济

收稿日期:2020⁃11⁃04修回日期:2020⁃11⁃23

基金项目:2019年度江苏省自然科学基金项目(BK20191225);

江苏省教育科学“十三五”规划2020年度课题(D/2020/03/24)

Copyright©博看网 www.bookan.com.cn. All Rights Reserved.68现代电子技术

2021年第44卷

别作为计算机视觉领域和深度学习理论的重要研究热点,最具有代表性的是卷积神经网络[8](Convolutional(VisualGeometryGroup)、Inception⁃Net模型[9]等,特征提PCA)、局部二值模式(LocalBinaryPatterns,LBP)、方向梯度直方图(HistogramofOrientedGradients,HOG)和尺度不变特征变换(Scale⁃invariantFeatureTransform,(SupportVectorMachine,SVM)、softmax分类器等[10⁃12]。基于CNN的目标检测算法可以分为两类:第一类为单阶段目标检测算法、单词多盒检测器,以SSD(Single

[13⁃14]ShotMultiboxDetector,SSD)和YOLO(YouOnly[15]LookOnce)为代表,是基于回归分类的目标检测;第

率,并且检测速度达到了惊人的58FPS,其在预选框的提取上参照了FasterR⁃CNN的RPN思想,并且SSD直接采用CNN获取不同尺度的特征图提取检测结果。SSD算法是端到端的图像目标检测方法,它从图像数据输入开始,通过网络训练直接获取图像特征和分类信息,只需要一个阶段就可以完成目标检测,无需像FasterR⁃CNN先分类再训练,可以降低网络训练计算量,提高检测速度。

通常SSD网络结构采用的基础网络结构是VGG⁃16网络,还有用于特征提取的四层网络,即Conv8_2、Conv9_2、Convl0_2、Convl1_2,共有2个卷积层和4个特征提取卷积层,利用多个卷积核进行目标预测。常规的SSD网络倒数第二层生成8732个默认边界框,假定用度计算公式为:

于检测的特征图数目为m,每一个特征图默认边界框尺

smax-smin(k-1),k∈[1,m](1)

m-1

smin=默认边界框比例尺度范围为[0.2,0.9],其中,

sk=smin+

NeuralNetworks,CNN),其网络结构有AlexNet、VGG取算法有主成分分析法(PrincipalComponentAnalysis,

SIFT)等,常见的分类器则有决策树、支持向量机

二类是双阶段目标检测算法,以FasterR⁃CNN(Regions

[16]

withCNNFeatures)为代表,是基于候选区域的目标检

测[17]。采用一种DRN和FasterR⁃CNN的融合网络模型,用三层扩张卷积残差块代替部分两层残差块,提高识别率[9],但速度还有待提高,所以需通过改进迁移学习、浅层特征增强和数据增广以及ResNet50特征提取结构,提高SSD目标检测率[13]。针对小目标,将SE⁃Net嵌入SSD中的特征层进行通道权重分配,改进损失函数,增

[19]

smax=0.9,0.2,代表最低层特征图尺度比例为0.2;代表最

高层特征图尺度比例为0.9。网络设置了5种不同比例的默认边界框,分别是{1,2,3,12,13}。每一个默认边界框宽高计算公式为:

ìïwk=sk

íïîhk=sk′=sk

znzn,n=1,2,…,5

强数据[18],利用VGGNet结构在密集区域加载特征金字塔,代替原有的特征图,也有提出一种引入注意力机制的SSD检测算法[20],目标检测率进一步提高。驾驶安全影响着单位、家庭生活的方方面面,针对驾驶安全的研究有一些文献,但是采用SSD算法对驾驶安全行为进行分析识别还不多见。

本文以检测和消除驾驶员不安全行为为研究对象,通过摄像头实时采集驾驶员动作信息,包括捕捉头部和眼睛信息,采用改进SSD算法对采集的图像实时处理,特别是人脸小目标的检测分析,一方面时刻监视驾驶员是否处于疲劳状态,另一方面若发现驾驶员有危险动作,及时发出提醒,避免交通事故的发生。

(2)

针对正方形特征图边界框,增加了一个比例尺度sksk+1,这样共有6个默认边界框。默认边界框中

心定义为

(i+0.5j+0.5

,,其中,fk为第k个正方形特|fk||fk|)征图尺寸,满足i,j∈[0,|fk|]。公式为:

SSD损失函数由位置损失和置信度损失函数组成,L(x,c,l,g)=

1(Lconf(x,c)+μLloc(x,l,g))(3)N

Lloc为位置损失;Lconf为置信度损失;N为匹配默认式中:

1

1.1

改进SSD算法

在基于候选区域的算法中,速度最快的FasterR⁃CNNSSD算法

l代表默认边界框;框的数量,如果N=0,那么loss=0;g代表真实边界框;权重μ的值通过交叉验证设置为1;x表示默认边界框与真实边界框是否匹配;c为置信度

预测值。训练时,采用小批量梯度下降法权衡损失,权重值设定为0.9,小批量值设定为32。对于多类别的置信度判定,采用交叉熵损失函数,利用softmax回归方法计算每个类别的置信度,公式如下:

pLconf(x,c)=-∑xpijlogci-Ni∈Pos

i∈Neg

还是无法满足实时的要求,驾驶行为实时性要求高,因而R⁃CNN系列算法分为两个阶段检测与识别,需要耗费更多的时间和设备。SSD算法是深度学习网络应用于目标检测的一种高效的方法,也是人工智能目标检测领域中较大的飞跃[21],对于输入图像大小为300×300的版本,在VOC2007数据集上达到了72.1%mAP的准确

xp式中:若类别p的第i个默认边界框与ij是二值函数,

∑logc0

i

(4)

Copyright©博看网 www.bookan.com.cn. All Rights Reserved.第11期

施冬梅:基于改进SSD算法的安全驾驶行为识别方法研究69

cp第j个真实边界框匹配时取1,否则取0;i代表默认边界输入图像分辨率为300×300,且特征提取的主干网络为VGG16的情况下,SSD网络Conv4_3层感受野只有60,而Conv8_2层有228,所以Conv4_3层对小目标的检测精度有待提高,语义信息需要加强。

为解决多尺度目标的检测精度,本SSD算法抽取了多层特征用于检测不同尺度的目标,从Conv4_3开始,形成了特征金字塔结构。充分利用特征金字塔本身存有的语义特征较丰富的深层特征图,不但可以保留金字塔结构的优点,而且可以增强底层特征图语义信息,保证小目标检测精度。在卷积神经网络中,存在着多层特征金字塔结构,特征层的语义信息是由浅入深逐渐增加的,图像多特征融合如图1所示。如果能够融合图像的局部特征语义信息和全局语义信息进行图像目标检测,精度肯定可以得到保证。

框设置为目标时的置信度,即类别p的softmax置信度回pc0归;i代表默认边界框设置为背景时的置信度。ci的计

算公式如下:

p

cpi=exp(ci)

∑exp(c)

p

i

p

(5)

默认边界框的位置是通过默认边界框中心和宽高的回归来修正确定的,位置损失函数计算公式如下:

Lloc(x,l,g)=

cx

j

式中:g=(g-d)d;g=(g-d)d;g=

cxj

cxi

cyj

cyj

cyi

∑∑

N

hj

m

mxk6)ij⋅smoothL1(li-gj)(

hi

wj

i∈Posm∈{cx,cy,w,h}

wi

log(g

wj

位置回归使用d);g=log(gd);x={0,1},

k

ij

wihjhi

范数比L1要好,类似于FasterR⁃CNN算法中smooth⁃L1(cx,cy)为默认边界框的中心;w,h分别为默认边界函数;

框的宽和高,表示预测窗口的偏移量;lmi是位置回归的gmd是先验框目标;(成功样本框)。j是标注框的偏移量;

SSD算法通过式(6)迭代运算,边迭代边权衡位置损失和置信度损失,当迭代次数达到时,损失函数达到期望值,即完成SSD网络训练。

本文中取m×n×p的特征图,只需使用3×3×p的卷积核获取检测值,SSD的检测方式也与YOLO不一样,对于每个单元的每个先验框,都输出一套检测值,YOLO是目标框的中心落在某一先验框上,就用该先验置信度或者分数,在SSD中背景也是分类中的一类;另一部分为预测真实位置中心点相对先验框的中心点偏移量和宽高的缩放比,相比YOLO在前置网络CNN后添加FC层直接预测坐标位置点,SSD的这种做法既可提高对小物体的精度,又方便模型的训练。1.2

SSD网络利用Conv4_3层等浅层网络检测小目标,改进SSD算法

框预测它,主要分为两个部分:第一部分为每个类别的

图1图像多特征融合示意图

i∈C代表SSD网络中需要进行融合图1中假定Xi,

C表示特征图集合,的特征图信息,特征融合结构可表

示为:

{Xf=ϕf{Ti(Xi)},i∈C

loc,conf=ϕl,c(⋃{Xf})

(8)

大目标则用Conv7_2、Conv8_2、Conv9_2层,但是浅层次网络做卷积后,语义信息少,容易丢失一些特征值,会影响

Xi表示输入特征图;Ti表示原始卷积特征图转换式中:

ϕf表示特征融合方法;Xf表示融合后的特征图;方法;而ϕl,c则表示融合后的特征图目标预测的方法;loc,conf表

检测精度。通常特征图的感受野与图像的语义信息存在对应关系,感受野越大,则语义信息越丰富,能感受到图像的范围就越大,因为感受野是输出特征图的某一响应与输入图像某一区域是对应的。根据上层特征图的尺寸和卷积参数,下一层特征图的尺寸和感受野计算如下:

nin+2p-kùì

êú+1nout=éïïsëû

íj=j×soutinïï

îrout=rin+(k-1)×jin

示位置回归和类别置信度判定的结果。在设计特征融合模块时,本文进一步对VGG16网络结构进行改进,引入Inception⁃ResNet网络结构,具体的改进SSD网络结C的取值范围从构图如图2所示。从图中可以看出,

Conv4_3到Conv10_2卷积层。Conv4_3和Conv5_3层使用特征融合方法进行语义增强,为减少计算量,Conv6_2~Conv10_2层不做特征融合处理。特征融合方法ϕf采用

(7)

三分支网络结构,进行相同位置元素相加,比普通的残差网络结构中的浅层特征图(Layern)多了一个深层特征图(Layern+1)分支,在卷积过程中,和Inception网络结构分段融合,Inception⁃ResNet网络结构如图3所示。

k是卷积核尺寸;p是填充大小;s是卷积核步长;nin式中:

jin,jout和rin,rout和nout分别是输入和输出特征图的尺寸;

分别是输入、输出特征图的特征距离和感受野尺寸。当

Copyright©博看网 www.bookan.com.cn. All Rights Reserved.70现代电子技术

2021年第44卷

图2改进SSD网络结构图

Tensorflow平台编程实现,利用Tensorflow中的slim模块采用Halcon解析视频流方法,自制图像数据集,获取9000张驾驶员的正常、疲劳和危险驾驶动作的图像,其

能够有效降低复杂度,提高学习效率。根据测试需要,

中6500张用作训练,2500张用作测试。采用LabelImg对图像进行标注,主要标注驾驶员的脸部、眼睛和上肢体信息,便于训练和测试。

认先验框,是真实框和预测框之间的桥梁,在训练时需高的缩放比,预测值也是中心点偏移量和宽高缩放比。

在SSD模型上,提取先验框的特征图分别为block6、block7、block8、Conv9、block10、block11共6层,对于输入(300×300)的图像其经CNN和Pooling后上面特征层大小分别为38×38,19×19,19×19,10×10,5×5,3×3,1×1,默认各层每个单元提取大小不同的先验框的个数6,6,4,4个先验框,比如第一层需要提取38×38×4个先

图3Inception⁃ResNet网络结构图

Anchorboxes是SSD在每个特征图上每个单元的默

要将真实框和先验框进行编码得到中心点偏移量和宽

分别为6,但在实际操作中每层每个单元分别提取4,6,验框。每层先验框大小需根据min_size和max_size定Smax=90,义,设定锚定尺寸范围为Smin=20,则有:Step=(Smax-Smin)(len(mbox_source_layers)-2)(9)

虽然Layern+1特征图和Layern特征图通道数不同,但经过金字塔池化后,尺度一致,通过特征转换方法Ti可进行连接。若需要增强的层通道数不一样,通过分

数,通过(90-20)(6-2)≈17计算出一个间隔,这样就

mbox_source_layers为默认每个单元先验框的个

支增加卷积和反卷积计算,可以扩大通道数和尺寸,同时能解析出较为有用的语义信息。通过特征融合结构,使Conv4_3、Conv5_3、Conv6_2和Conv7_2这4层在反向传播时可以获得后续多层的梯度信息,进而提高目标检测精度。

可以得到,ratio={20,37,54,71,88},接下来计算:

min_size=min_dim×ratio100

(10)

max_size=min_dim×(ratio+step)100式中:min_dim为原始图像的大小,在SSD中图片已经统一重置成300×300,即可以得到第二层的min_size=300×20100=60,max_size=300×(20+17)100=111,

2

2.1

模型、测试与实验

深度学习框架很多,结合深度学习理论,本文采用模型实现

以此类推其他层分别为(111,162)、(162,213)、(213,264)、(264,315),对于第一层的ratio用Smin2表示,而第一层便为(30,60)。上述每个单元默认产生6个不同

Copyright©博看网 www.bookan.com.cn. All Rights Reserved.第11期

施冬梅:基于改进SSD算法的安全驾驶行为识别方法研究71

尺寸的先验框,大小由min_size和max_size定义,那么可生成宽高为min_size/min_dim的小正方形,宽高为(anchor_ratio)/min_dim×min_size,高为1/sqrt(anchor_ratio)/min_dim×min_size的2∶1的长方形,将其旋转90°又得到1∶2的长方形。同理,也可得到3∶1和1∶3的长方形,共6个默认先验框,其中,anchor_ratio在2∶1中为2,在3∶1中为3。在第一层和倒数两层对每个单元提取4个先验框,在代码声明的anchor_ratio变量就小不同的正方形和长宽比为2∶1和1∶2的正方形,去除了1∶3和3∶1的正方形。

标框,网络不是直接预测目标的坐标点,而是预测中心点的偏移量和宽高的缩放比。在对图像标柱后得到xml记录的是真实框左上角的(x1,y1)和右下角的位置(x2,y2),在生成的默认先验框中包含框中心位置(cx,cy)和框的宽高(cw,ch),所以需先进行统一化格式,这里将先验框,((cx+cw2),。(cy–ch2))(rx,ry)=(cy+ch2))

Groundtruth是上面收集数据集进行标柱后真实的目可以很容易看出,提取4个先验框的特征层只有两个大sqrt(min_size×max_size)/min_dim的大正方形,宽为sqrt

弱、阈值设置必须合理,否则会造成误判。可以把不安全行为阈值分成两大类,眼部动作设为小目标阈值,其他动作设为大目标阈值。以SSDInception⁃ResNet网络为例,本项目在实施时,主要采用了阈值测试如表1所示。

转成左上角和右下角的形式,即(lx,ly)=((cx–cw2),

位置损失是真实框与先验框编码后与预测结果之

序号眼部动作阈值其他动作阈值

行为结果

图4损失函数测试图表1阈值测试数据表

15050

26040

37045

48045

59045

68545

y的偏移损失,间的损失,共包括四个部分:中心位置x,

目标框宽高的缩放损失,其损失函数为SmoothL1loss,对

于类别的损失函数采用多分类的softmaxloss。对于softmaxloss损失函数Tensorflow有对应的封装,这里主要关注SmoothL1loss,它会随着误差线性增长,而不是平方增长。假设损失为x,首先对损失取绝对值abs,如果为loss=0.5×((abs-1)×abs2+abs)。2.2

训练流程时,首先根据网络获取特征图、先验框和训练与测试实验

其小于1的话将其赋值为1,否则为本身abs2,其损失则

对驾驶员位置、脸部位置、眼部位置、打哈欠、抽

烟、打手机、眯眼等动作进行识别经上述测试,眼部阈值设为45,其他动作阈值设为80,该模型识别较为准确

下面为使用SSDInception⁃ResNet模型在不同环境下的实时效果测试,分为6种类型,分别标识为A、B、C、D、E、F。A:室外条件,上午6:00—7:00,光线一般,随机背景;B:室外条件,上午8:00—10:00,光线正常,随机背景;C:室外条件,中午12:00—14:00,光线较强,随机背景;D:室外条件,下午3:00—4:00,光线较强,随机背景;E:室外条件,下午6:00—7:00,光线较暗,随机背景;F:室内条件,光照稳定,随机背景。不安全驾驶行为测试结果如图5所示。

从图5中可以看出:通过SSDInception⁃ResNet模型与阈值设置测试,可以准确识别驾驶员的动作行为,包括睁闭眼、抽烟、用手机、打哈欠和正常动作,在进行报警设置时,分为5种类型,具体为:1min内打哈欠动作连续超过40帧,为轻度疲劳报警;1min内睁闭眼动作连续超过40帧,为疲劳驾驶报警;1min用手机动作连续超过40帧,为用手机报警;1min内抽烟动作连续超过40帧,为抽烟报警;正常状态。

预测值,然后将真实框和先验框进行编码得到中心点的偏移量和宽高的缩放比,接着对网络输出的预测值和编码后的数据求损失,包括类别损失和位置损失的总和,最后使用Adam优化器最小化损失。训练中,对VGG16网络结构和本文提出的Inception⁃ResNet网络结构进行tensorboard损失分析,结果如图4所示。

从图4总损失图的结果看出,使用Inception⁃ResNet

和VGG16作为前置网络,在训练800轮以后趋于平稳,并不断缩小,模型的精度也在提高,但迭代在前1000轮,VGG16不如Inception⁃ResNet收敛的速度快。

在模型训练后,需要设置安全驾驶行为的阈值,包

括识别睁闭眼、使用手机、抽烟、打哈欠等不安全行为的阈值。在阈值的设置中,需考虑周围环境因素、光线强

Copyright©博看网 www.bookan.com.cn. All Rights Reserved.72现代电子技术

2021年第44卷

[4]BILAC,SIVRIKAYAF,KHANMA,etal.Vehiclesofthefu⁃ture:asurveyofresearchonsafetyissues[J].IEEEtransactionsonintelligenttransportationsystems,2017,18(5):1046⁃1065.[5]MANDALB,LILY,WANGGS,etal.Towardsdetectionofbusdriverfatiguebasedonrobustvisualanalysisofeyestate2016,18(3):545⁃557.[J].IEEEtransactionsonintelligenttransportationsystems,[6]LIZJ,LISE,LIRJ,etal.Onlinedetectionofdriverfa⁃tigueusingsteeringwheelanglesforrealdrivingconditions[J].Sensors,2017,17(3):495⁃507.[7]谢非,汪壬甲,沈世斌,等.基于手机惯性传感器与多特征CNN的驾驶行为识别算法[J].中国惯性技术学报,2019,27(3):288⁃294.全行为识别[J].电子科技大学学报,2019,48(3):381⁃387.识别算法[J].计算机应用研究,2019,36(10):3192⁃3195.法综述[J].自动化学报,2016,42(6):848⁃857.

[8]田文洪,曾柯铭,莫中勤,等.基于卷积神经网络的驾驶员不安[9]杨楠,杨莘,杜能.基于DRN和FasterR⁃CNN融合模型的行为[10]朱煜,赵江坤,王逸宁,等.基于深度学习的人体行为识别算[11]KRIZHEVSKYA,SUTSKEVERI,HINTONGE.ImageNet

图5不安全驾驶行为测试结果

classificationwithdeepconvolutionalneuralnetworks[J].CommunicationsoftheACM,2017,60(6):84⁃90.

3结语

[12]RENSQ,HEKM,GIRSHICKR,etal.FasterR⁃CNN:to⁃

wardsreal⁃timeobjectdetectionwithregionproposalnetworksgence,2017,39(6):1137⁃1149.

[J].IEEEtransactionsonpatternanalysisandmachineintelli⁃[13]苏娟,杨龙,黄华,等.用于SAR图像小目标舰船检测的改进[14]LIUW,ANGUELOVD,ERHAND,etal.SSD:singleshot

multiboxdetector[C]//EuropeanConferenceonComputerVi⁃sion.Heidelberg:Springer,2016:21⁃37.

SSD算法[J].系统工程与电子技术,2020,42(5):1026⁃1034.

经济发展带来了各类汽车保有量和物流业的快速增长,造成交通的繁忙、拥堵,再加上各类环境不确定因素影响,容易造成交通事故。为了监测驾驶员的违规驾驶行为,本文基于深度学习理论研究了驾驶员安全驾驶的识别方法,采用SSD检测方法,并以改进后的Inception网络结构Inception⁃ResNet替代原来的VGG16网络结构,为解决小目标检测精度不高的问题,利用特征金字塔结构算法对2层卷积层进行融合,提取图像特征,给出了安全驾驶的分类规则,进行算法的模拟学习和测试,结果表明,本文算法能够有效识别驾驶员的不安全行为,对提高驾驶安全、降低经济和家庭损失有着积极的意义。

参考文献[15]REDMONJ,DIVVALAS,GIRSHICKR,etal.Youonly

lookonce:unified,real⁃timeobjectdetection[C]//Procee⁃Recognition.NewYork:IEEE,2016:779⁃788.智能系统学报,2018,13(6):967⁃973.软件学报,2019,30(3):738⁃758.

dingsoftheIEEEConferenceonComputerVisionandPattern[16]莫宏伟,汪海波.基于FasterR⁃CNN的人体行为检测研究[J].[17]裴伟,许晏铭,朱永英,等.改进的SSD航拍目标检测方法[J].[18]周舟,韩芳,王直杰.改进SSD算法在中国手语识别上的应用[19]王俊强,李建胜,周学文,等.改进的SSD算法及其对遥感影像

小目标检测性能的分析[J].光学学报,2019,39(6):373⁃382.计算机工程,2020,46(8):264⁃270.

[20]张海涛,张梦.引入通道注意力机制的SSD目标检测算法[J].[21]YANGF,CHENHJ,LIJP,etal.Singleshotmultiboxde⁃

tectorwithKalmanfilterforonlinepedestriandetectioninvideo[J].IEEEaccess,2019,7:15478⁃15488.[J].计算机工程与设计,2021,57(3):156⁃161.

[1]张丽霞,刘涛,潘福全,等.驾驶员因素对道路交通事故指标的影响分析[J].中国安全科学学报,2014,24(5):79⁃84.[2]庄明科,白海峰,谢晓非.驾驶人员风险驾驶行为分析及相关因素研究[J].北京大学学报(自然科学版),2008,44(3):475⁃482.[3]KURIANNK,RISHIKESHD.Realtimebaseddriver′ssafe⁃guardsystembyanalyzinghumanphysiologicalsignals[J].In⁃2013,4(1):41⁃45.ternationaljournalofengineeringtrendsandtechnology,作者简介:施冬梅(1976—),女,江苏苏州人,硕士,副教授,研究方向为图像识别、图形图像处理、移动应用开发。

Copyright©博看网 www.bookan.com.cn. All Rights Reserved.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务