当前位置: 首页 > news >正文

网站建设主要问题百度竞价推广代运营

网站建设主要问题,百度竞价推广代运营,产品推广方案推广思路和方法,做一个app需要什么流程本发明涉及模式识别与人工智能技术领域#xff0c;特别涉及一种直观的水表数字的AI智能识别方法。背景技术#xff1a;深度学习在目标检测的应用发展迅速#xff0c;在YOLO(You Only Look Once)之后又出现了升级版本YOLOv2#xff0c;采用的是Darknet-19作为基础网络#…本发明涉及模式识别与人工智能技术领域特别涉及一种直观的水表数字的AI智能识别方法。背景技术深度学习在目标检测的应用发展迅速在YOLO(You Only Look Once)之后又出现了升级版本YOLOv2采用的是Darknet-19作为基础网络它并不是通过加深或加宽网络达到效果提升反而简化了网络不管是在召回率还是定位上都有明显优势我们的水表数字识别就是基于YOLOv2实现的。目前有很多涉及模式识别与人工智能相结合的技术出现特别是被应用于图像数据检测。现有技术中的基于YOLO的图像数据检测其主要的检测分析过程是基于图片的识别和分析最终得到的分析结果是带有准确率表示的图片需要使用者再去根据准确率进行判定或者呈现给使用者的就是系统分析出来的准确率最高的图片需要使用者对图片进行分析不仅不能完全实现智能化识别而且识别检测的过程繁琐复杂会逐渐被新的网络所取代不能适应网络升级的需求。技术实现要素本发明是针对背景技术中提及的有关现有图像识别检测方法的缺陷提供一种简化网络、精准度高、人工智能化高的水表数据识别方法。为实现上述目的本发明所采用的技术方案是一种水表数字的AI智能识别方法所述识别方法采用的是Darknet-19作为基础网络基于YOLOv2实现具体包括以下步骤S1、数据来源用安装在水表上的摄像头对不同类型的水表进行拍照并对获取的大量水表图片像素进行批量处理;S2、数据标注及格式转换使用标注软件对水表图片进行标注将标注并转换好的内容存于txt文件中并将水表图片和对应的txt文件放在同一个文件夹下最后将水表图片的路径分为训练集和测试集存放到txt文件中S3、新建.names文件里面写入0-9这十个水表数字每个数字占一行S4、新建.data文件从上到下依次为水表数字的类别数量训练集路径测试集路径.names文件路径和训练好的模型存放路径S5、修改.cfg配置文件S6、训练模型将训练数据和标注并转换好的txt文件输入到YOLOv2网络中进行训练S7、测试模型使用训练集以外的数据输入到训练好的网络中进行测试训练模型对水表上的每一个数字进行识别将测试的数据上识别出的每一个数字用红色的方框框出来并在每个红色方框内显示识别结果S8、模型中每个方框内的数字最终以连续阿拉伯数字组合的形式呈现于使用界面上。作为优选的技术方案步骤S2中对数据进行标注时使用标注软件对摄像机获取的水表图片进行标注水表上的每一个数字都要进行单独标注标注后的边框坐标、边框宽高以及对应的水表数字都将存于txt文件中并分别用逗号隔开。作为优选的技术方案步骤S1中对水表图片的像素进行批量处理统一将宽的像素修改为750。作为优选的技术方案步骤S2中进行数据格式转换时将标注好的txt文件里的内容转换成用于训练的数据格式并将水表图片和对应的txt文件放在同一个文件夹下最后将水表图片的路径分为训练集(42034张水表图片)和测试集(10508张水表图片)存放到txt文件夹其中训练集占所有数据集的80%测试集占所有数据集的20%。作为优选的技术方案步骤S6中修改.cfg配置文件的具体方式是水表数字是由0-9组成一共10种数字类别数classes改为10同时filters也要按照filters(classescoords1)*num改成75其中coords4num5。作为优选的技术方案步骤S7的模型训练中将训练数据和标注并转换好的txt文件输入到YOLOv2网络中进行训练(1)训练参数设定迭代次数iters155000更新步长steps 100,25000,35000,45000初始学习率learning_rate0.0001scales 10,.1,.1,.01batch64subdivisions8decay0.0005(2)YOLOv2使用Darknet-19网络有19个卷积层和5个最大池化层最后用average pooling层代替全连接层进行预测(3)在YOLOv2中BN层对网络每一层的输入都做了归一化(4)YOLOv2采用了anchor boxes去预测bounding boxes将原网络的全连接层和最后一个pooling层去掉网络仅采用了卷积层和池化层(5)采用Softmax损失函数(6)YOLOv2预训练分类模型采用了448x448的输入来finetune分类网络这一中间过程(7)YOLOv2采用不同尺寸的图片训练(8)YOLOv2中提出了WordTree使用该树形结构成功的解决了不同数据集中的排斥问题。作为优选的技术方案步骤(7)中YOLOv2采用了多尺度输入训练策略具体做法是每经过10批训练(10 batches)就会随机选择新的图片尺寸尺度定义为32的倍数( 320,352…608 )。本发明所公开的这种图像识别检测方法其中的水表数字识别基于YOLOv2实现的采用的是Darknet-19作为基础网络它并不是通过加深或加宽网络达到效果提升反而简化了网络不管是在召回率还是定位上都有明显优势精准度高最终能够连续阿拉伯数字组合的形式呈现于使用界面上实现完全人工智能化无需使用者分析猜测直观、方便。附图说明图1为本发明水表识别方法的流程图图2为本发明的数据采集和处理流程图图3发明的深度卷积神经网络结构图图4发明检测结果示例。具体实施方式下面结合附图和实施例对本发明做进一步说明。结合附图1-4本发明所公开的这种图像检测识别方法主要应用于水表数据检测其识别方法采用的是Darknet-19作为基础网络基于YOLOv2实现。水表数字识别的实现步骤如下。1.数据来源用安装在水表上的摄像头对不同类型的水表进行拍照大量的拍照照片数量50000-60000张左右对获取的大量水表图片像素进行批量处理统一将水表图片的宽的像素修改为750。2.数据标注和格式转换使用标注软件对水表图片进行标注每一个水表数字都要单独标注标注后的边框坐标、边框宽高以及对应的水表数字都将存于txt文件中并分别用逗号隔开。将标注好的txt文件里的内容转换成用于训练的数据格式并将水表图片和对应的txt文件放在同一个文件夹下最后将水表图片的路径分为训练集(42034张)和测试集(10508张)存放到txt文件夹其中训练集占所有数据集的80%测试集占所有数据集的20%。3.新建.names文件里面写入0-9这十个水表数字每个数字占一行。4.新建.data文件从上到下依次为水表数字的类别数量训练集路径测试集路径.names文件路径和训练好的模型存放路径。5.修改.cfg配置文件水表数字是由0-9组成的一共10种数字所以类别数classes改为10同时filters也要按照filters(classescoords1)*num改成75其中coords4num5。6.训练模型将训练数据和标注并转换好的txt文件输入到YOLOv2网络中进行训练(1)训练参数设定迭代次数iters155000更新步长steps 100,25000,35000,45000初始学习率learning_rate0.0001scales 10,.1,.1,.01batch64subdivisions8decay0.0005(2)YOLOv2使用Darknet-19网络有19个卷积层和5个最大池化层最后用average pooling层代替全连接层进行预测精简了网络(3)在YOLOv2中BN(Batch Normalization)层对网络每一层的输入都做了归一化在训练时收敛更快降低模型的过拟合另外BN可以规范模型所以去掉了dropout层BN层的添加直接将mAP提升了2个百分点(4)YOLOv2采用了anchor boxes去预测bounding boxes将原网络的全连接层和最后一个pooling层去掉网络仅采用了卷积层和池化层。由于大的object一般会占据图像的中心为了使得每个特征图在划分cell的时候就只有一个center cell用416*416大小的输入代替原来448*448这样可以得到奇数大小宽高的特征图。 YOLOv2采用k-means的方式对训练集的bounding boxes做聚类选用的K值为5试图找到合适的anchor box引入的anchor boxes使得预测的box数量超过1千box的数量越多目标的定位准确率越高(5)采用Softmax损失函数(6)YOLOv2预训练分类模型采用了448x448的输入来finetune分类网络这一中间过程这可以使得模型在检测数据集上finetune之前已经适用高分辨率输入(7)YOLOv2可以采用不同尺寸的图片训练提高鲁棒性。由于YOLOv2模型中只有卷积层和池化层所以YOLOv2的输入可以不限于416x416大小的图片。为了增强模型的鲁棒性YOLOv2采用了多尺度输入训练策略具体做法是每经过10批训练(10 batches)就会随机选择新的图片尺寸尺度定义为32的倍数( 320,352…608 )(8)YOLOv2中提出了WordTree使用该树形结构成功的解决了不同数据集中的排斥问题。使用该树形结构进行分层的预测分类在某个阈值处结束或者最终达到叶子节点处结束。7.测试模型使用训练集以外的数据输入到训练好的网络中进行测试对水表上的每一个数字进行识别不管是完整的数字还是不完整的数字该网络都能识别对测试数据上识别出的每一个数字用红色的方框框出来并在每个红色方框内显示识别结果下方文本框会依次显示类别名称在.names文件中的索引准确率和框坐标。在训练网络的过程中会产生多个模型所以我们会在测试模型阶段根据识别准确率挑选出识别效果最好的一个作为最终应用的模型。经过测试合格选定模型之后进行识别时呈现在用户使用界面上的是数字即模型识别水表图像时被分别框出来的每个阿拉伯数字的组合。
http://wiki.neutronadmin.com/news/147605/

相关文章:

  • 苏州市优化网站推广哪家好游戏网站风控怎么做
  • 如何快速模仿一个网站怎么删除一个wordpress
  • 惠州建设局网站泉做网站的公司
  • 一般建站需要多少钱wordpress积分
  • 创建网站公司 徐州岳塘区建设路街道网站
  • 上海工商网站官网wordpress语言切换 seo
  • 网上接工程活做的网站巨量引擎广告投放平台代理
  • 邯郸网站建设网络公司五金公司网站模板
  • js网站建设苏州建网站的公司哪家口碑好
  • 如果自己做网站卖设备厦门市建设局官方网站
  • 国家企业信息查询网站老君山旅游网页设计模板
  • 网站建设基本流程前期深圳做网站网络公司怎么样
  • 搭建网站难吗南京一对一网站建设
  • 网站获取qq网站建设对于企业的必要性
  • 格尔木网站建设公司外包一个项目多少钱
  • 泰安市网站建设wordpress是PHP框架吗
  • 昆山企业网站设计网站建设技能考试
  • 网站被降权恢复推广公司怎么接活
  • 电商网站开发 报价wordpress中文主题下载
  • 神华集团两学一做网站图片制作表情
  • 成都pc网站建设网站建设与管理学习收获
  • 海会主机做的网站都能干什么的企业画册宣传设计
  • 上海商地网站建设公司网络服务商和网络运营商
  • 临颖网站建设网络设计方案3000字
  • 乌海建设网站高端企业网站建设
  • 辽宁丹东建设工程信息网站网站500m空间够用吗
  • 无锡专业网站营销wordpress插件使用模板
  • 模拟登录 wordpress青岛网站快速排名优化
  • 阿里巴巴外贸网站论坛wordpress视觉差
  • 提供网站建设公南充市房地产备案查询