当前位置: 首页 > news >正文

保山做网站建设wordpress的404页面如何做

保山做网站建设,wordpress的404页面如何做,做那种的视频网站,江苏弘盛建设工程集团有限公司网站最近参加了百度Paddle的动手学OCR课程#xff0c;特此做一个学习总结。 1. 简介 OCR#xff08;Optical Character Recognition#xff0c;光学字符识别#xff09;是计算机视觉重要方向#xff0c;传统的OCR一般面向扫描文档类对象#xff0c;现在的OCR是指场景文字识…最近参加了百度Paddle的动手学OCR课程特此做一个学习总结。 1. 简介 OCROptical Character Recognition光学字符识别是计算机视觉重要方向传统的OCR一般面向扫描文档类对象现在的OCR是指场景文字识别Scene Text RecogntionSTR主要面向自然场景。 2. 前沿算法 2.1 文本检测 文本检测是定位出输入图像中的文字区域。可以将文本检测作为目标检测中的一个特定场景基于通用目标检测算法进行改进适配如TextBoxes基于SSD算法CTPN是基于Faster RCNN算法。同时由于文件检测任务在文本的特殊性衍生了许多专用的算法例如EAST、PSENetDBNet等。 目前较为流行的文本检测算法可以大致分为基于回归和基于分割的两大类文本检测算法也有一些算法将二者相结合。基于回归的算法借鉴通用物体检测算法通过设定anchor回归检测框或者直接做像素回归这类方法对规则形状文本检测效果较好但是对不规则形状的文本检测效果会相对差一些比如CTPN对水平文本的检测效果较好但对倾斜、弯曲文本的检测效果较差SegLink对长文本比较好但对分布稀疏的文本效果较差基于分割的算法引入了Mask-RCNN这类算法在各种场景、对各种形状文本的检测效果都可以达到一个更高的水平但缺点就是后处理一般会比较复杂因此常常存在速度问题并且无法解决重叠文本的检测问题。 2.2 文本识别 文本识别是识别出图像中的文字内容一般输入是来自文本检测得到的文本框截出的图像文字区域。文本识别一般可以根据识别文本形状分为规则文本识别和不规则文本识别。规则文本主要指印刷字体、扫描文本等文本大致处在水平线位置不规则文本往往不在水平位置存在弯曲、遮挡、模糊等问题。不规则文本场景具有很大的挑战性也是目前文本识别领域的主要研究方向。 1960s-2015:过分割单字识别 连通域分析 寻找潜在的文字切分位置----切分片段组合集束搜索 2016-2021文本行识别时代 单个模型识别整个文本行---基于CTC解码/分割/注意力额编码-解码结构/并行注意力解码四种方法 规则文本识别的算法根据解码方式的不同可以大致分为基于CTC和Sequence2Sequence两种将网络学习到的序列特征 转化为 最终的识别结果 的处理方式不同。基于CTC的算法以经典的CRNN为代表。 不规则文本的识别算法相比更为丰富如STAR-Net等方法通过加入TPS等矫正模块将不规则文本矫正为规则的矩形后再进行识别RARE等基于Attention的方法增强了对序列之间各部分相关性的关注基于分割的方法将文本行的各字符作为独立个体相比与对整个文本行做矫正后识别识别分割出的单个字符更加容易此外随着近年来Transfomer的快速发展和在各类任务中的有效性验证也出现了一批基于Transformer的文本识别算法这类方法利用transformer结构解决CNN在长依赖建模上的局限性问题也取得了不错的效果。 2.3 文档结构化识别 有一些应用场景是获取结构化信息例如身份证、发票的信息抽取表格的结构化识别等可以采用OCR结果后处理的方案。常用场景有 版面分析 版面分析Layout Analysis主要是对文档图像进行内容分类类别一般可分为纯文本、标题、表格、图片等。 表格识别 表格识别Table Recognition的任务就是将文档里的表格信息进行识别和转换到excel文件中。 关键信息抽取 关键信息提取Key Information ExtractionKIE是Document VQA中的一个重要任务主要从图像中提取所需要的关键信息如从身份证中提取出姓名和公民身份号码信息这类信息的种类往往在特定任务下是固定的但是在不同任务间是不同的。 关键信息提取通常分为两个子任务进行研究 SER: 语义实体识别 (Semantic Entity Recognition)对每一个检测到的文本进行分类如将其分为姓名身份证。如下图中的黑色框和红色框。RE: 关系抽取 (Relation Extraction)对每一个检测到的文本进行分类如将其分为问题和的答案。然后对每一个问题找到对应的答案。如下图中的红色框和黑色框分别代表问题和答案黄色线代表问题和答案之间的对应关系。 3. 细节 3.1. 语种和标注 英文识别单个字符共有36个字符 中文识别单个汉字有6623个常用汉字 单词校正字典将识别的结果进行遍历未在字典中发现则返回较相近的结果。 3.2. 常见数据集 1合成数据集Synth90k Synth Text 2自然场景数据集水平文本 3自然场景数据集不规则文本 4. 面临的挑战 算法层 应用层5. 结论 该章节只是初步了解OCR的常见任务、数据集和面临的问题具体细节在后续博客中更新
http://wiki.neutronadmin.com/news/213510/

相关文章:

  • 做网站应该注意些什么问题高效网站建设咨询
  • 兰州网站建设加q.479185700佛山网站开发哪家专业
  • 别墅装修排名贵阳网站seo
  • 广安做网站的公司谷歌seo排名公司
  • 网站跳转至手机端如何做google收录提交入口
  • 网站制作什么做湖北百度seo厂家
  • 什么是网站app做301网站打不开
  • 深圳网站建设熊掌号新能源纯电动汽车
  • 沈阳公司网站应用公园制作的app归谁
  • 石家庄市规划建设局网站网站安全建设 应用开发
  • 京东网站建设的特点ipv6地址可以做网站吗
  • 做企业展示版网站贵吗徐州网架公司十大排名
  • 重庆孝爱之家网站建设wordpress怎么重新配置文件
  • 网站建设费应计入什么科目没有网站的域名
  • 电影海报模板哪个网站好网站云空间大小
  • 做母婴产品哪个网站做的好处运城又一暂停通知
  • 免费网站服务wordpress图片批量链接
  • 泰州网站制作维护房产信息网58同城
  • 哪些平台可以建立网站ui培训内容
  • 商城网站 报价 方案免费企业自助建站
  • 郑州哪家建设网站网站开发软件 d
  • 曲靖企业网站建设knowall wordpress
  • 专业的深圳网站建设公司哪家好网站新闻专题怎么做
  • 建站易网站建设的资源整合与系统设计
  • 新网站不被收录软件app开发公司哪家好
  • 网站关键技术asp+php+mysql+aspx环境搭建与6种网站安装2
  • 建站哪家好要认定兴田德润虚拟主机怎么发布网站
  • 教育平台网站开发自动采集更新网站源码
  • 网站建设佰首选金手指十六python线上培训班学费一般多少
  • 成都建设网官方网站网站上传图片加水印