当前位置: 首页 > news >正文

大兴网站建设制作西安易网信息技术有限公司

大兴网站建设制作,西安易网信息技术有限公司,帮朋友做网站 知乎,义乌外贸建网站torchvision 目标检测微调 本教程将使用Penn-Fudan Database for Pedestrian Detection and Segmentation 微调 预训练的Mask R-CNN 模型。 它包含 170 张图片#xff0c;345 个行人实例。 定义数据集 用于训练目标检测、实例分割和人物关键点检测的参考脚本允许轻松支持添加…torchvision 目标检测微调 本教程将使用Penn-Fudan Database for Pedestrian Detection and Segmentation 微调 预训练的Mask R-CNN 模型。 它包含 170 张图片345 个行人实例。 定义数据集 用于训练目标检测、实例分割和人物关键点检测的参考脚本允许轻松支持添加新的自定义数据集。数据集应继承自标准的 torch.utils.data.dataset 类并实现 __len__ 和 __getitem__ 。 __getitem__ 需要返回 image: PIL 图像 (H, W) target: 字典数据需要包含字段 boxes (FloatTensor[N, 4]): N 个 Bounding box 的位置坐标 [x0, y0, x1, y1] 0~W, 0~H labels (Int64Tensor[N]): 每个 Bounding box 的类别标签0 代表背景类。 image_id (Int64Tensor[1]): 图像的标签 id在数据集中是唯一的。 area (Tensor[N]): Bounding box 的面积在 COCO 度量里使用可以分别对不同大小的目标进行度量。 iscrowd (UInt8Tensor[N]): 如果 iscrowdTrue 在评估时忽略。 (optionally) masks (UInt8Tensor[N, H, W]): 可选的 分割掩码 (optionally) keypoints (FloatTensor[N, K, 3]): 对于 N 个目标来说包含 K 个关键点 [x, y, visibility], visibility0 表示关键点不可见。 如果模型可以返回上述方法可以在训练、评估都能使用可以用 pycocotools 里的脚本进行评估。 pip install pycocotools 安装工具。 关于 labels 有个说明模型默认 0 为背景。如果数据集没有背景类别不需要在标签里添加 0 。 例如假设有 cat 和 dog 两类定义了 1 表示 cat , 2 表示 dog 如果一个图像有两个类别类别的 tensor 为 [1, 2] 。 此外如果希望在训练时使用纵横比分组那么建议实现 get_height_and_width 方法该方法将返回图像的高度和宽度如果未提供此方法我们将通过 __getitem__ 查询数据集的所有元素这会将图像加载到内存中并且比提供自定义方法的速度慢。 为 PennFudan 写自定义数据集 文件夹结构如下 PennFudanPed/PedMasks/FudanPed00001_mask.pngFudanPed00002_mask.pngFudanPed00003_mask.pngFudanPed00004_mask.png...PNGImages/FudanPed00001.pngFudanPed00002.pngFudanPed00003.pngFudanPed00004.png这是图像的标注信息包含了 mask 以及 bounding box 。每个图像都有对应的分割掩码每个颜色代表不同的实例。 import os import numpy as np import torch from PIL import Imageclass PennFudanDataset(torch.utils.data.Dataset):def __init__(self, root, transforms):self.root rootself.transforms transforms## 加载所有图像sort 保证他们能够对应起来self.images list(sorted(os.listdir(os.path.join(self.root, PNGImages))))self.masks list(sorted(os.listdir(os.path.join(self.root, PedMasks))))def __getitem__(self, idx):img_path os.path.join(self.root, PNGImages, self.images[idx])mask_path os.path.join(self.root, PedMasks, self.masks[idx])image Image.open(img_path).convert(RGB)## mask 图像并没有转换为 RGB里面存储的是标签0表示的是背景mask Image.open(mask_path)# 转换为 numpymask np.array(mask) # 实例解码成不同的颜色obj_ids np.unique(mask)# 移除背景obj_ids obj_ids[1:]masks mask obj_ids[:, None, None]# get bounding box coordinates for each masknum_objs len(obj_ids)boxes []for i in range(num_objs):pos np.where(masks[i])xmin np.min(pos[1])xmax np.max(pos[1])ymin np.min(pos[0])ymax np.max(pos[0])boxes.append([xmin, ymin, xmax, ymax])# 转换为 tensorboxes torch.as_tensor(boxes, dtypetorch.float32)labels torch.ones((num_objs,), dtypetorch.int64)masks torch.as_tensor(masks, dtypetorch.uint8)image_id torch.tensor([idx])area (boxes[:, 3] - boxes[:, 1]) * (boxes[:, 2] - boxes[:, 0])iscrowd torch.zeros((num_objs,), dtypetorch.int64)target {}target[boxes] boxestarget[labels] labelstarget[masks] maskstarget[image_id] image_idtarget[area] areatarget[iscrowd] iscrowdif self.transforms is not None:image, target self.transforms(image, target)return image, targetdef __len__(self):return len(self.images)Lnton羚通专注于音视频算法、算力、云平台的高科技人工智能企业。 公司基于视频分析技术、视频智能传输技术、远程监测技术以及智能语音融合技术等 拥有多款可支持ONVIF、RTSP、GB/T28181等多协议、多路数的音视频智能分析服务器/云平台。
http://www.yutouwan.com/news/487192/

相关文章:

  • 虚拟物品网站制作模板福建省法冶建设知识有奖网站
  • 无锡网站建设价格费用室内装修设计图用什么软件
  • 网站为什么要备案在家做网站设计挣钱吗
  • 建行网站登录wordpress添加底部漂浮栏菜单
  • 提升seo排名平台苏州长尾词seo排名优化
  • 手表网站欧米茄官网玉林专业网站建设
  • 个体做外贸的网站电商网站模板下载
  • 做网站的需求网站域名年费
  • 网站建设淘宝属于什么类目网站建设的拓扑结构
  • 网站制作论文题目书画网站模板asp
  • 江苏省交通建设局网站首页网站制作 合肥
  • 建设网站基本步骤朝阳改版网站
  • 手机wap网站开发学校网站建设要求
  • 联想公司网站建设现状建设厅网站打不开
  • 网站域名服务器查询镇江专业网站制作公司
  • 徐州网站设计价位淄博企业建网站
  • 东莞建网站公司哪个好企业做网站设置哪些模块
  • 优秀平面设计网站域名服务网站
  • 为什么电子网站开发专业的家居行业网站模板
  • 深圳辰硕网站优化黄页软件app大全
  • 网站 建设 申请报告wordpress linux 建站教程
  • a站进入建设银行网银网站特色
  • 丹东网站建设两个wordpress同步
  • 国内十大网站排名设计北京
  • 网站前台设计教程网赌网站做流量渗透
  • 汕头自助建站软件网站型与商城型有什么区别吗
  • 嘉兴做美食图片的网站班级网站建设模板
  • 织梦网站程序下载试玩app推广网站建设
  • 公司网站栏目自贡跨省特大虚假广告案
  • 雄安企业网站建设php能用着手机网站开发