当前位置: 首页 > news >正文

温州网站制作计划wordpress电话

温州网站制作计划,wordpress电话,百度搜索引擎营销,室内设计公司加盟一、单进程读取数据 Dataset 在数据量很大#xff0c;无法将全部数据加载到内存的情况下#xff0c;可以在init中读出表数据行数#xff0c;在__len__设置为长度返回#xff0c;在__getitem__中根据idx读表#xff0c;idx就可以表示读取的表的行数#xff0c;一般在读表…一、单进程读取数据 Dataset 在数据量很大无法将全部数据加载到内存的情况下可以在init中读出表数据行数在__len__设置为长度返回在__getitem__中根据idx读表idx就可以表示读取的表的行数一般在读表的时候写作 path/table_name?start{}end{} import torch import numpy as np from torch.utils.data import IterableDataset, Dataset 需要先一次性把data都从文件或者表中读出来知道数据的长度为了生成index列表长度为数据的长度 分batch训练的时候dataloader根据分好的一个batch中的idx来读取这个batch中的数据 a [{anchor_text: np.array([1, 1, 1]), anchor_vis: np.array([1, 1, 1])},{anchor_text: np.array([2, 2, 1]), anchor_vis: np.array([4, 1, 1])},{anchor_text: np.array([3, 3, 1]), anchor_vis: np.array([2, 1, 1])},{anchor_text: np.array([4, 4, 1]), anchor_vis: np.array([3, 1, 1])}]class TableDataset(Dataset):def __init__(self):self.tablepath self.data_length len(a)def __len__(self):return self.data_lengthdef __getitem__(self, idx):return a[idx]train_dataset TableDataset() train_ld torch.utils.data.DataLoader(train_dataset, batch_size2, shuffleFalse)for idx, batch_data in enumerate(train_ld):print(batch_data)at batch_data[anchor_text].to(torch.float32)# print(at--------,at)IterableDataset 在数据量很大无法将全部数据加载到内存的情况下可以在__iter__中一行一行的读表读一行就立马返回一行。 import torch import numpy as np from torch.utils.data import IterableDataset, Dataset不需要一次性知道数据长度 分batch训练的时候dataloader根据一个batch的大小bs来执行__iter__函数bs次得到这个batch的数据 a [{anchor_text: np.array([1, 1, 1]), anchor_vis: np.array([1, 1, 1])},{anchor_text: np.array([2, 2, 1]), anchor_vis: np.array([4, 1, 1])},{anchor_text: np.array([3, 3, 1]), anchor_vis: np.array([2, 1, 1])},{anchor_text: np.array([4, 4, 1]), anchor_vis: np.array([3, 1, 1])}]class TableDataset2(IterableDataset):def __init__(self):self.tablepath def __iter__(self):for line in a:print(line:,line)yield linetrain_dataset TableDataset2() train_ld torch.utils.data.DataLoader(train_dataset, batch_size2, shuffleFalse)for idx, batch_data in enumerate(train_ld):print(batch_data)at batch_data[anchor_text].to(torch.float32)# print(at--------,at)上述提到的处理数据量大的方法都需要提前将数据处理好存入表中程序读取数据就可以直接跑模型了。 二、多进程读取数据 后续有时间再补上 IterableDataset 当DataLoader设置为多进程时每个进程都会拥有一个IterableDataset的生成器函数__iter__每当这个进程收集到的数据达到batch size的时候就把这批收集到的数据给loader也就在for batch_data in train_loader: 的时候就能得到这批数据。
http://wiki.neutronadmin.com/news/257484/

相关文章:

  • 佛山外贸网站新乡百度网站推广工具
  • 惠州网站建设行业园林专业设计学习网站
  • 建自己的网站百度指数是啥
  • 小说阅读网站开发视频肇庆企业自助建站
  • 全国卫生机构建设管理系统网站手机应用开发工具
  • 免费公文写作网站网络销售推广平台
  • 备案名称和网站logo不一致网站建设制作设计营销公司四川
  • 网站seo关键词优化排名wordpress米表域名展
  • 黄岩做网站的公司注册网站入口
  • 网站建设公司现在还挣钱吗做网站论文
  • 医院网站怎么做wordpress图片灯箱
  • 做百度网站要注意什么抛丸机网站怎么做
  • 负责做网站的叫什么公司如何建立一个网站详细步骤
  • 程序员网站建设福建省建设局网站实名制
  • 怎么做直播室的网站网站建设能不能使用模板
  • 网站改了模板被百度降权最简单的网页
  • 网站用哪个软件做定制网站建设的流程图
  • 做动车哪个网站查大连模板网站制作报价
  • 农场游戏系统开发 网站建设推广自适应网站功能
  • 做的网站没流量吗ftp是属于一种网站发布方式
  • 西安网站制作平台个人怎么交社保
  • vs2017可以做网站吗wordpress打不开自定义
  • 网站定制论文1500字左右公司做网站需要准备什么材料
  • 室内设计3d模型素材网站黄骅贴吧招聘临时工
  • 网站新闻打不开wordpress投票
  • 站长工具成品源码WordPress添加网页背景图片
  • 学校网站建设审批二级学院网站建设及利用情况
  • 公司官方网站建站重庆建设工程信息网怎么录入备案
  • 建网站金坛哪家强?孝义做网站
  • 宁津哪个网络公司做网站比较好炒域名 网站