当前位置: 首页 > news >正文

专业做外贸英文公司网站台州网站设计公司

专业做外贸英文公司网站,台州网站设计公司,权威发布图片,工程信息网站谁做文章目录 代码代码解读 代码 from tensorflow.keras.preprocessing.text import Tokenizer # 标记器(每一个词#xff0c;以我们的数值做映射#xff0c;)words [LaoWang has a Wechat account., He is not a nice person., Be careful.] # 把这句话中每一个单词#xf… 文章目录 代码代码解读 代码 from tensorflow.keras.preprocessing.text import Tokenizer # 标记器(每一个词以我们的数值做映射)words [LaoWang has a Wechat account., He is not a nice person., Be careful.] # 把这句话中每一个单词映射成我们的数值 tokenizer Tokenizer(num_words15) # 上面三句话中词的总数不超过 15 个估算的值 num_words 设置单词的数量 tokenizer.fit_on_texts(words) word_index tokenizer.word_index print(word_index, len(word_index)) # 把文本转化为序列编码 sequences tokenizer.texts_to_sequences(words) print(sequences) # 文本转化为矩阵 one_hot_matrix tokenizer.texts_to_matrix(words, modebinary) # 向量化是构建神经网络的第一步 print(tokenizer.word_index.keys()) print(one_hot_matrix, one_hot_matrix.shape)代码解读 逐行解读这段代码。 from tensorflow.keras.preprocessing.text import Tokenizer从tensorflow.keras.preprocessing.text模块导入Tokenizer类。Tokenizer用于文本标记将每一个词映射为一个整数值。 words [LaoWang has a Wechat account., He is not a nice person., Be careful.]定义了一个列表words包含三个字符串。 tokenizer Tokenizer(num_words15)创建一个Tokenizer对象并设置参数num_words15意味着最大考虑15个单词。这不代表只有15个单词会被编码而是在后续转换为矩阵时只会考虑频率最高的前15个单词。 tokenizer.fit_on_texts(words)调用fit_on_texts方法让tokenizer在words列表上进行学习从而创建一个词到整数值的映射。 word_index tokenizer.word_index获取tokenizer的word_index属性它是一个字典其中键是单词值是单词对应的整数值。 print(word_index, len(word_index)){‘a’: 1, ‘laowang’: 2, ‘has’: 3, ‘wechat’: 4, ‘account’: 5, ‘he’: 6, ‘is’: 7, ‘not’: 8, ‘nice’: 9, ‘person’: 10, ‘be’: 11, ‘careful’: 12} 12 打印word_index字典和它的长度。 sequences tokenizer.texts_to_sequences(words)调用texts_to_sequences方法将words列表中的文本转化为整数序列保存到sequences中。 print(sequences)[[2, 3, 1, 4, 5], [6, 7, 8, 1, 9, 10], [11, 12]] 打印sequences列表。 one_hot_matrix tokenizer.texts_to_matrix(words, modebinary)调用texts_to_matrix方法将words列表中的文本转化为二进制矩阵保存到one_hot_matrix中。二进制矩阵意味着如果某个单词出现在文本中它的位置会是1否则是0。 print(tokenizer.word_index.keys())dict_keys([‘a’, ‘laowang’, ‘has’, ‘wechat’, ‘account’, ‘he’, ‘is’, ‘not’, ‘nice’, ‘person’, ‘be’, ‘careful’]) 打印word_index字典中所有的键即所有的单词。 print(one_hot_matrix, one_hot_matrix.shape)[[0. 1. 1. 1. 1. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0.] [0. 1. 0. 0. 0. 0. 1. 1. 1. 1. 1. 0. 0. 0. 0.] [0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 1. 0. 0.]] (3, 15) 打印one_hot_matrix和它的形状。这个矩阵的每一行对应words列表中的一个文本每一列对应一个单词。如果文本中有该单词则该位置的值为1否则为0。 总结这段代码首先定义了一个文本列表然后使用Tokenizer类将文本转化为整数序列最后将文本转化为二进制矩阵。这是将文本数据预处理为可以输入到神经网络的形式的常见步骤。
http://wiki.neutronadmin.com/news/290724/

相关文章:

  • 网站备案 固定电话合肥瑶海区最新房价
  • wordpress网站翻译现在进出重庆最新规定
  • 设计高端网站门户网站制作哪专业
  • 网站开发分前台后台wordpress 商品展示插件
  • 论坛网站模块wordpress编辑器哪个好用吗
  • 企业做pc网站需要什么资料优化推荐
  • 天津做网站企业网站建设的调查问卷
  • 可以直接打开网站的网页网站报价书
  • 找熟人做网站的弊端网站建设管理流程
  • 东莞电子网站建设手机制作视频教程
  • 网站开发现状微信插件大全下载
  • 网站建设的五类成员天津集体建设用地出售 网站
  • 网站建行接口百度指数人群画像
  • 南通医院网站建设太仓有没有做网站建设的
  • 做网站有的浏览器宝安中心医院是什么级别
  • 湖北工程建设招投标中心网站企业网站设计好的缺点有哪些
  • 怎么在网站添加链接网站的建设意义
  • 网站建设?首选百川互动有哪些网站可以做设计比赛
  • 怎么用手机网站做软件网站字体字号
  • 网站建设工作小组推进表湖南信息网官方网站
  • 网网站建设站建设asp网站后台源码
  • 网站预订功能怎么做wordpress小插件下载
  • 常州个性化网站建设分销代理平台
  • 网站即将 模板搜索引擎营销经典案例
  • 网站一级域名东莞建外贸企业网站
  • 企业网站建设浩森宇特海曙区建设局网站
  • 用织梦做的网站下载地址电子商务企业网站建设发展论文
  • 网站开发一般多少钱php中网站搜索功能实现
  • win2003网站建设百度云做网站
  • 深圳国外网站建设汽车网页模板