当前位置: 首页 > news >正文

红酒营销型网站建设长尾词挖掘

红酒营销型网站建设,长尾词挖掘,月流量10g的网站,工商网核名查询分析回答 全文索引的底层实现为倒排索引。 为什么叫倒排索引#xff08;反向索引#xff09; 当表上存在全文索引时#xff0c;就会隐式的建立一个名为FTS_DOC_ID的列#xff0c;并在其上创建一个唯一索引#xff0c;用于标识分词出现的记录行。你也可以显式的创建…分析回答 全文索引的底层实现为倒排索引。 为什么叫倒排索引反向索引 当表上存在全文索引时就会隐式的建立一个名为FTS_DOC_ID的列并在其上创建一个唯一索引用于标识分词出现的记录行。你也可以显式的创建一个名为FTS_DOC_ID的列但需要和隐式创建的列类型保持一致否则创建的时候将会报错并且不能通过FTS_DOC_ID来查找列 mysql select * from articles where FTS_DOC_ID 1; ERROR 1054 (42S22): Unknown column FTS_DOC_ID in where clause 复制代码 所以建立的articles表中列为 FTS_DOC_ID、id、title、body 常规的索引是文档到关键词的映射文档——关键词 倒排索引是关键词到文档的映射关键词——文档 全文索引通过关键字找到关键字所在文档可以提高查询效率 倒排索引结构 NumberTextDocuments1code(1:6),(4:8)2days(3:2),(6:2)3hot(1:3),(4:4) 是word ilist的存储结构 Text对应于word是一个分词。Document存储的是键值对键为FTS_DOC_ID值为在文档中的位置对应于ilist。其中word保存在Auxiliary Table中总共有六张每张表根据word的Latin编码进行分区下面有介绍。 FTS Index Cache(全文检索索引缓存) 在事务提交的时候将分词写入到FTS Index Cache中批量更新到Auxiliary Table为了提高性能不会插入一条数据立刻更新到Auxiliary Table。进行批量更新的几种情况 全文检索索引缓存已满默认大小为32M可以通过修改innodb_ft_cache_size来改变FTS Index Cache的大小关闭数据库的时候将FTS Index Cache中的数据库会同步到磁盘上的Auxiliary Table中当对全文检索进行查询时首先会将在FTS Index Cache中对应的字段合并到Auxiliary Table中然后在进行查询当数据库突然宕机时可能会导致一些FTS Index Cache中的数据未同步到Auxiliary Table上。数据库重启时当用户对表进行全文检索时InnoDB存储引擎会自动读取未完成的文档然后进行分词操作在将分词的结果放入到FTS Index Cache中。innodb_ft_cache_size的大小会影响恢复的时间FTS Index Cache为红黑树结构会根据(word,ilist)进行排序插入 Auxiliary Table(辅助表) Auxiliary Table存储在磁盘中进入保存mysql数据的目录下xxx/xxx/data/study 看到有FTS_000000000000005e_0000000000000087_INDEX_0~6.ibd其对应的就是六张Auxiliary Table 其余文件介绍 FTS_000000000000005e_DELETED.ibd FTS_000000000000005e_DELETED_CACHE.ibd 复制代码 记录的是从Auxiliary Table中删除的FTS_DOC_ID后者是前者的内存缓存 FTS_000000000000005e_BEING_DELETED.ibd FTS_000000000000005e_BEING_DELETED_CACHE.ibd 复制代码 记录的是已经被删除索引记录并真正从FTS Index Cache删除的FTS_DOC_ID(即删除FTS Index Cache并做了OPTIMIZE TABLE)后者是前者的内存缓存。这两个表主要用于辅助进行OPTIMIZE TABLE时将DELETED/DELETED_CACHED表中的记录转储到其中 FTS_000000000000005e_CONFIG.ibd 复制代码 包含全文索引的内部信息最重要的存储是FTS_SYNCED_DOC_ID表示已经解析并刷到磁盘的FTS_DOC_ID 在系统宕机时可以根据这个值判断哪些该重新分词并加入到FTS Index Cache中 DML操作 DML 只是对表内部的数据操作,不涉及表的定义,结构的修改。 主要包括(insert)(delete)(update)(select) 删除数据库。 插入操作 插入操作较为简单当往表中插入记录时提交事务时会对全文索引上的列进行分词存储到FTS Index Cache最后在批量更新到Auxiliary Table中删除操作 当提交删除数据的事务以后不会删除Auxiliary Table中的数据而只会删除FTS Index Cache中的数据。对于Auxiliary Table中被删除的记录InnoDB存储引擎会记录其FTS Document Id并将其保存在DELETED Auxiliary Table中。可以通过OPTIMIZE TABLE手动删除索引中的记录。更新操作查找操作 分为两步。第一步根据检索词搜集符合条件的FTS_DOC_ID在搜集满足条件的FTS_DOC_ID首先读取delete表中记录的FTS_DOC_ID这些FTS_DOC_ID随后被用做过滤 第二步根据FTS_DOC_ID找到对应的记录找到的记录是根据相关性大小降序返回的。 反思扩展 说说正向索引和反向索引 正向索引forward index 一般是通过key去找value。 反向索引inverted index 从词的关键字去找文档。 喵呜面试助手一站式解决面试问题你可以搜索微信小程序 [喵呜面试助手] 或关注 [喵呜刷题] - 面试助手 免费刷题。如有好的面试知识或技巧期待您的共享
http://wiki.neutronadmin.com/news/313050/

相关文章:

  • 门户网站开发 南宁合肥百度搜索优化
  • 中国网站建设公司图片个人注册商贸公司流程和费用
  • jsp 网站开发环境内蒙古微信公众号114查
  • 做网站的常识广西水利电力建设集团网站
  • 卖书的网站怎么做成都网站定制费用
  • 深圳手机端网站建设大学网站建设招标方案
  • 优秀网站网页设计分析政务网站群建设
  • 做快递单的网站会不会是骗人的信用门户网站建设规范
  • wordpress成品网站云部落手机淘宝客网站怎么做的
  • 哈尔滨企业建站系统企业网站建设趋势
  • 天河区做网站让别人做网站要注意什么
  • 杭州网站推广营销服务wordpress 斜杠结尾
  • 个人建设网站WordPress模板修改后无反应
  • 公司开个网站多少钱wordpress4.9.6 备案
  • 3g微网站是什么东莞技术好的网站建设推广
  • 梨树县住房和城乡建设局网站网站 解析
  • asp双语网站后台怎么用在西安市建设工程交易中心网站上
  • 哪些网站适合做外贸网站推广网站开发的流行架构
  • wordpress后台乱了是怎么回事南昌seo推广
  • 网络优化网络维护网络建站开发公司利用员工身份贷款买房子
  • 2003系统建网站如何做阿里巴巴网站
  • 用jsp做视频网站做网站需要视频衔接怎么做
  • 企业网站改版建议做网站至少要花多少钱
  • .net网站开发免费教程旅游网站策划方案
  • 男女做暖暖网站深圳外贸网站建设企业
  • 企业网站代运营怎么看一个网站做没做优化
  • 如何快速建立网站网站建设企业济南
  • 免费发链接的网站手机电子商务网站建设策划书
  • 云主机建网站安徽建设厅官方网站
  • 没有服务器建网站wordpress 豆瓣