当前位置: 首页 > news >正文

建设网站的技术阿里云 网站备案

建设网站的技术,阿里云 网站备案,看汽车哪个网站好,上海紫博蓝网站文章目录1. 概率潜在语义分析模型1.1 基本想法1.2 生成模型1.3 共现模型1.4 模型性质2. 概率潜在语义分析的算法概率潜在语义分析#xff08;probabilistic latent semantic analysis#xff0c;PLSA#xff09;#xff0c;也称概率潜在语义索引#xff08;probabilistic … 文章目录1. 概率潜在语义分析模型1.1 基本想法1.2 生成模型1.3 共现模型1.4 模型性质2. 概率潜在语义分析的算法概率潜在语义分析probabilistic latent semantic analysisPLSA也称概率潜在语义索引probabilistic latent semantic indexingPLSI利用概率生成模型对文本集合进行话题分析的无监督学习方法最大特点用隐变量表示话题整个模型表示 文本生成话题话题生成单词从而得到单词-文本共现数据的过程假设每个文本由一个话题分布决定每个话题由一个单词分布决定 1. 概率潜在语义分析模型 概率潜在语义分析 模型有生成模型以及等价的共现模型 1.1 基本想法 给定文本集合每个文本讨论若干个话题每个话题由若干个单词表示对文本集合进行概率潜在语义分析就能够发现每个文本的话题以及每个话题的单词话题是不能从数据中直接观察到的是潜在的 1.2 生成模型 文本-单词共现数据 TTT 的生成概率为 P(T)∏(w,d)P(w,d)n(w,d)P(T) \prod\limits_{(w,d)} P(w,d)^{n(w,d)}P(T)(w,d)∏​P(w,d)n(w,d) P(w,d)P(d)P(w∣d)P(d)∑zP(w,z∣d)P(d)∑zP(z∣d)P(w∣z)P(w,d) P(d)P(w|d) P(d)\sum\limits_z P(w,z|d) P(d)\sum\limits_z P(z|d)P(w|z)P(w,d)P(d)P(w∣d)P(d)z∑​P(w,z∣d)P(d)z∑​P(z∣d)P(w∣z) 1.3 共现模型 文本-单词共现数据 TTT 的生成概率为 P(T)∏(w,d)P(w,d)n(w,d)P(T) \prod\limits_{(w,d)} P(w,d)^{n(w,d)}P(T)(w,d)∏​P(w,d)n(w,d) P(w,d)∑z∈ZP(z)P(w∣z)P(d∣z)P(w,d) \sum\limits_{z\in Z} P(z)P(w|z)P(d|z)P(w,d)z∈Z∑​P(z)P(w∣z)P(d∣z) 文本数据基于如下的概率模型产生共现模型 首先有话题 z 的概率分布然后有话题 z 给定条件下 文本 的条件概率分布以及话题 z 给定条件下 单词 的条件概率分布 1.4 模型性质 概率潜在语义分析通过话题对数据进行了更简洁地表示减少了学习过程中过拟合的可能性 2. 概率潜在语义分析的算法 概率潜在语义分析模型是含有隐变量的模型其学习通常使用 EM算法。 模型参数估计的EM算法 输入单词集合 W{w1,w2,...,wM}W\{w_1,w_2,...,w_M\}W{w1​,w2​,...,wM​}文本集合 D{d1,d2,...,dN}D\{d_1,d_2,...,d_N\}D{d1​,d2​,...,dN​}话题集合 Z{z1,z2,...,zK}Z\{z_1,z_2,...,z_K\}Z{z1​,z2​,...,zK​}共现数据 {n(wi,dj)},i1,2,...,M;j1,2,...,N\{n(w_i,d_j)\},i1,2,...,M; j1,2,...,N{n(wi​,dj​)},i1,2,...,M;j1,2,...,N 输出 P(wi∣zk)P(w_i|z_k)P(wi​∣zk​)P(zk∣dj)P(z_k|d_j)P(zk​∣dj​) 设置参数 P(wi∣zk)P(w_i|z_k)P(wi​∣zk​)P(zk∣dj)P(z_k|d_j)P(zk​∣dj​) 的初始值迭代执行以下 E 步 M 步直到收敛为止 E 步 P(zk∣wi,dj)P(wi∣zk)P(zk∣dj)∑k1KP(wi∣zk)P(zk∣dj)P(z_k|w_i,d_j) \frac{P(w_i|z_k)P(z_k|d_j)}{\sum\limits_{k1}^K P(w_i|z_k)P(z_k|d_j)}P(zk​∣wi​,dj​)k1∑K​P(wi​∣zk​)P(zk​∣dj​)P(wi​∣zk​)P(zk​∣dj​)​ M 步 P(wi∣zk)∑j1Nn(wi,dj)P(zk∣wi,dj)∑m1M∑j1Nn(wm,dj)P(zk∣wm,dj)P(w_i|z_k) \frac{\sum\limits_{j1}^N n(w_i,d_j)P(z_k|w_i,d_j)}{\sum\limits_{m1}^M \sum\limits_{j1}^N n(w_m,d_j)P(z_k|w_m,d_j)} P(wi​∣zk​)m1∑M​j1∑N​n(wm​,dj​)P(zk​∣wm​,dj​)j1∑N​n(wi​,dj​)P(zk​∣wi​,dj​)​ P(zk∣dj)∑i1Mn(wi,dj)P(zk∣wi,dj)n(dj)P(z_k|d_j) \frac{\sum\limits_{i1}^M n(w_i,d_j)P(z_k|w_i,d_j)}{n(d_j)}P(zk​∣dj​)n(dj​)i1∑M​n(wi​,dj​)P(zk​∣wi​,dj​)​ 给定文本集合通过概率潜在语义分析可以得到 各个文本生成话题的条件概率分布以及各个话题生成单词的条件概率分布
http://wiki.neutronadmin.com/news/410762/

相关文章:

  • 备案的网站建设书是什么垂直 网站开发
  • 贵州城乡和住房建设厅网站建设一个商城网站大概多少钱
  • 建站好的公司青岛 正规网站空间
  • 给网站做镜像花钱做网站不给源代码
  • 深圳专业定制建站公司青岛永诚网络有限公司
  • 沈阳网站建设思路胶南市城乡建设局网站
  • 龙华民治网站建设中国建设银行行号查询
  • 邯郸企业网站制作建设青岛网站建设公司报价
  • ipv6网站建设东莞网站流量少怎么做
  • 网站提速新开发网站
  • 济南网站建设鲁icp备国际网站建设与维护
  • 企业品牌网站建设价格wordpress的ftp设置
  • 搭建大数据平台费用太原百度网站快速优化
  • 土地违法建设投诉网站怎样做网站首页
  • 沈阳响应式网站制作毕设网站建设
  • 东莞网站seo技术工地模板图片大全
  • 东莞学做网站什么网站可以做汽车国际贸易
  • 网站开发的五个阶段淮安做网站找哪家好
  • 重庆技术网站建设网络规划设计师教程第二版下载
  • 青岛高创网站建设哪些公司网站做的很好
  • 网站目录结构wordpress调用相关文章加速
  • 提高网站订单转化率网页网络优化
  • 济南做网站要多少钱中国建设银行网站用户名
  • 成都高新网站建设wordpress模板小说
  • 品牌形象网站源码专业网站建设开发
  • 搬瓦工做网站好慢如何架设一个网站
  • 蚌埠哪里做网站明天去广州需要隔离吗
  • 优秀的设计网站有哪些破解进入网站后台
  • 深圳住房与建设局网站10分钟免费建网站
  • 网站如何做关键词优化网站制作的核心技术