当前位置: 首页 > news >正文

可以做外链的网站网站开发表格

可以做外链的网站,网站开发表格,wordpress关键词怎么设置,设计师网站设计杜克大学最近#xff0c;我在记录链接方面变得非常有趣#xff0c;并遇到了Duke项目#xff0c;该项目提供了一些工具来帮助解决此问题。 我以为我会尝试一下。 进行记录链接时的典型问题是#xff0c;我们有两个来自不同数据集的记录#xff0c;它们代表同一实体#x… 杜克大学 最近我在记录链接方面变得非常有趣并遇到了Duke项目该项目提供了一些工具来帮助解决此问题。 我以为我会尝试一下。 进行记录链接时的典型问题是我们有两个来自不同数据集的记录它们代表同一实体但是没有可用于将它们合并在一起的公共键。 因此我们需要提出一种启发方法使我们能够这样做。 杜克大学Duke有一些实例表明了它的实际作用我决定与联系国一道 。 在这里我们有来自Dbpedia和Mondial数据库的国家我们希望将它们链接在一起。 我们需要做的第一件事是构建项目 export JAVA_HOME/usr/libexec/java_home mvn clean package -DskipTests 在撰写本文时这将导致zip失败其中包含我们在duke-dist / target /所需的所有内容 。 让我们打开包装 unzip duke-dist/target/duke-dist-1.3-SNAPSHOT-bin.zip 接下来我们需要下载数据文件和Duke配置文件 wget https://raw.githubusercontent.com/larsga/Duke/master/doc/example-data/countries-dbpedia.csv wget https://raw.githubusercontent.com/larsga/Duke/master/doc/example-data/countries.xml wget https://raw.githubusercontent.com/larsga/Duke/master/doc/example-data/countries-mondial.csv wget https://raw.githubusercontent.com/larsga/Duke/master/doc/example-data/countries-test.txt 现在我们准备好尝试了 java -cp duke-dist-1.3-SNAPSHOT/lib/* no.priv.garshol.duke.Duke --testfilecountries-test.txt --testdebug --showmatches countries.xml...NO MATCH FOR: ID: 7706, NAME: guatemala, AREA: 108890, CAPITAL: guatemala city,MATCH 0.9825124555160142 ID: 10052, NAME: pitcairn islands, AREA: 47, CAPITAL: adamstown, ID: http://dbpedia.org/resource/Pitcairn_Islands, NAME: pitcairn islands, AREA: 47, CAPITAL: adamstown,Correct links found: 200 / 218 (91.7%) Wrong links found: 0 / 24 (0.0%) Unknown links found: 0 Percent of links correct 100.0%, wrong 0.0%, unknown 0.0% Records with no link: 18 Precision 100.0%, recall 91.74311926605505%, f-number 0.9569377990430622 我们可以查看countries.xml 看看如何计算记录之间的相似度 schemathreshold0.7/threshold ...propertynameNAME/namecomparatorno.priv.garshol.duke.comparators.Levenshtein/comparatorlow0.09/lowhigh0.93/high/propertypropertynameAREA/namecomparatorno.priv.garshol.duke.comparators.NumericComparator/comparatorlow0.04/lowhigh0.73/high/propertypropertynameCAPITAL/namecomparatorno.priv.garshol.duke.comparators.Levenshtein/comparatorlow0.12/lowhigh0.61/high/property/schema 因此我们通过计算首都和国家/地区的Levenshtein距离即将一个单词转换为另一个单词所需的最小单字符编辑次数来计算出相似性 如果其中一个数据集的拼写有误或有差异这将非常有效。 但是我很好奇如果该国有两个完全不同的名称例如科特迪瓦有时被称为象牙海岸那会发生什么。 让我们尝试在以下文件之一中更改国家/地区名称 19147,Cote dIvoire,Yamoussoukro,322460java -cp duke-dist-1.3-SNAPSHOT/lib/* no.priv.garshol.duke.Duke --testfilecountries-test.txt --testdebug --showmatches countries.xmlNO MATCH FOR: ID: 19147, NAME: ivory coast, AREA: 322460, CAPITAL: yamoussoukro, 我还通过曼联对托特纳姆热刺的BBC和ESPN比赛报告进行了尝试-BBC按姓氏引用球员而ESPN有其全名。 当我使用Levenshtein比较器将全名与姓氏进行比较时没有您所期望的匹配。 我必须将ESPN名称分解为名字和姓氏才能使链接正常工作。 同样当我将球队名称更改为“曼联”而不是“曼联”和“热刺”而不是“托特纳姆热刺”时它们也不起作用。 我想我可能需要编写一个特定于域的比较器但我也很好奇是否可以拿出一堆训练示例然后训练一个模型来检测什么使两条记录相似。 它的确定性较差但可能更健壮。 翻译自: https://www.javacodegeeks.com/2015/08/record-linkage-playing-around-with-duke.html杜克大学
http://www.yutouwan.com/news/490454/

相关文章:

  • 河北易县建设局官方网站做展馆好的设计网站
  • 网站排版淄博服装网站建设
  • 兖州网站制作t么做文献索引ot网站
  • 网站怎么伪静态网站电子商务网站建设课设网站模板
  • 有好看图片的软件网站模板软件技术学的是什么
  • 国外游戏网站设计北京模板网站建设
  • 新闻类网站开发多久怎样建设网站后台
  • 杭州企业建站程序个人导航网站怎么备案
  • 网站的中英文切换怎么做网站免费的不用下载
  • 网站微信认证费用多少钱国家专业分类目录
  • 网站怎么被黑wordpress 淘宝客 主题
  • 学校特色网站建设情况天津网站设计 河西
  • 自己动手建立个人网站wordpress 文章导航
  • 在电商网站上做推广的技巧龙山县建设局网站
  • wordpress模板 站长哈尔滨的网络科技开发公司
  • 杭州精品课程网站建设宠物网站首页模板
  • 万网域名备案网站网站备案 地址
  • 网站不想续费深圳app开发红孩儿
  • 站长网站优化公司汉化wordpress
  • 网站正能量点进去就能看网站设计说明书主要有什么
  • 重庆智慧团建网站登录平台免费的oa办公系统排名
  • 网站开发音乐wordpress自定义栏目
  • 单页销售网站制作制作怎么做一个手机网站
  • 我的网站不做推广 百度能搜索到我网站吗html5 企业网站
  • 初学网站开发书籍苏州公司网站设计
  • 网站提升权重如何做网上水果网站系统
  • 网站做图尺寸做好网站建设总结
  • 手机电脑同步网站开发中国建设银行网站对公业务流程
  • 网站嵌套代码电子商务网站规划设计方案
  • 沈阳网站设计外包黄石建网站