南山做网站多少钱,做电影网站怎么批量去水印,效果好的网站制作公司,公司营销网站建设分类法过时了吗#xff1f;引用网址: http://www.qiji.cn/baike/contents/122.html 更新日期: 2005年6月09 周四 Posted By ianwest 更多 标签: YAHOO Sina Google 页面工具: [前一项] [后一项] { 发表评论 } 计算机和互联网的出现意味着新阅读时代的来临#xff0c;如何组织… 分类法过时了吗 引用网址: http://www.qiji.cn/baike/contents/122.html 更新日期: 2005年6月09 周四 Posted By ianwest 更多 标签: YAHOO Sina Google 页面工具: [前一项] [后一项] { 发表评论 } 计算机和互联网的出现意味着新阅读时代的来临如何组织使用数字格式的信息成为巨大的挑战。在传统的阅读时代我们可以去图书馆按照图书分类法查找我们所需要的图书就在10几年前我们上大学的第一课仍然是如何使用图书馆如何在一大厅的卡片里迅速地找到自己需要的知识。图书分类法很多有所谓中图法、杜威法等等如果我们再往前追溯我们会发现对事物进行分类是我们对其进行研究的第一部我们为什么说林耐是现代生物学的奠基人就是因为他建立了近代的生物分类系统。 在网络时代人们首先对信息的组织也是尝试建立这样一个分类系统YAHOO可以称的上是这方面的典范1997年的YAHOO首页(Link)清楚地给我们展现了它的分类体系。据说这个分类体系是在图书馆学专家的参与下完成的但网络信息与图书馆信息不同的是其对象无所不包凡是人们关心的都可能会以网页或网站的形式出现。随着时间的发展网络上的知识呈爆炸式的增长YAHOO借助人工的方法显然是无法为亿万互联网用户创造的信息进行分类的。因此如果YAHOO仍然希望他们的分类法可以组织所有网络信息的话那只是原则上可行而事实上是不可能完成的。所以YAHOO开始进行频道化的发展策略是很自然的事情既然无法为所有信息那就“专注于”人们需求最多的那部分信息体育、新闻、拍卖等就成为了“频道化”的内容。当然按“频道”组织信息并且每日更新的典范是SINA(新浪网)从最初的几个频道发展到目前的几十个甚至更多的频道和专题。 但对于“组织人类有史以来所有知识”这个巨大挑战面前不存在所谓“二、八法则”即我们无法仅建设有限个频道就可覆盖人们所需信息的有限大部分。所以我们可以看到虽然新浪建设的频道越来越多但无论投入多大终归只能是有限个频道仍然无法匹敌亿万互联网用户几乎无穷的信息知识需求。 这个叙述可以用统计语言学中的Zipf法则进行说明按Zipf法则语言中最常用单词的词频$f$与其排序$r$成反比$f \frac{C}{r}$。 如果我们把$f$看作人们对特定信息需求的频率$r$看作人们各种需求的排序。对$f$的求和对应就是人们对各种信息的总需求当$r \to \infty $这个求和是发散的即如果我们只求和最大频率的前$N$项将永远是个有限大数和总信息需求相比只能是无穷小。 在这种背景下Google诞生了当然类似于Google的搜索技术在上世纪90年代中期就已出现只不过Google更成功罢了。Google的做法是用计算机程序去索引“所有”网页信息但并不去“组织”这些信息“组织”工作是由用户使用的时候与Google互动地完成的即“关键字”查询。在这种模型下Google不需要作任何频道也不需要预先分类这些工作都是由用户自己完成的Google只需要保证“索引库”尽量完全排序法则尽量合理。 从2000年之后Google的成长是非常迅速的其中一个原因就是Google满足了人们对“无穷”种类信息的需求我们可以看一下Google与Sina最近两年浏览量变化的趋势可以更为直观地体会到这种变化。 如果我们进一步考察目前最新的互联网应用的话它们或多或少都具有类似Google搜索的特征即由用户借助网络工具自主地组织内容进行分类如WIKI百科标签(TAG)等。 那么分类法过时了吗其实对信息分类是我们合理利用信息必不可少的一步从这个角度分类法永远不会过时。但金字塔式的分类法再也不是信息分类的唯一选择而只是方法之一。基于“小世界模型”、“无标度模型”等的新分类法可能更适合于网络时代的信息分类。