网站模板下载之后怎么做,营销到底是干嘛的,南充市房地产网官网,如何发布自己做的网站原创作者#xff1a;谭婧#xff0c;苏格兰折耳喵企业作为社会基本的细胞#xff0c;在守法盈利的同时#xff0c;担负着服务消费者、社区、社会等利益相关方的重要责任。互联网企业是互联网时代的宠儿#xff0c;举手投足备受关注。所谓成也萧何#xff0c;败也萧何。大… 原创作者谭婧苏格兰折耳喵企业作为社会基本的细胞在守法盈利的同时担负着服务消费者、社区、社会等利益相关方的重要责任。互联网企业是互联网时代的宠儿举手投足备受关注。所谓成也萧何败也萧何。大众的高度关注成就了品牌知名度但是这种关注度也变成了无形的压力增加了互联网企业和利益相关方沟通的难度。中国互联网企业的创始团队往往见长于技术在如何主动与公众沟通方面还有很长的路要走。常在“爆料式”传播事件中占不了辩论的上风被动得很。于是乎一有危机事件发生互联网就成了信息传播速度最快但信息也最为混沌的地方事实与谣言边界模糊。数据来源全网数据数据统计时间2018年10月21日-2018年10月23日这不是一个国产的问题前不久Facebook也因面临挑战在软件中推出反辱骂等限制不良评论的功能。早在1947年美国学者奥尔波特Gordon W.Allport和波斯特曼Leo Postman就提出谣言的传播公式谣言的流通量事件的重要性×事件的模糊性RumorImportance×Ambiguous。该公式自提出后一直被学界奉为圭臬。纵观中国互联网企业危机事件的大事记涉事企业往往保持沉默置之不理或者回应回避要害导致事件的模糊性不断放大而法律诉讼又具有一定的滞后性。几件要素共同作用形成了网络谣言与真相起此彼伏的奇景群众看不到事情的真相涉事企业或委屈满腹或诚惶诚恐或羞于提及。虽然互联网拉近了人与人距离使得信息处理无比高效不断激发出新的传播方式可是每一次热点事件爆发人们距离真相依然非常遥远。数据来源全网数据数据统计时间2018年10月21日-2018年10月23日本文采取文本分析与数据挖掘的数据科学方法对本次「马蜂窝涉嫌数据造假」事件的舆情进行分析挖掘本次传播现象主要侧重于分析全网媒体对该事件的参与。以最直观的方式做出呈现与描述不做结论性判断意欲抛砖引玉鼓励与企业利益最紧密相关的利益相关方从各自视角积极发声、站出来为公众解读事实。一分析篇一、我们用什么工具一挖到底原始数据我们分析了全网2000条以上的新闻数据数据来自新浪、网易、搜狐等门户网站以及虎嗅、36氪等科技资讯网站以上新闻文本数据经过标题去重也就是说媒体平台之间相互转发的文章我们已经将重复标题的新闻文本数据去除。时间段10月21日、22日、23日。工具编程语言PythonScrapy爬虫抓取框架Genism文本分析库Wordart绘制个性化词云二、热度指数大家究竟有多关注图一热度指数趋势与爆发时间段。数据来源全网数据数据统计时间2018年10月21日-2018年10月23日因为考虑到事件检索的相关性所以我们设定热度指数的关键词检索方案为「马蜂窝数据造假」。我们观察热力指数图本事件首日也就是2018年10月21日的热度指数仅约为13.00但是在第二日10月22日峰值冲到61.56随后正常回落。第三日10月23日事件热度指数回落后再次冲向41.00。这样的变化符合关注此事件人们的直观感受舆论的潮水一浪未平又起一浪一浪更比一浪强。爆料团队在23日的再一次发声将本来已经平息的事件再次推向高潮。此处我们横向对比日常新闻事件的热度指数。虽然娱乐人物流量属性较强但是“王源调侃失败自拍尝试” 热度指数为43.55。社会公众对此次事件的关注度不言自明。数据来源全网数据数据统计时间2018年10月21日-2018年10月23日图二活跃媒体对此事的跟进与报道如图所示新闻报道来自新浪、网易、搜狐等门户网站来自微信公众号、百度百家号和今日头条的信息平台。排名前五的媒体都贡献了10%以上份额可见媒体均对此事充分重视并无哪家媒体的声量一家独秀其中信息量贡献最大的依然是微信平台。这也符合关注此事件人们的直观感受爆料团队在微信公众号平台首发消息各家媒体紧随其后进行报道与解读显示了媒体对此事反应非常迅速。也符合文章开头所提到的社会现象互联网企业吸引眼球、备受关注。既因为存在互联网群众对信息获取的刚需也因为媒体对互联网敏锐的嗅觉。如此供需匹配形成信息供需的有效闭环良莠不齐的资讯都会被这轮信息流吸收和放大。 数据来源全网数据数据统计时间2018年10月21日-2018年10月23日三、关键词词云图大家都在讨论啥词云图是文本数据可视化的常用工具我们选取排名前五十的关键词来绘制关键词云图。可以看到排名前十的词语分别是1. 马蜂窝2. 点评数据3. 点评4. 内容5. 抄袭6. UGC中文为用户创造内容7. 交易8. 虚假账号9. 平台10. 数据造假数据来源全网数据数据统计时间2018年10月21日-2018年10月23日舆论关注点一内容马蜂窝以游记和攻略起家的公司与用户有着较深的情感连接在消费者的品牌意识里马蜂窝不仅仅是一款旅游产品/平台它提供给人们的是对于自由生活的向往是一种不被束缚、逃离俗世的情感归属感一种正面的价值观。而这种价值观让品牌个性年轻有趣让人向往具有很强的品牌领导力这也是马蜂窝虽然处在在线旅游市场的第二梯队营业收入GMV远远低于第一梯队携程等企业的情况下其品牌知名度、口碑不亚于第一梯队。正如马蜂窝所主张的向崇尚自由的加勒比海盗致敬。根据其性质马蜂窝的核心竞争是源于其社区里活跃着一批不断生产内容并对社区品牌有认同的用户产生大量优质的原创旅游攻略等内容。而我们从分析中可以看出在与马蜂窝相关的全部信息中被提及频次最高的词语分别为「点评」、「内容」和「抄袭」。从广义上讲抄袭是原创的反义词。「内容」一词反复出现是关键词中的关键词可见舆论重视程度之高与其类似的「评论」、「问答」、「游记」、「攻略」均排在前五十可见舆论对马蜂窝涉嫌作假的细节有所了解清楚知道哪一块出现了问题。按照马蜂窝的所属行业有关旅游产品的词汇包括机票、酒店、自助游、自由行、目的地旅游等这类词没有一个出现在前五十的关键词中可见舆论聚焦度高讨论的火力都集中在举报团队质疑的核心问题上事件的焦点充分聚焦没有出现指东骂西东拉西扯的谣言。关于内容的词汇以「假」字居多「抄袭」、「造假」、「虚假」成为核心关键词可见马蜂窝的品牌形象有所跌落品牌美誉度受损。另外「马蜂窝」一词在此次事件语境下一语双关。既是公司名称又意喻招惹麻烦惹祸上身。词云图中字体大小与重要度相关。「马蜂窝」一词字体最大最突出。我们可以直观感受到确实也有不少媒体拿捅了「马蜂窝」用作新闻标题。在文本聚类的基础上进行典型意见挖掘话题中的代表性语句包括1. 近日某自媒体账号发布文章称马蜂窝旅游网部分点评及评论信息存在虚假内容并以此质疑马蜂窝旅游网的数据及用户真实性。2. 标题:马蜂窝餐饮点评非内容核心 自媒体报道有明显误导舆论关注点二投资方第二个舆论关注的焦点是关于马蜂窝的投资方。「投资人」、「资本」、「估值」、「融资」均排话题中的主题词在前五十。马蜂窝被业内人士称为旅游界的大众点评。第一、由于马蜂窝的业务涉及旅行的所有环节具有覆盖旅游前、旅游中、旅游后全旅游周期的用户行为数据。第二、原创是互联网内容最有价值的部分马蜂窝内容产出中心自然而然成为马蜂窝最大的流量入口。简单的说拥有了数据与流量马蜂窝可以在这个链路的任何一个结点上变现。从某种角度讲和其他的互联网公司一样马蜂窝是一家数据公司。有说得通的商业逻辑又有一定的营业收入使得马蜂窝在融资的路上顺风顺水。截图来源于B站这次事件与上市企业的危机有本质的不同原因在于公司的性质。马蜂窝属于融资轮次企业并没有公开向公众发售股票来融资。一旦这个类型的公司出现负面问题最受伤害的是投资方。由于马蜂窝估值较高达175亿所以「估值」、「融资」成为重点。不仅「估值」一词受关注关于融资情况的一整句话——2017年12月12日成立11年的老牌旅游网站马蜂窝宣布获得D轮巨额融资淡马锡、今日资本等合计投资1.33亿美元。入选「马蜂窝数据造假」话题中的代表性语句。事实上马蜂窝确实受到鸥翎投资、美国泛大西洋资本集团、高瓴资本、Coatue、CoBuilder、启明创投、Rich Barton、今日资本等机构的青睐。那么投资人和马蜂窝的底气在哪里据了解2017年中国出游人次达51.3亿整体收入为5.4万亿年度增幅为15.1%。近年来旅游市场保持着稳定增长国内排名靠前的在线旅游平台都活得风生水起份额稳定。马蜂窝的底气来源于三点第一、如今的马蜂窝已经不仅仅是一家靠出售流量和广告进行导流和转化的平台慢慢地向一端连接海量用户一端对接合作商户的平台转变。商业变现的可行性会增强。第二、旅游消费习惯发生了变化“专家型”消费者的比例大幅提升。业内人士表示这一变化也推动着像中青旅这样的老牌企业转型。例如中青旅的签证业务增长较快观察用户数据发现一个中青旅的老用户一个自然年度在中青旅办七次签证也不会报名一次跟团游。这种市场的转型对于马蜂窝是有利的有旅行需求的专业型消费者越多对专业的、细致的旅游信息需求越旺盛这是马蜂窝的优势。第三、旅游产品具有长决策周期的属性且消费者对旅游目的地的选择容易受到信息的影响进而影响决策。如果有刚需存在受到签证办不下来、航班、线路等负面问题的影响消费者有较大可能更改旅游目的地。马蜂窝所产出的信息对消费者决策影响力比一般电商所售卖商品的用后评价更有说服力和影响力提高内容的精准度就能够带动用户粘性和销售转化率提高。「投资人」、「资本」、「估值」、「融资」等关键词的本质是有大家都在关心马蜂窝的商业模式和核心盈利能力。这些也是投资人与机构能够为其做出175亿估值并且买单的原因。这块是本次话题讨论的第二大焦点。相关报道中存在不少报道直接以175亿作为新闻标题。在文本聚类的基础上进行典型意见挖掘话题中的代表性语句包括1. 如果大量造假情况真实存在马蜂窝的融资计划还能顺利进行吗2. 标题:马蜂窝被曝大规模抄袭用户点评 新一轮融资前陷危机3. 标题:马蜂窝被爆“点评造假”或将像熊猫直播一样融资落空4. 标题被捅的马蜂窝融资暗战和五毛党江湖我们认为可以做出合理推论投资机构的投资行为成为困扰舆论的最大问题。舆论关注点三 围绕话题风暴的中心「马蜂窝数据造假」网民还讨论了什么当网民在讨论「马蜂窝数据造假」这个问题时还讨论了哪些问题我们需要挑选出之前报道中出现频率较高的词汇进行文本相似度计算。技术原理是用Python工具包Gensim跑多种主题算法。我们选取了“马蜂窝数据造假”作为检索条件按照「马蜂窝」「数据造假」的关联词的相关程度从高到低排序。「承认」「指控」「维护」「攻击行为」「发酵」「歪曲事实」排在前面。分析中可以看出第一、大家都在讨论与事实相关的信息。与事实相关的包括基于事实的「声明」、「歪曲事实」、对事实的「质疑」、对事实的「否认」讨论的话题都没有离开事实。换句话说人民群众高度重视事实想要了解真相这是一场围绕寻找事实真相的大讨论。总体看来追求事实的真相是本次热议的关键。第二、辩论双方和其举动。「声明」「承认」与「指控」是爆料团队与被爆料企业在事件中你来我往的举动也就是说双方的一举一动都牵动着互联网人民群众的心。「起家」一词也被多次讨论涉事一共有两方「起家」显然是关于马蜂窝的企业成长历史可见关于涉事企业本身的讨论也是热点议题网民关心涉事企业是一家什么样的企业拥有哪些服务有着怎样的历史。「攻击行为」则是属于对于爆料团队的推测。数据来源全网数据数据统计时间2018年10月21日-2018年10月23日第三、与话题相关度上来看「抄袭」「水军」「账号」关系最为密切其次「数据造假」与「搬运」等词的关系很近。「水军」也与话题关系很近。依据常识水军和僵尸是内容作假的主力。此次事件也将互联网的造假术推上风口浪尖。数据来源全网数据数据统计时间2018年10月21日-2018年10月23日在文本聚类的基础上进行典型意见挖掘话题中的代表性语句包括1. 评马蜂窝扒友商用户评论互联网企业不能没底线。2. 南都记者梳理网上公开资料发现在同类型的旅游APP中马蜂窝旅游并非首家被质疑涉嫌数据造假同程等旅行网站也出现过类似情况。3. 标题:旅游数据造假马蜂窝旅游被指涉嫌造假1800万数据4. 马蜂窝“点评造假”数据来源全网数据数据统计时间2018年10月21日-2018年10月23日二拷问篇目前该事件已有司法部门介入尚无定论。在本文中我们谨慎用词仅用“涉嫌”一词对本事件的主角进行描述。可以这样说「马蜂窝捅了马蜂窝」事件在大数据与人工智能如此火热的气候环境里用大数据技术给大众上了一堂生动的科普课。但是关于此次事件尚存许多问题值得拷问如果涉嫌一事坐实这会不会成为互联网投资史上最响亮的耳光如果涉嫌一事坐实为什么能用假数据圈了将近175亿人民币如果涉嫌一事坐实著名资本看好甚至不止一次看好的公司为什么会出问题优秀的VC都是眼瞎吗还是心系击鼓传花无意刺破那窗户纸如果涉嫌一事坐实高估值的互联网公司是距离公开发行的股票的资本市场最近的企业VC投资人上市套现下一步股民买单风险投资人的社会责任感在哪里如果涉嫌一事坐实多方信息显示不止马蜂窝一家造假那么互联网的造假手段到底有没有人管如果涉嫌一事为假爬虫软件涉及法律的灰色地带该如何从法律的角度解读有关部门和有关专家是否能抓住这次普法的大好时机有针对性解答社会热点问题。如果你要爆料欢迎后台留言~~完1.微信群添加小编微信tangguoyemeng备注“进群姓名公司职位”即可加入【云计算学习交流群】和志同道合的朋友们共同打卡学习2.征稿投稿邮箱lijycsdn.net微信号tangguoyemeng。请备注投稿姓名公司职位。推荐阅读面趣 | 想一想这道题没准去BAT面试就遇到了呢云漫圈 | 我觉得我的手机被监听了。。。北京房租大涨6个维度数万条数据帮你揭穿附详情代码200行代码一行行教你自制微信机器人快戳Python 开发者的福音来啦40k~70k京东这波区块链人才需求有你吗你差在哪里这是三篇影响百度17年的技术博客作者李彦宏程序员的江湖 务必掌握这些黑话扫描以下二维码即可参与“2018 年 CSDN 软件开发者大调查活动”我们还为你准备了精美的礼品华为 nova3 智能手机、小爱智能音箱、CSDN 背包、CSDN 定制T恤、数百本技术图书等你来拿参与即有机会获赠还等什么快来试试吧↓↓↓ 点击【阅读原文】查看「CSDN云计算」往期精彩内容