深圳做网站那家公司好,wordpress程序迁移,网站建设的主要技术,重启 iis 中的网站文章目录 前言#xff1a;一、云计算1.1 云计算的基本思想1.2 云计算概述——什么是云计算#xff1f;1.3 云计算的基本特征1.4 云计算的部署模式1.5 云服务1.6 云计算的关键技术——虚拟化技术1.6.1 虚拟化的好处1.6.2 虚拟化技术的应用——12306使用阿里云避免了高峰期的崩… 文章目录 前言一、云计算1.1 云计算的基本思想1.2 云计算概述——什么是云计算1.3 云计算的基本特征1.4 云计算的部署模式1.5 云服务1.6 云计算的关键技术——虚拟化技术1.6.1 虚拟化的好处1.6.2 虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3 虚拟化的关键特征1.6.4 虚拟化的 HA 指的是什么1.6.5 服务器虚拟化1.6.6 虚拟机迁移1.6.6.1 虚拟机实时迁移对云计算的意义 1.6.7 存储虚拟化1.6.7.1 存储虚拟化的原动力1.6.7.2 什么是存储虚拟化1.6.7.3 存储虚拟化的优势1.6.7.4 存储技术分类1.6.7.5 存储虚拟化的实现方式 1.6.8 网络虚拟化1.6.9 桌面虚拟化1.6.9.1 桌面虚拟化的特点 二、大数据2.1 什么是大数据2.2 大数据的特征——4V2.3 大数据的技术支撑2.4 大数据处理方法2.5 大数据关键技术2.6 云计算、大数据、物联网三者之间的关系2.7 大数据计算模式 三、开源大数据框架 Hadoop3.1 新方法、新思路3.2 Hadoop 简介3.3 基于 Hadoop 的大数据处理框架3.4 Hadoop 的特征3.5 Hadoop 集群中有哪些节点类型3.6 MapReduce 的分而治之3.7 Hadoop 生态系统 四、分布式文件系统HDFS4.1 分布式结构4.2 计算机集群结构4.3 分布式文件系统的结构4.4 HDFS高可靠性的保证——副本冗余机制 五、分布式并行计算框架 MapReduce5.1 并行编程之 MapReduce5.2 MapReduce 的核心思想 六、Hive七、Spark八、结语 前些天发现了一个巨牛的人工智能学习网站通俗易懂风趣幽默忍不住分享一下给大家。点击跳转到网站。 前言 大数据是需求云计算是手段。没有大数据就不需要云计算没有云计算就无法处理大数据。 一、云计算
1.1 云计算的基本思想 所有的计算能力、存储能力、和各种各样功能的应用都通过网络从云端获得 用户不需要不停的更换昂贵的高性能电脑 用户不需要购买、安装和维护各种系统和应用软件 用户不需要担心数据的安全存储
1.2 云计算概述——什么是云计算
云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上使各种应用系统能够根据需要获取计算力、存储空间和信息服务。 把本地计算机需要进行的计算和存储等工作放到云上去处理。
1.3 云计算的基本特征 按需自助服务 无处不在的网络接入 敏捷的弹性 资源池 可度量的服务
1.4 云计算的部署模式 公有云面向所有用户提供服务只要是注册付费的用户都可以使用比如阿里云和 Amazon AWS。 私有云只为特定用户提供服务比如大型企业出于安全考虑自建的云环境只为企业内部提供服务。 混合云综合了公有云和私有云的特点因为对于一些企业而言一方面出于安全考虑需要把数据放在私有云中另一方面又希望可以获得公有云的计算资源为了获得最佳的效果就可以把公有云和私有云进行混合搭配使用。
1.5 云服务
云服务是一种商业模式是基于互联网的相关服务的增加、使用和交付模式通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。 基础设施即服务IaaS是把计算、存储、网络以及搭建应用环境所需的一些工具当成服务提供给用户使得用户能够按需获取 IT 基础设施。IaaS 主要由计算机硬件、网络、存储设备、平台虚拟化环境、效用计费方式、服务级别协议等组成。四个业务特征用户获得的是 IT 资源服务、用户通过网络获得服务、用户能够自助服务、按需计费。优势用户免部署与维护、经济性对于用户和服务者提供、开放标准跨平台灵活迁移、支持应用范围广、伸缩性强。 平台即服务PaaS是一种分布式平台服务为用户提供一个包括应用设计、应用开发、应用测试及应用托管的完整的计算机平台。主要是面向互联网应用开发者 软件即服务SaaS是软件服务提供商为了满足用户的需求提供的软件的计算能力。SaaS 云服务提供商负责维护和管理云中的软件以及支撑软件运行的硬件设施同时免费为用户提供服务或者以按需使用的方式向用户收费。所以用户无需进行安装、升级和防病毒等并且免去了初期的软硬件支出。
小TipsIT 基础设施资源分为计算资源、存储资源、网络资源、基础软件资源
1.6 云计算的关键技术——虚拟化技术
虚拟化技术的核心思想是利用软件或固件管理程序构成虚拟化层把物理资源映射为虚拟资源。在虚拟资源上可以安装和部署多个虚拟机实现多用户共享物理资源。 虚拟化是云计算最重要的特征之一基于虚拟化技术可以对存储、计算、网络等物理资源进行池化资源池化的基础设施更易于实现按需分配的资源调度策略、易于实现资源池的横向扩展。 小Tips上图是采用虚拟化技术的云计算数据中心的物理拓扑结构
1.6.1 虚拟化的好处 提高了硬件资源的利用率 提高劳动生产率 节省了大量成本 降低运维管理成本
1.6.2 虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃
高并发和高流量一直是需要解决的关键问题。把高频次、高消耗、低转化的余票查询环节放到云端而将下单、支付这种“小而轻”的核心业务仍然留在 12306 自己的后台系统上这样的思路为 12306 减负不少。 公有云可以为 12306 在高流量时期提供了充足的空间避免了因为高并发的流量冲击导致的宕机。 在请求次数减少时可以缩减公有云这样就节省了成本开支。 除此之外将余票查询而非核心系统托管在公有云上还能避免敏感性资料的泄露保护用户数据的安全。
1.6.3 虚拟化的关键特征 兼容性虚拟机完全兼容标准的操作系统以及在这些操作系统之上建立的硬件驱动和应用 隔离每一个虚拟机都与同在一个服务器上的其他虚拟机相隔离。从软件角度来看互相隔离的虚拟机之间保持独立如同一个完整的计算机从硬件角度讲被隔离的虚拟机相当于一台物理机有自己的 CPU、内存、硬盘、I/O 等它们与宿主机之间保持相互独立的状态从网络角度讲被隔离的虚拟机如同物理机一样既可以对外提供网络服务也一样可以从外界接受网络服务。 封装虚拟机将整个系统包括硬件配置、操作系统以及应用等封装在文件里 硬件独立可以在其他服务器上不加修改的运行虚拟机
1.6.4 虚拟化的 HA 指的是什么
HA高可靠性就是发生服务器故障时在其他的物理服务器上自动重启虚拟机从而减少停工的时间而保证其服务的高度可用性。总结通过 HA 可以方便的提高任何应用的高可用性。
客户优势对所有的应用实现了高可用性并且成本很低不需要完全一致的重复硬件比传统的集群有更高的成本优势同时易于使用和操作。
1.6.5 服务器虚拟化
将一个或多个物理服务器虚拟成多个逻辑上的服务器集中管理能跨越物理平台不受限制。 服务器虚拟化的两个方向 一种是把一个物理的服务器虚拟成若干个独立的逻辑服务器。 另一种是把若干分散的物理服务器虚拟化为一个大的逻辑服务器比如网格技术Hadoop 大数据技术。 根据虚拟化层实现方式的不同分为寄居虚拟化和裸机虚拟化两种。 服务器虚拟化的底层实现CPU 虚拟化、内存虚拟化、I/O 虚拟化。
1.6.6 虚拟机迁移
将虚拟机实例从源宿主机迁移到目标宿主机并且在目标宿主机上能够将虚拟机运行状态恢复到其在迁移之前相同的状态以便能够继续完成应用程序的任务。
1.6.6.1 虚拟机实时迁移对云计算的意义 云计算中心的物理服务器负载经常处于动态变化中当一台物理服务器负载过大时若此刻不能提供额外的服务器管理员可以将其上面的虚拟机迁移到其他服务器达到负载平衡。 云计算中心的物理服务器有时候需要定期进行升级维护当升级维护服务器时管理员可以将其上面的虚拟机迁移到其他服务器等升级维护完成后再把虚拟机迁移回来实现升级维护时业务不中断的目标。
1.6.7 存储虚拟化
存储虚拟化是一种贯穿于整个 IT 环境、用于简化本来可能会相对复杂的底层基础架构的技术。存储虚拟化的思想是将资源的逻辑映像与物理存储分开从而为系统和管理员提供一副简化、无缝的资源虚拟试图。 1.6.7.1 存储虚拟化的原动力 标准化接入能够使不同的存储器按标准的方式接入到存储设备。 统一数据管理能够在统一的空间资源整合基础上提供复制功能快照功能迁移功能镜像功能能够实现跨设备、跨地域的资源迁移使数据可以在不同品牌、不同设备之间进行自由流动。 空间资源整合把这些空间资源异构资源进行整合进行统一的调度和管理。
1.6.7.2 什么是存储虚拟化
存储虚拟化是指将存储网络中各个分散且异构的存储设备按照一定的策略映射成一个统一的连续编制的逻辑存储空间称为虚拟存储池并将虚拟存储池的访问接口提供给应用系统。 小Tips虚拟化层的作用是提供了虚拟化的逻辑卷与底层的物理设备间的一种映射操作屏蔽掉所有存储设备的物理特性。
1.6.7.3 存储虚拟化的优势 存储虚拟化将系统中分散的存储资源整合起来。 在虚拟层通过使用数据镜像数据校验和多路径等技术提高了数据的可靠性及系统的可用性。 利用负载均衡、数据迁移、数据块重组等技术提升系统的潜在性能。 整合和重组底层物理资源。
1.6.7.4 存储技术分类 磁盘阵列RAID磁盘阵列是由很多块独立的磁盘组合成一个容量巨大的磁盘组利用个别磁盘提供数据所产生的加成效果提升整个磁盘系统效能。利用这项技术将数据切割成许多区段分别存放在各个硬盘上。RAID 技术把多个物理磁盘用阵列的形式通过一定的逻辑关系结合成为一个大容量的虚拟磁盘 网络附属存储网络存储器 NAS 一种专用数据存储服务器。以数据为中心将存储设备与服务器彻底分离集中管理数据从而释放带宽、提高性能、降低总拥有成本、保护投资其成本远远低于使用服务器存储而效率却远远高于后者。 存储区域网络SAN专门为存储建立的独立于 TCP/IP 网络之外的专用网络。存储容量大速度快。 1.6.7.5 存储虚拟化的实现方式 基于主机的存储虚拟化当仅需要单个主机服务器访问多个磁盘阵列时可以使用基于主机的存储虚拟化技术。 基于存储设备的存储虚拟化当有多个主机服务器需要访问同一个磁盘阵列时可以使用基于存储设备的存储虚拟化技术。 基于网络的存储虚拟化当多个主机服务器需要访问多个异构存储设备时可以使用基于网络的存储虚拟化技术。
1.6.8 网络虚拟化
网络虚拟化是让一个物理网络能够支持多个逻辑网络虚拟化保留了网络设计中原有的层次结构、数据通道和所能提供的服务使得最终用户的体验和独享物理网络一样同时网络虚拟化技术还可以高效的利用网络资源如空间、能源、设备容量等。网络虚拟化的目的是在不改变传统数据中心这个网络的物理拖布结构的前提下实现网络的整合。
1.6.9 桌面虚拟化
桌面虚拟化是指将计算机的终端系统也称作左面进行虚拟化以达到桌面使用的安全性和灵活性。可以通过任何设备在任何地点任何时间通过网络访问属于我们个人的砖面系统。
1.6.9.1 桌面虚拟化的特点 快速、灵活部署 提高资源利用率 数据存放安全可靠 维护便利 节能减排
二、大数据
2.1 什么是大数据
海量数据或巨量数据其规模巨大到无法通过目前主流的计算机系统在合理的时间内获取、存储、管理处理并提炼以帮助使用者决策。大数据——挖掘和整合一切有用的信息为人类社会提供更好的服务。
2.2 大数据的特征——4V 数据量大 数据类型繁多 处理速度快 价值密度低价值高
2.3 大数据的技术支撑 存储存储成本的下降 计算运算速度越来越快 智能机器拥有理解数据的能力
2.4 大数据处理方法 大数据的采集数据抓取、数据导入、物联网传感设备自动信息采集 导入/预处理数据清理、数据集成、数据变换、数据归约 数据分析三大作用现状分析、原因分析、预测分析。方法对比分析、分组分析、交叉分析、回归分析。 数据挖掘是创建数据挖掘模型的一组试探法和计算方法通过对提供的数据进行分析查找特定类型的模型和趋势最终形成创建模型。基本方法预测建模、关联分析、聚类分析、异常检测。
2.5 大数据关键技术 数据采集与预处理 数据存储和管理 数据处理与分析 数据隐私和安全
2.6 云计算、大数据、物联网三者之间的关系
云计算为大数据提供了技术基础大数据为云计算提供了用武之地物联网是大数据的重要来源大数据技术为物联网数据分析提供支撑云计算为物联网提供海量数据存储的能力物联网为云计算技术提供了广阔的应用空间。
2.7 大数据计算模式 批处理计算针对大规模数据的批量处理 流计算针对流数据实时计算 图计算针对大规模图结构数据的处理 查询分析计算大规模数据的存储管理和查询分析
三、开源大数据框架 Hadoop MapReduce是由 Google 开发的一个针对大规模群组中的海量数据处理的分布式编程模型。
BigTable是 Google 设计的分布式数据存储系统是用来处理海量数据的一种非关系型数据库。
Google 文件系统GFS是构建在廉价的服务器之上的大型分布式系统。为 Google 大数据处理系统提供海量的存储并且与 MapReduce 和 BigTable 等技术结合的十分紧密GFS 处于系统的底层。
3.1 新方法、新思路
分而治之 分布式文件存储 分布式并行计算模式 计算靠近数据 3.2 Hadoop 简介
Hadoop 是 Apache 软件基金会旗下的一个开源分布式计算平台为用户提供了系统底层细节透明的分布式基础架构。Hadoop 是基于 Java 语言开发的具有很好的跨平台特性并且可以部署在廉价的计算集群中。Hadoop 的核心是分布式文件系统 HDFS 和 MapReduce。Hadoop 被公认为行业大数据标准开源软件在分布式环境下提供了海量数据处理能力。 3.3 基于 Hadoop 的大数据处理框架 平台管理层确保整个数据处理平台平稳安全运行的保障包括配置管理、运行监控、故障管理、性能优化、安全管理等在内的功能。 数据分析层提供一些高级的分析工具给数据分析人员以提高他们的生产效率。 编程模型层为大规模数据处理提供一个抽象的并行计算编程模型以及为此模型提供可实施的编程环境和运行环境。 数据存储层提供分布式、可扩展的大量数据表的存储和管理能力强调的是在较低成本条件下实现海量数据表的管理能力。 文件存储层利用分布式文件系统技术将底层数量众多且分布在不同位置的通过网络连接的各种存储设备组织在一起通过统一的接口向上层应用提供对象级文件访问服务能力。 数据继承层系统需要处理的数据来源包括私有的应用数据、存放在数据库中的数据、被分析系统运行产生的日志数据等这些数据具有结构多样、类型多变的特点。 3.4 Hadoop 的特征
Hadoop 是一个能够对大量数据进行分布式处理的软件框架并且是以一种可靠、高效、可伸缩的方式进行处理的它具有以下几个方面的特征高可靠性、高效性、高可扩展性、高容错性、成本低、运行在 Linux 平台上、支持多种编程语言。
3.5 Hadoop 集群中有哪些节点类型 NameNode中心服务器负责管理文件系统的名字空间以及客户端对文件的访问。执行文件系统的名字空间操作如打开、关闭、重命名文件或目录。也负责确定数据块到具体的 DataNode 节点的映射。 DataNode负责管理它所在节点上的存储。负责处理文件系统客户端的读写请求在 NameNode 的调度下进行数据块的创建、删除和复制。 SecondaryNameNode帮助 NameNode 收集文件系统运行的状态信息。 ResourceManager是 Yarn 集群主控节点负责协调和管理整个集群所有 NodeManager的资源。 NodeManager管理一个 Yarn 集群中的每个节点负责执行有由 RsourceManage 指派的任务。
小Tips其中前三个是和 HDFS 有关的守护进程后两个是和 MapReduce 有关的守护进程。 小Tips上图是 Hadoop 完全分布式集群的主从节点及对应的守护进程。这张图中master 节点既做主节点又做从节点因此这个集群中有一个主节点三个从节点。伪分布式的运行模式是在单台服务器上模拟 Hadoop 的完全分布式并不是真正的分布式而是使用线程模拟的分布式。在这个模式中所有的守护进程NameNode、DataNode、ResourceManager、NodeManager、SecondaryNameNode都在同一台机器上运行。此种模式除了并非真正意义上的分布式之外其执行逻辑完全类似于完全分布式因此常用于开发人员测试程序执行。
3.6 MapReduce 的分而治之
Map 是映射Reduce 是规约。 3.7 Hadoop 生态系统 Hadoop 在企业中的一种典型应用架构如下图所示 小TipsHadoop Eclipse 插件它可以直接嵌入到 Hadoop 开发环境中从而实现了开发环境的图形化界面降低了编程的难度。
四、分布式文件系统HDFS
4.1 分布式结构
集群集群就是逻辑上处理同一任务的机器集合可以属于同一机房也可分属不同的机房。
分布式分布式文件系统把文件分布存储到多个计算机节点上成千上万的计算机节点构成计算机集群。 4.2 计算机集群结构
与之前使用多个处理器和专用高级硬件的并行化处理装置不同的是目前的分布式文件系统所采用的计算机集群都是由普通硬件构成的这就大大降低了硬件上的开销。 4.3 分布式文件系统的结构
分布式文件系统在物理结构上是由计算机集群中的多个节点构成的这些节点分为两类一类叫“主节点”Master Node或者也被称为“名称节点”NameNode另一类叫“从节点”Slave Node或者也被称为“数据节点”DataNode。 HDFS 是一个大规模的分布式文件系统采用 master/slave 架构一个 HDFS 集群是有一个 NameNode 和一定数目的 DataNode 组成。 NameNode是一个中心服务器负责管理文件系统的名字空间和客户端对文件的访问。NameNode 执行文件系统的名字空间操作比如打开、关闭、重命名文件或目录负责确定的数据块到 DataNode 节点的映射。
Hadoop 集群中的节点及对应的守护进程如下图所示
4.4 HDFS高可靠性的保证——副本冗余机制
HDFS 为了做到高可靠性创建了多份数据块的复制并将它们放置在服务器群的计算节点中MapReduce 就可以在它们所在的节点上处理这些数据了。 五、分布式并行计算框架 MapReduce
5.1 并行编程之 MapReduce 5.2 MapReduce 的核心思想
分而治之一个存储在分布式文件系统 HDFS 中的大规模数据集会被切分成许多独立的分片即一个大任务分成多个小的子任务map由多个节点进行并行执行并行执行后合并结果reduce。MapReduce 采用的是“分而治之”的思想把对大规模数据集的操作分发给一个主节点管理下的各个从节点完成然后通过整合各个节点的中间结果得到最终结果。简单来说MapReduce 就是“任务的分解与结果的汇总”。
小Tips适合使用 MapReduce 来小处理的数据集需要满足一个前提条件一个大数据若可以分为具有同样计算过程的数据块并且这些数据块之间不存在数据依赖关系则提高处理速度的最好办法就是并行计算。
六、Hive 七、Spark 八、结语
今天的分享到这里就结束啦如果觉得文章还不错的话可以三连支持一下春人的主页还有很多有趣的文章欢迎小伙伴们前去点评您的支持就是春人前进的动力