主流高性能计算文件管理系统优劣点评
当下市场中有很多高性能文件系统:Sun QFS、IBM GPFS、Quantum StorNext、Red Hat GFS和Panasas等等,那么哪一个是最好的呢?这要取决于你自身的需求。
Panasas首席营销管Len Rosenthal表示:“我们的竞争对手包括NetApp OnTap或者OnTap GX、EMC、IBM GPFS、HP Polyserve或者Sun的开源研究项目Lustre。虽然我们已经取代了运行Sun QFS的系统,但是在销售方面却从来没有真正地与他们竞争。”
Rosenthal表示,Quantum StorNext和HP Polyserve只能处理最高16个集群NFS服务器,所以他们不会与扩展NAS产品竞争。同样地,IBM GPFS和Sun Lustre与Panasas PanFS一样都是并行文件系统,主要被高等院校和政府研究机构用于扩展存储容量的用途,但是他们不提供足够高的I/O率或者快照等数据管理工具。
那么Panasas的竞争对手是如何对此回应的?
IBM公司GPFS产品经理Todd Neville表示,GPFS安装基础非常广泛,其中包括高性能计算、零售、媒体和娱乐、金融服务、生命科学、医疗、Web 2.0、电信以及制造业。Neville也不认同Panasas关于I/O率的说法。
昆腾公司软件业务产品线总监Greg Nuss也强调说,Panasas关于StorNext功能的说法是完全错误的。
他说:“StorNext集群中的每个节点都可以作为一个NFS服务器,并且在终端代表通用文件系统命名空间。现在,我们支持1000个节点,支持与集群连接的附加SAN节点或者附加LAN节点。现在我们每天实际安装的节点大约在300到400个之间。一般来说我们并不与Panasas形成市场竞争关系,因为StorNext一般不配置在扩展NAS架构中,而是用于高性能工作流以及归档架构中。”
与此同时,惠普也反驳了Panasas的说法。惠普表示,HP Scalable NAS在用户集群中能够使用的NAS File Services服务器节点方面并不存在架构性的限制。
HP StorageWorks部门NAS产品营销总监Ian Duncan表示:“我们所说的16个服务器节点限制仅仅是指测试限制。现在我们有许多NAS File Service用户正在使用超过16个服务器节点的集群。”
Duncan表示,Panasas、Sun QFS、IBM GPFS以及Quantum StorNext并不是真正的对称文件系统,而是基于主服务器的集群文件系统——不管是否针对元数据操作和锁定操作,或者两者兼备——这非常容易被作为传统的、单节点系统。然而,Duncan认为这些厂商可能面临主服务器单一角色导致的性能和可用性方面的瓶颈。
Duncan表示:“当添加服务器的时候,在主服务器上的负载增加,这可能会造成性能的削弱,并且在主服务器发生故障的情况下导致更多节点功能性的丢失。相比之下,4400 Scalable NAS File Services采用了HP Clustered File System (CFS),开发出多台独立服务器来提供更高的可扩展性和可用性,将集群与任何独立节点故障或者性能局限隔离开来。”
抛开以上这些,下面让我们来仔细看一看其中一些文件系统。
Panasas PanFS
Panasas PanFS并行文件系统是一个基于目标的文件系统,面向那些在I/O和带宽方面要求高性能水平的扩展应用。与Panasas同样提供支持的NFS或者CIFS不同的是,PanFS采用并行的DirectFLOW协议,该协议是即将推出的pNFS(是NFS 4.1的重要升级)的基础。据称,Panasas并行存储的主要优点是超高应用性能。
NFS服务器要求所有I/O请求必须通过一个NAS文件管理器头(Filer head),而PanFS能够实现数据从客户或者服务器节点向存储系统的并行传输。Panasas系统将NAS机头从数据路径中消除掉,使它不再是I/O瓶颈。例如:Panasas并行存储配合安装全球性能最高的计算机系统——应用在美国新墨西哥洛斯阿拉莫斯国家实验室的Roadrunner超级计算机。它向一个共享文件系统的传输率可以达到每秒100GB。 #p#page_title#e#
Rosenthal表示:“有了这种架构,Panasas并行存储系统可以扩展被上千名用户或者服务器使用,存储容量扩展至数十PB,可以提供超过100GB/s的带宽。这种基于软件的RAID架构包括的其他主要功能能够实现并行RAID重建,使它的速度提高到大多数存储系统的5倍到10倍左右。”
PanFS还应用了Panasas Tiered Parity技术,这项技术可以自动监测和修正无法恢复的组件错误,这一点在重建过程中是非常重要的。最后,这种我呢间系统针对许多仿真和建模应用进行了优化。
但是,Panasas系统是针对文件存储设计的,不是块存储。因此,它一般不应用于以交易为主导的应用,例如ERP、订单输入以及CRM。相反,它常用于那些许多用户或者服务器节点需要向大型文件存储池的共享路径的应用。
HP File Services
HP File Services主要针对那些需要无缝提高应用吞吐量、不用中断服务就可以轻松在线增加存储容量的中小企业用户。HP StorageWorks 4400 Scalable NAS File Services包括一个双阵列控制器和4.8TB容量的HP StorageWorks 4400 Enterprise Virtual Array、三个文件服务节点、管理和复制软件、以及对Windows或者Linux的支持。有了三个文件服务节点和双阵列控制器,4400 Scalable NAS File Services就不会发生单点故障。
缺点是什么呢?Duncan表示:“4400 Scalable NAS File Services不太适合于那些要求超过每秒6GB吞吐量的高性能计算应用。”
Quantum StorNext
StorNext是那些Apple用户的最合适平台选择。而且,在Apple、Windows和其他系统必须与之互动的富媒体环境中,StorNext已经控制住了这个市场。例如,StorNext通常被用于严格的视频生产和回放应用中,因为他能够处理大容量和高清内容的帧频。除了这些StorNext还能做什么?
Nuss表示:“StorNext与其他共享文件系统的主要区别就是与归档层(StorNext/StorageManager)严格的集成度、强大的磁带支持以及对更多操作系统平台的支持。其他文件系统不能在一个集群系统内支持Linux、Unix、Apple和Windows的多种版本。”
StorNext文件系统是一个异构的共享文件系统,具有集成的归档功能。它能够让系统共享图像、媒体、内容、分析数据以及其他文件的高速存储池,这样他们就可以被快速地处理和分配——不管是否与SAN或者LAN相连接。
IBM GPFS
IBM的General Parallel File System (GPFS)已经推出好几年时间了。
Iluminata分析师John Webster表示:“GPFS是一个针对AIX和Linux系统的高性能、共享磁盘、集群文件系统。”
GPFS最初是针对高性能计算设计的,现在它已经扩展到需求高性能、容错和高容量环境中,例如关系数据库、CRM、Web 2.0、媒体应用、工程设计、金融应用和数据归档。
Neville表示:“GPFS是基于一个SAN模型的,所有服务器能够访问所有存储。GPFS允许从任何不与SAN连接的系统进行数据访问,提供了一个SAN仿真软件,允许使用以太网等通用网络来访问数据。”
在每个文件系统的所有磁盘中数据被条带化,这让每个磁盘的带宽被用于单文件服务或者用于产生多文件的聚合性能。这种性能水平被分配给所有节点,然后组成了集群。用户还可以架构GPFS,这样就不会发生单点故障。在核心文件服务功能的上层,GPFS提供了能够在集群之间共享数据的功能,以及基于策略的信息生命周期管理工具,使用这款工具可以将数据在包括磁带在内的不同存储层之间进行迁移。
除此之外,GPFS能够被作为文件服务NAS集群的核心,在这个集群中可以通过集群的所有节点以NFS、CIFS或者HTTP的形式提供数据。用户还可以根据需求的变更来添加或者移除节点或者存储设备。基于GPFS的IBM Scale Out File Services (SoFS)包括许多附加功能性。
Neville表示:“随着文件集中型数据和存储容量的迅速增长,未来NAS将可能延续高性能计算、Web服务或者其他类似的行业趋势,发展成为一种基于标准低成本组件的扩展模式,这也是GPFS的一个核心竞争优势。” #p#page_title#e#
上述的大多数厂商都宣称在多个领域拥有领先优势,同时他们也承认自己的一些劣势领域。底线就是,现场测试和免费试用期的自由使用能够看到这些不同文件系统在你环境中的表现。