海量储存的网络时代

海量储存的网络时代 2006/04/24
亚庇报道:李崇源

从最小MB到最大EB 网络储存一步步走来

数码相机或手机常用的记忆卡或闪存碟是以MB(百万位元组)作为储存单位,电脑硬碟机则是把GB(十亿位元组)当作最小单位,那么,用来储存资料归档和备份的最大计算单位是什么呢?

答案是EB(一百万兆位元组)。这两个普通的英文字母凑合在一起,对大多数人而言,恐怕一点概念也没有,更不知道到底EB储存量有多庞大?

举个例子,5 EB的储存量相等于人类从第一个祖先开始,一直到今天每个人类所讲过的每一句话,就是那么多。

打从人类从工业时代迈入资讯时代,已经不断地凭其智慧制造了许许多多的资料,并将这些数据都储存在电脑里,或者更正确的说法,是将之数码化地储存起来。

据美国柏克莱大学研究指出,自人类有历史以来,一直到2003年,人类所制造的数据已经达到57个EB;而到了2006年,这个数目将达到180 EB。

随着时代的变迁,人类所制造的数据越来越多,储存的媒介不论是在容量和技术方式上,都有了长足的发展。资料诸存对个人而言,是一件人生大事;而企业界对储存方案的需求,更是至关紧要,也是一门巨大的生意。

由于家庭网络化越来越普遍,加上人人正投入于一个全数码的生活方式,个人或企业均面对更大储存容量的需求。因此,网络化的储存使媒体文件更容易在不同的装备、个人电脑或媒体播放器上共同分享使用。海量储存的网络时代正一步步向我们走来。

储存媒体跨越五大时代

人类储存一路走来,所使用的媒介虽然多不胜数,不过,大致上可分成五个主要的时代。

第一代:穿孔卡片到磁带

●穿孔卡片(Punch Cards):1834年的时候,英国科学家巴贝奇 (Charles Babbage)设想制造1台通用的分析机,在只读储存器(穿孔卡片)中储存程序和数据,一直到1940年代,穿孔卡片还是主流的储存媒介。

●纸带(Paper Tape):1943年,Mark I自动顺序控制电脑Mark I在美国研制成功,它所使用的储存媒介正是纸带。

●磁鼓(Magnetic Drum):一种后备储存器,能直接进行存取,储存容量超过20万个字。它是一个表面可磁化的圆筒,磁表面有若干个磁道。当一组读写头进入并以高达每秒10兆位的数据传输率存取数据时,磁鼓将连续不停地旋转。

●磁带(Magnetic Tape):1949年,EDVAC(Electronic Discrete Variable Computer),是第一台使用磁带的电脑,对储存领域来说,可算是一个大突破,因为可多次在其上储存程序。

●磁碟(Magnetic Disks):1950年, 由东京帝国大学的Yoshiro Nakamats发明的软磁碟,销售权由IBM获得,磁碟的出现其实承先启后,为第二代柔性塑料磁碟的出现,和开创储存新纪元布下了条件。

第二代:5寸软盘到3寸硬碟

●5.25寸软盘(Floppy Disks):软式磁碟是覆盖磁性涂料的塑料片,用来储存数据文件,5.25寸软盘的容量是1.2MB。

●硬碟(Hard Disk):硬碟是一种主要的电脑储存媒介,由一个或者多个铝制或者玻璃制的碟片组成。现在电脑内置的都是3.5寸固定硬碟,不过,现在便携式硬碟也越来越普及了。最早的硬碟是1956年9月,IBM向世界展示的第一台磁碟储存系统IBM 350 RAMAC(Random Access Method of Accounting and Control)。

第三代:磁碟片到光碟机

●3.5寸磁碟:3.5寸磁碟片的出现,代表了一个储存媒介新时代的开始,其容量为1.44MB。在1989年,怡敏信(Imation)的前身:3M数据储存部生产了首张1.44MB,3.5寸磁碟。

●Zip磁碟机(Zip Drives):Iomega公司开发的一种磁碟机,它使用能够储存100MB数据的Zip磁碟片。

●MO磁性光碟(Magneto Optical Disk,MO):其外观和3.5寸磁碟相似,而内部圆盘则和光盘相似。原本MO的设计是用来取代硬碟的,MO分为3.5寸和5.25寸两种,前者较为普遍。

●可重覆录写光碟(CD-RW):1988年,日本TaiyoYuden公司利用有机染料成功地研制出CD-R可记录光碟。1990年, Sony公司发布了《橙皮书》,成为第一个关于CD-R光碟规格的文件,是目前已被工业界广泛认可的标准,并相继推出MO磁光碟、CD-RW格式可刻录光碟的国际统一标准。

●独立冗余磁碟阵列(Redundant Array of Independent Disks,RAID):是为提高性能和可靠性,而将数据和用于纠错的讯息,分别存放于两个或多个硬碟驱动器的一种数据储存方式。磁碟阵列由阵列管理软件和控制纠错的磁碟控制器管理。RAID通常用于网络伺服器。

第四代:USB闪存到DVD光碟

●USB闪存:最近红火起来的USB闪存或随身碟,已经成为现今流动储存市场的主流产品。跟软盘相比起来,它的容量大、体积小、重量轻,容量一般在8MB至1GB之间,相当于6至800张磁碟。USB闪存采用晶片储存,使用寿命一般为擦写100万次以上,数据更可保存长达10年之久。

●DVD光碟:历史上第一张DVD-R诞生于1997年秋,这种早期的DVD-R的容量为3.95GB。随后单层单面的DVD-R的容量提升到了4.7GB,至今才真正流行起来。其英文全名是Digital Video Disk,利用MPEG2的压缩技术来储存影像,可以满足人们对大储存容量和高性能的储存媒介的需求。

下一代:全像储存到纳米技术

●全像储存技术(Holographic Storage):一台使用全息储存技术的设备,可以在一块致密介质上,储存数百GB或更多的数据,在数据传输大小为1百万位的情况下达到每秒数百MB的传输速度。

●“千足虫”纳米存储技术:“千足虫”Millipede是由IBM开发的纳米存储原型,它能以每平方寸万亿比特的存储密度进行数据存储:是现在使用的各种磁存储介质的20倍。Millipede被看作是19世纪兴起的穿孔卡片数据处理技术的纳米技术版本。

电脑储存计算单位

●最小单位Bit(位元)

●Byte(位元组)

1 byte=8 bits

●Kilobyte,KB(千位元组)

2的10次方个位元组

1KB=1024bytes

●Megabyte,MB(百万位元组)

2的20次方个位元组

1MB=1024KB

●Gigabyte,GB(十亿位元组)

2的30次方个位元组

1GB=1024MB

●Terabyte,TB(一兆位元组)

2的40次方个位元组

1TB=1024GB

●Petabyte,PB(一千兆位元组)

2的50次方个位元组

1PB=1024TB

●Exabyte,EB(一百万兆位元组)

2的60次方个位元组

1EB=1024PB

储存越成熟越网络化

亚太区IDC副总裁格拉汉指出,在过去10年,最大的机会是成功推介了网络储存,以取代之前的直接连接的储存。网络储存已经克服过去困扰着IT经理的不少难题,它也成为了明日储存方案的基础。

他说,据调查数据显示,2004年大马的外部磁碟储存系统市场总值6千530万美元。2005年的总值大约一样,是6千540万美元。不过以储存容量Terabyte(TB)来计算的话,则激增36.5%,至4千929TB。

格拉汉是出席亚庇惠普StorageWorks.06大会后,飞返澳洲时接受本报《资讯网》记者电邮访问时,如是表示。

他解释说,TB增加,营业额却涨幅不大的原因是:市场大卖的,是低档阵列和模块,以及中档的磁碟储存系统。另外他也观察到,ATA磁碟被增加引入此系统。

他说,最活跃的市场还是金融界和电讯业,不过他也看到其他领域也在增加使用网络储存方案。

“这个发展趋势将继续在今年上演。”他也提醒人们注意数据归档备份、iSCSI实现、分行对中央数据中心的连接等领域。

他说,IDC预测储存管理,包括更好的用户读取管理,各种储存装置的管理,以及数据的管理,将会是2006年各大企业和组织的最大挑战。

“总的来说,储存市场是迈向更加成熟,和更加网络化的。”格拉汉说。

企业储存百家争鸣

储存网络自2004年开始进入了快速发展的阶段,这是基于中小型企业用户对于比较简化和经济的储存需求渐渐提高,而大型企业则对一个开放、稳健又安全的高性能储存网络的需求也进一步提高。

提及网络储存,不得不谈两大阵营的网络连接储存(Network Attached Storage,NAS)和储存区域网络(Storage Area Network,SAN)。

NAS是在1980年代末开始出现,而SAN则等到90年代才出现和有了光纤管道(Fibre Channel,FC)SAN。90年代末,NAS也引入了SAN的概念,则推出了互联网协定(Internet Protocol,IP)SAN。

进入本世纪初,NAS和SAN就展开了纠缠不清的混战。不过,它们实际上是互补性。SAN是以数据为中心的,而NAS是以网络为中心的,SAN具有高频宽块状数据传输的优势,而NAS则更加适合文件系统级别上的数据访问。

用户可以部署SAN运行数据库和备份等关键应用,以集中存取与管理数据,而NAS则支持若干客户端之间或者伺服器与客户端之间的文件共享,所以用户可使用NAS作为日常办公中需要经常交换小文件的地方,比如文件伺服器、储存网页等。

毫无疑问的,储存虚拟化仍然是最受到瞩目的课题。储存虚拟化是贯穿整个资讯工艺环境,用以简化原本可能是复杂的底层基础架构的科技。

它将资源的逻辑映像与物理储存分开,然后为系统和管理员提供一幅已经简化的资源虚拟视图。在去年,各大储存厂商,如EMC、IBM、惠普、NetApp和Veritas等,都相继推出应用虚拟储存技术的产品,所针对的应用从数据归档、卷管理、磁带虚拟,一直到远程备份,涵盖了数据储存的各种领域。

惠普:磁带还不会被淘汰

惠普(HP)给你印象是什么?打印机或个人电脑品牌?其实除了硬体周边产品之外, 这家电脑公司还从事软件业的储存方案。

作为世界知名的储存商,惠普今年2月20日至22日于沙巴亚庇举行别开生面的StorageWorks.06储存大会,并邀请了400名来自亚太区域的企业客户和媒体齐集一堂,一起来探讨储存技术的最新趋势。

各国媒体均派记采访此次区域性大会,但我国只有两家媒体出席这项盛会,而本报《资讯网》是唯一受邀的中文科技媒体。

惠普高级副总裁柏舒华茨在StorageWorks.06大会上掀开了该公司最新的储存策略,并以软件的加值和解决方案的应用作为重点。这也跟以往惠普比较多谈硬体的情况,有所不同。

柏舒华茨说,根据客户对惠普研究给予的意见回馈,客户主要担心的有四项课题:37%的客户关心融合问题、26%关心数据管理问题、17%关心持续性和可用性的问题和顺从的课题(28%)。

不过,他表示,研究报告显示,客户很多的成本还是去了营运的部份,这就占了75%至80%,这只剩下很少的预算,作为革新的用途,而这方面正好是确保公司成长的重要投资。

他也说,磁带的技术在现阶段还不会被淘汰,至少他看到的,是还有一条很长的路途。

惠普ILM部副总裁法朗哈尔比斯则肯定ILM在企业资讯工艺整合中所扮演的重要角色。他说,资讯的管理从取得、管理、保存到传递,每个过程都很重要,企业必须严格遵守这4个步骤的流程。

他也指出,如果能够在ILM的过程中,强化四个步骤的资讯管理,就能达到最大的效益。

大马惠普储存方案经理周永来说,本地市场对储存数据的需求,主要是用于依法必须储存数据长达数年的需求。

他说磁带的可靠性和能力,都得到了证明,最好的例子是1个磁带可以收录相等于80张DVD光碟的容量。

他披露,医药界和保险业将是该公司的最大储存客户来源,因为这些领域对储存的需求很大。资讯生命周期管理——ILM

企业界资料归档另一个重要的储存字眼——资讯生命周期管理(ILM)。

所谓的ILM,是管理资料的整体生命周期,亦即管理从抓取、创造、保留、备份、到销毁资料的整个过程,并依据资料的存取频繁度或新旧,将资料搬到合适的储存媒体。

今天,我们一天之内可以处理上百封电邮,而在这些电邮之中,有的资讯价值是不断的增加,有的却是不断的减少,有的必须保存下来作为法律调查的一部份,有的大可在下个月就删除。

ILM的出现,就是为了如何为不同的资讯,提供不同级别的可存取性和保护,也就是说,根据企业的管理策略,对数据的创建、保护、访问、迁移、归档乃至资讯的销毁、空间的回收的全过程,实施合理有效的规划。

在ILM的分层次的网络储存中,2003年开始出现的iSCSI,有其相应的地位,它使ILM更全面、更完整。其实从ILM战略看,包括光纤管道FC和iSCSI在内的各种储存技术各自扮演重要的角色。

若从技术角度来看,FC和iSCSI之间不是谁要替代谁的关系,而是给用户提供更多的选择。在FC和iSCSI之间,可能某个阶段iSCSI的发展速度会快于FC,但这并不能说明iSCSI将替代FC,它们各有所长,在一定时间内会共存,因为它们满足了用户的不同需求。

FC SAN由于起步较早,所以它目前的市占率也较大,在企业的网络储存系统中应用较广。而iSCSI作为一种新的技术,所构建的IP SAN正呈现出高速发展的势头。

3成整合注定失败

亚太区Gartner副总裁菲沙程指出,现在的资讯是迈向越来越复杂的方向前进,因此融合成为了一个迫切需要解决的方案。

为什么要融合?菲沙程表示,融合是为了要减少复杂程度、加强系统管理和促进服务水平。

他指出,不管是软件还是硬体,因为设备不断的增加和变成复杂,企业的架构也越来越难以管理得好,资讯工艺整合变成了当务之急。

他说,据调查结果显示,75%的资讯工艺整合可以有效的提高投资报酬率,不过他也预见,在今年将有35%的整合案件,因为缺乏事前评估而以失败告终。

此外,据IDC数据显示,去年大马外部磁碟储存系统的市占率中,惠普高居榜首。这项外部磁碟储存系统市占率排行榜分别是惠普(35.5%)、IBM(23.3%)、EMC(12.3%)和其他(29.2%)。

看到我@@