服務(wù)器內(nèi)存也是內(nèi)存(RAM),它與普通PC(個(gè)人電腦)機(jī)內(nèi)存在外觀和結(jié)構(gòu)上沒有什么明顯實(shí)質(zhì)性的區(qū)別,主要是在內(nèi)存上引入了一些新的特有的技術(shù),如ECC、ChipKill、熱插拔技術(shù)等,具有極高的穩(wěn)定性和糾錯(cuò)性能。 服務(wù)器內(nèi)存主要技術(shù): (1)ECC 在普通的內(nèi)存上,常常使用一種技術(shù),即Parity,同位檢查碼(Parity check codes)被廣泛地使用在偵錯(cuò)碼(error detectioncodes)上,它們?cè)黾右粋(gè)檢查位給每個(gè)資料的字元(或字節(jié)),并且能夠偵測(cè)到一個(gè)字符中所有奇(偶)同位的錯(cuò)誤,但Parity有一個(gè)缺點(diǎn),當(dāng)計(jì)算機(jī)查到某個(gè)Byte有錯(cuò)誤時(shí),并不能確定錯(cuò)誤在哪一個(gè)位,也就無法修正錯(cuò)誤;谏鲜銮闆r,產(chǎn)生了一種新的內(nèi)存糾錯(cuò)技術(shù),那就是ECC,ECC本身并不是一種內(nèi)存型號(hào),也不是一種內(nèi)存專用技術(shù),它是一種廣泛應(yīng)用于各種領(lǐng)域的計(jì)算機(jī)指令中,是一種指令糾錯(cuò)技術(shù)。ECC的英文全稱是“ Error Checking and Correcting”,對(duì)應(yīng)的中文名稱就叫做“錯(cuò)誤檢查和糾正”,從這個(gè)名稱我們就可以看出它的主要功能就是“發(fā)現(xiàn)并糾正錯(cuò)誤”,它比奇偶校正技術(shù)更先進(jìn)的方面主要在于它不僅能發(fā)現(xiàn)錯(cuò)誤,而且能糾正這些錯(cuò)誤,這些錯(cuò)誤糾正之后計(jì)算機(jī)才能正確執(zhí)行下面的任務(wù),確保服務(wù)器的正常運(yùn)行。之所以說它并不是一種內(nèi)存型號(hào),那是因?yàn)椴⒉皇且环N影響內(nèi)存結(jié)構(gòu)和存儲(chǔ)速度的技術(shù),它可以應(yīng)用到不同的內(nèi)存類型之中,就象前講到的“奇偶校正”內(nèi)存,它也不是一種內(nèi)存,最開始應(yīng)用這種技術(shù)的是EDO內(nèi)存,現(xiàn)在的SD也有應(yīng)用,而ECC內(nèi)存主要是從SD內(nèi)存開始得到廣泛應(yīng)用,而新的DDR、RDRAM也有相應(yīng)的應(yīng)用,目前主流的ECC內(nèi)存其實(shí)是一種SD內(nèi)存。 (2)Chipkill Chipkill技術(shù)是IBM公司為了解決目前服務(wù)器內(nèi)存中ECC技術(shù)的不足而開發(fā)的,是一種新的ECC內(nèi)存保護(hù)標(biāo)準(zhǔn)。我們知道ECC內(nèi)存只能同時(shí)檢測(cè)和糾正單一比特錯(cuò)誤,但如果同時(shí)檢測(cè)出兩個(gè)以上比特的數(shù)據(jù)有錯(cuò)誤,則一般無能為力。目前ECC技術(shù)之所以在服務(wù)器內(nèi)存中廣泛采用,一則是因?yàn)樵谶@以前其它新的內(nèi)存技術(shù)還不成熟,再則在目前的服務(wù)器中系統(tǒng)速度還是很高,在這種頻率上一般來說同時(shí)出現(xiàn)多比特錯(cuò)誤的現(xiàn)象很少發(fā)生,正因?yàn)檫@樣才使得ECC技術(shù)得到了充分地認(rèn)可和應(yīng)用,使得ECC內(nèi)存技術(shù)成為幾乎所有服務(wù)器上的內(nèi)存標(biāo)準(zhǔn)。 但隨著基于Intel處理器架構(gòu)的服務(wù)器的CPU性能在以幾何級(jí)的倍數(shù)提高,而硬盤驅(qū)動(dòng)器的性能同期只提高了少數(shù)的倍數(shù),因此為了獲得足夠的性能,服務(wù)器需要大量的內(nèi)存來臨時(shí)保存CPU上需要讀取的數(shù)據(jù),這樣大的數(shù)據(jù)訪問量就導(dǎo)致單一內(nèi)存芯片上每次訪問時(shí)通常要提供4(32位)或8(64位)比特以上的數(shù)據(jù),一次性讀取這么多數(shù)據(jù),出現(xiàn)多位數(shù)據(jù)錯(cuò)誤的可能性會(huì)大大地提高,而ECC又不能糾正雙比特以上的錯(cuò)誤,這樣就很可能造成全部比特?cái)?shù)據(jù)的丟失,系統(tǒng)就很快崩潰了。IBM的Chipkill技術(shù)是利用內(nèi)存的子結(jié)構(gòu)方法來解決這一難題。內(nèi)存子系統(tǒng)的設(shè)計(jì)原理是這樣的,單一芯片,無論數(shù)據(jù)寬度是多少,只對(duì)于一個(gè)給定的ECC識(shí)別碼,它的影響最多為一比特。舉個(gè)例子來說明的就是,如果使用4比特寬的DRAM,4比特中的每一位的奇偶性將分別組成不同的ECC識(shí)別碼,這個(gè)ECC識(shí)別碼是用單獨(dú)一個(gè)數(shù)據(jù)位來保存的,也就是說保存在不同的內(nèi)存空間地址。因此,即使整個(gè)內(nèi)存芯片出了故障,每個(gè)ECC識(shí)別碼也將最多出現(xiàn)一比特壞數(shù)據(jù),而這種情況完全可以通過ECC邏輯修復(fù),從而保證內(nèi)存子系統(tǒng)的容錯(cuò)性,保證了服務(wù)器在出現(xiàn)故障時(shí),有強(qiáng)大的自我恢復(fù)能力。采用這種內(nèi)存技術(shù)的內(nèi)存可以同時(shí)檢查并修復(fù)4個(gè)錯(cuò)誤數(shù)據(jù)位,服務(wù)器的可靠性和穩(wěn)定得到了更加充分的保障。 (3)Register Register即寄存器或目錄寄存器,在內(nèi)存上的作用我們可以把它理解成書的目錄,有了它,當(dāng)內(nèi)存接到讀寫指令時(shí),會(huì)先檢索此目錄,然后再進(jìn)行讀寫操作,這將大大提高服務(wù)器內(nèi)存工作效率。帶有Register的內(nèi)存一定帶Buffer(緩沖),并且目前能見到的Register內(nèi)存也都具有ECC功能,其主要應(yīng)用在中高端服務(wù)器及圖形工作站上,如IBM Netfinity 5000。 (4)FB-DIMM FB-DIMM(Fully Buffered-DIMM,全緩沖內(nèi)存模組)是Intel在DDR2、DDR3的基礎(chǔ)上發(fā)展出來的一種新型內(nèi)存模組與互聯(lián)架構(gòu),既可以搭配現(xiàn)在的DDR2內(nèi)存芯片,也可以搭配未來的DDR3內(nèi)存芯片。FB-DIMM可以極大地提升系統(tǒng)內(nèi)存帶寬并且極大地增加內(nèi)存最大容量。 FB-DIMM技術(shù)是Intel為了解決內(nèi)存性能對(duì)系統(tǒng)整體性能的制約而發(fā)展出來的,在現(xiàn)有技術(shù)基礎(chǔ)上實(shí)現(xiàn)了跨越式的性能提升,同時(shí)成本也相對(duì)低廉。在整個(gè)計(jì)算機(jī)系統(tǒng)中,內(nèi)存可謂是決定整機(jī)性能的關(guān)鍵因素,光有快的CPU,沒有好的內(nèi)存系統(tǒng)與之配合,CPU性能再優(yōu)秀也無從發(fā)揮。這種情況是由計(jì)算機(jī)原理所決定的,CPU在運(yùn)算時(shí)所需要的數(shù)據(jù)都是從內(nèi)存中獲取,如果內(nèi)存系統(tǒng)無法及時(shí)給CPU供應(yīng)數(shù)據(jù),CPU不得不長(zhǎng)時(shí)間處在一種等待狀態(tài),硬件資源閑置,性能自然無從發(fā)揮。對(duì)于普通的個(gè)人電腦來說,由于是單處理器系統(tǒng),目前的內(nèi)存帶寬已經(jīng)能滿足其性能需求;而對(duì)于多路的服務(wù)器來說,由于是多處理器系統(tǒng),其對(duì)內(nèi)存帶寬和內(nèi)存容量是極度渴求的,傳統(tǒng)的內(nèi)存技術(shù)已經(jīng)無法滿足其需求了。這是因?yàn)槟壳暗钠胀―IMM采用的是一種“短線連接”(Stub-bus)的拓?fù)浣Y(jié)構(gòu),這種結(jié)構(gòu)中,每個(gè)芯片與內(nèi)存控制器的數(shù)據(jù)總線都有一個(gè)短小的線路相連,這樣會(huì)造成電阻抗的不繼續(xù)性,從而影響信號(hào)的穩(wěn)定與完整,頻率越高或芯片數(shù)據(jù)越多,影響也就越大。雖然Rambus公司所推出的的XDR內(nèi)存等新型內(nèi)存技術(shù)具有極高的性能,但是卻存在著成本太高的問題,從而使其得不到普及。而FB-DIMM技術(shù)的出現(xiàn)就較好的解決了這個(gè)問題,既能提供更大的內(nèi)存容量和較理想的內(nèi)存帶寬,也能保持相對(duì)低廉的成本。FB-DIMM與XDR相比較,雖然性能不及全新架構(gòu)的XDR,但成本卻比XDR要低廉得多。 與現(xiàn)有的普通DDR2內(nèi)存相比,F(xiàn)B-DIMM技術(shù)具有極大的優(yōu)勢(shì):在內(nèi)存頻率相同的情況下目前能提供四倍于普通內(nèi)存的帶寬,并且能支持的最大內(nèi)存容量也達(dá)到了普通內(nèi)存的24倍,系統(tǒng)最大能支持192GB內(nèi)存。FB-DIMM最大的特點(diǎn)就是采用已有的DDR2內(nèi)存芯片(以后還將采用DDR3內(nèi)存芯片),但它借助內(nèi)存PCB上的一個(gè)緩沖芯片AMB(Advanced Memory Buffer,高級(jí)內(nèi)存緩沖)將并行數(shù)據(jù)轉(zhuǎn)換為串行數(shù)據(jù)流,并經(jīng)由類似PCI Express的點(diǎn)對(duì)點(diǎn)高速串行總線將數(shù)據(jù)傳輸給處理器。 與普通的DIMM模塊技術(shù)相比,F(xiàn)B-DIMM與內(nèi)存控制器之間的數(shù)據(jù)與命令傳輸不再是傳統(tǒng)設(shè)計(jì)的并行線路,而采用了類似于PCI-Express的串行接口多路并聯(lián)的設(shè)計(jì),以串行的方式進(jìn)行數(shù)據(jù)傳輸。在這種新型架構(gòu)中,每個(gè)DIMM上的緩沖區(qū)是互相串聯(lián)的,之間是點(diǎn)對(duì)點(diǎn)的連接方式,數(shù)據(jù)會(huì)在經(jīng)過第一個(gè)緩沖區(qū)后傳向下一個(gè)緩沖區(qū),這樣,第一個(gè)緩沖區(qū)和內(nèi)存控制器之間的連接阻抗就能始終保持穩(wěn)定,從而有助于容量與頻率的提升。 服務(wù)器內(nèi)存典型類型 目前服務(wù)器常用的內(nèi)存有SDRAM和DDR,DDR2三種內(nèi)存。 (1)SDRAM (2)DDR SDRAM (3)DDR2 SDRAM 由于服務(wù)器內(nèi)存在各種技術(shù)上相對(duì)兼容機(jī)來說要嚴(yán)格得多,它強(qiáng)調(diào)的不僅是內(nèi)存的速度,而是它的內(nèi)在糾錯(cuò)技術(shù)能力和穩(wěn)定性。所以在外頻上目前來說只能是緊跟兼容機(jī)或普通臺(tái)式內(nèi)存之后。目前臺(tái)式機(jī)的外頻一般來說已到了150MHz以上的時(shí)代,但133外頻仍是主流。而服務(wù)器由于受到整個(gè)配件外頻和高穩(wěn)定性的要求制約,主流外頻還是100MHz,但133MHz外頻已逐步在各檔次服務(wù)器中推行,在選購(gòu)服務(wù)器時(shí)當(dāng)然最好選擇133MHz外頻的了!內(nèi)存、其它配件也一樣,要盡量同步進(jìn)行,否則就會(huì)影響整個(gè)服務(wù)器的性能。目前主要的服務(wù)器內(nèi)存品牌主要有Kingmax、kinghorse、現(xiàn)代、三星、kingstone、IBM、VIKING、NEC等,但主要以前面幾種在市面上較為常見,而且質(zhì)量也能得到較好的保障。
|