Deduplikacija – osnovni pojmovi

Deduplikacija, kao ideja, nije nova ali se tek u skorije vreme u IT tehnologijama pojavljuje kao funkcionalno rešenje. Ideja je u tome da se podaci koji su slični tj. jako malo se razlikuju, ne snimaju na storage sistemu više puta, tako što će sve ono što je isto biti snimljeno samo jednom čime se eliminišu duplikati.

FILE-BASED  DEDUPLICATION

Najjednostavniji primeri deduplikacije se sreću već u osnovnim funkcijama operativnih sistema. Na primer “soft link” je primer deduplikacije, jer umesto da kopiramo isti fajl više puta u razlićite direktorijume, možemo snimiti samo jedan primerak a na ostalim lokacijama postaviti linkove koji zauzimaju samo onoliko prostora koliko je potrebno za “soft link” a funkcionišu isto kao da smo iskopirali ceo fajl. Problem u ovom pristupu su dozvole i vlasništvo nad fajlovima koji su isti kako za osnovni fajl tako i za sve linkove.

Naprednija vrsta deduplikacije je na nivou file sistema. Na primer “unionfs” pruža mogućnost deduplikacije celih direktorijuma tako što kreira više virtuelnih kopija direktorijuma koji želimo da dedupliciramo. Virtuelni direktorijumi su medjusobno nezavisni. Modifikacije fajlova i novi fajlovi se snimaju odvojeno u virtuelnim direktorijumima i dozvole i vlasništvo nad fajlovima se takodje snimaju odvojeno čime se postiže poptuna nezavisnost virtuelnih direktorijuma. Mana ovog pristupa je jedino u nešto složenijoj administraciji a glavno ograničenje je u tome što je ograničena na nivo direktorijuma tj. ne možete deduplicirati celu hard disk particiju, iSCSI lun itd. Proizvodjači storagea koji koriste slične file sisteme nude mogućnost  file-based deduplikacije u svojim proizvodima.

Generalno file-based deduplikacija je napredna tehnologija ali ima i  nedostataka. Na primer, ako imate dva direktorijuma od po 500GB i u njima par hiljada fajlova od kojih se samo nekoliko fajlova od po par MB razlikuju, onda ćete uz pomoć deduplikacije, na storage-u zauzeti ukupno 500GB plus par MB, koliko zazimaju fajlovi koji se razlikuju. Sa druge strane, ako imate dva ISO image fajla koji se takodje razlikuju u samo par fajlova, zauzeće na storage-u će biti 2x500GB=1TB jer file-based deduplikacija “ne vidi” unutar ISO fajlova već ih smatra različitim i stoga ih posebno snima na disku. Da li postoji rešenje za ovaj problem? Na sreću postoji i objašnjeno je u sledećem pasusu.

BLOCK-BASED DEDUPLICATION

Kao što sam naziv govori, radi se o deduplikaciji na nivou bloka hard diska. Ako posmatramo opet primer sa dva ISO image fajla, uz pomoć deduplikacije na nivou bloka, zauzeće na storage-u će opet biti 500GB plus par MB jer će storage odvojeno snimiti samo one blokove koji se razlikuju unutar fajlova. Znači “rezoulicija” deduplikacije je mnogo veća. Postoji još jedna prednost ovog načina deduplikacije koja je jako bitna za virtuelne servere. Na primer, ako na storage-u imate snimljeno više image-a virtuelnih servera od po 100GB, standardna pretpostacka je da ćete uz pomoć deduplikacije na storage-u zauzeti oko 100GB plus razlika u fajlovima na pojedinačnim serverima. Medjutim, pošto svaki server neće koristiti svih 100GB odnosno za osnovni sistem je potrebno, recimo 10GB a ostalo je slobodan prostor, deduplikacija na nivou bloka će i taj prazan prostor deduplicirati i ukupno ćete zauzeti samo 10GB plus razlika u fajlovima. Znači, block-based deduplikacija “vidi” unutar samih fajlova duple blokove i eliminiše ih. Ova funkcionalnost pruža mogućnost jako brzog kloniranja virtuelnih servera (provisioning) jer ako kopirate fajl koji ima 100GB a od toga je samo 10GB zauzeto a ostalo je prazan prostor (nule) storage-u će biti potrebno samo onoliko vremena koliko je potrebno da klonira 10GB a dobićete fajl od 100GB. Ova tehnologija je sve više zastupljena kod storage rešenja a glavna mana je u tome što se ne može dešavati u realnom vremenu već se pokreće kao poseban proces na storage-u. Proizvodjač storage-a koji je otišao najdalje u ovoj tehnologiji je NetApp. Jedino NetApp storage sistemi mogu da pokrenu proces block-based deuplikaciju na online podacima tj. možete koristi podatke u read-write režimu dok se u pozadini dešava deduplikacija, za razliku od ostalih proizvodjača koji ovu vrstu deduplikacije nude samo na offline podacima tj. backup podacima. Deduplikacija, kloniranje i instant provisioning na NetApp sistemima će biti objašnjeni u posebnom tekstu. Druga mana block-based deduplikacije i kao i svih drugih vrsta deduplikacije  je to što je ograničena na odredjene oblasti primene tj. nije efikasna sa kriptovanim podacima iz razloga što tada svi blokovi imaju različit sadržaj, i sa kompresovanim podacima jer ako kompresujete dva slična fajla, čak i na nivou bloka je za deduplikaciju to skoro isto kao i da ste ih kriptovali. Najveći procenat deduplikacije je postigao NetApp, prema čijim podacima se može postići da efektivno imate 22TB podataka dedupliciranih na svega 6TB odnosno 1:3.66 i pri tome se radi o online podacima.

RAM DEDUPLICATION

Najnovija ideja prozvodjča hypervisor-a za virtuelne servere je da se deduplicira sadržaj radne memorije. Ideja je u tome da ako na jednom realnom serveru imate više virtuelnih servera koji koriste istu verziju operativnog sistema, onda deduplikacija treba da obezbedi uštedu RAM memorije tako što će jezgro (kernel) i run-time biblioteke (.so na linuxu, .dll na windowsu …) upisati u RAM samo jednom a omogućiti korišćenje od strane više virtuelnih servera. Pošto je ova ideja još uvek u razvoju, ne znamo koje su prednosti, mane, ograničenja i sigurnosni rizici a prozvodjač koji je prvi najavio ovu tehnologiju je VmWare. Ako uspe u tome, ostali prozvodjači će ga nesumnjivo slediti.

Zaključak za kraj ovog teksta: Deduplikacija ulazi u sve slojeve IT tehnologija gde se virutelizacija toliko dugo primenjuje da je postala standard. (virtual servers, virtual sotrage, virtual memory…)

STORAGE – DEMISTIFIKACIJA – Osnovni pojmovi

 

Prema definiciji, storage predstavlja mrežni uredjaj namenjen pouzdanom, sigurnom, brzom i efikasnom skladištenju kompanijskih podataka.

 

 

Storage – osnove

 

Bilo da se radi o lokalnom DAS ili mrežnom NAS ili SAN okruženju u kome se storage može naći, u teoriji, uvek se radi o prenosu podataka sa ili na diskove na ovaj ili onaj način, preko ovog ili onog fizičkog medijuma. Za razliku od servera čiji je glavni zadatak da brzo i efikasno obradi zahteve korisnika što od njega zahteva neka od aplikacija, skladištenje je proces koji treba prepustiti za to projektovanim i optimizovanim savremenim storage uredjajima. Prosto, to je nešto što oni najbolje rade. Zbog toga je uvodjenje fleksibilnog i lako proširivog mrežnog uredjaja kakav je storage mnogo efikasniji način za rešenje problema skladištenja i čuvanja podataka.

 

 

Zašto NE server?

 

Glavni razlozi za izbegavanje servera za potrebe skladištenja leže u sledećem:

 

  1. Njemu su diskovi nužno zlo („usko grlo“), jer predstavljaju jedine komponente u procesu obrade podataka koje koriste mehaničke sklopove u svom radu (time nikad ne postižu brzinu ostalih komponenti kao što su procesor i virtualna memorija)
  2. Generički operativni sistemi koji su predvidjeni za rad na serveru (Windows, UNIX, Linux) nisu dizajnirani sa ciljem zadovoljenja brzog i efikasnog skladištenja podataka već za potrebe brzog procesuiranja rada aplikacija koje se na serveru izvršavaju
  3. Fizičke mogućnosti servera za skladištenjem su ograničene obzirom na veličinu kućišta od koga je sazdan
  4. Jer troši dragocene resurse na komuniciranje sa diskovima
  5. Jer ne može efikasno i blagovremeno da pravi kopije sistema sa ciljem čuvanja podataka u dužem vremenskom periodu
  6. Jer ne može da ustupi svoj neiskorišćen skladišni prostor drugom serveru kome je neophodan
  7. Jer se ne isplati da se u svaki server (na svaka dva diska) ubaci bar još jedan ili dva u cilju očuvanja integriteta podataka (minimum kod RAID 1 ili RAID 5 implementacije)
  8. Jer kada na njemu radite backup on mora da bude isključen ili mu se performanse drastično smanjuju.

 

Sve u svemu, server treba da poseduje diskove samo ako MORA!

 

 

 

DAS

 

Po pitanju povećanja potrebnog kapaciteta za skladištenje podataka, prvo rešenje nosilo je ime DAS (Direct Attached Storage). Nažalost, i dalje se koristi.

 

 

Šta je DAS predstavljao?

 

DAS nije ništa drugo nego, preko posebno dizajnirane kartice za proširenje servera, povezano „brdo“ diskova, popularno JBOD (Just Bunch Of Disks). Veza se u većini slučajeva ostvaruje putem običnog SCSI kabla ograničene dužine.

Iako je to rešilo problem fizičke proširivosti servera diskovima, ujedno je povećalo troškove skladištenja, mnogostruko. Ako razmislite, investirati u kućište koje prima 10 ili više diskova, a u datom trenutku vam treba 1 ili 2 diska , prilično je „sumnljiva“ investicija sa finansijske tačke gledišta.

 slika1Na slici iznad je primer tipične DAS arhitekture. U ovom slučaju server je preko ethernet porta vezan na kompanijsku mrežu, dok je na storage vezan preko SCSI kartice/proširenja. Na samom storage-u uglavnom se nalazi onboard SCSI port.

 

Da problem bude veći, DAS je pružao uslugu skladištenja samo serveru na koji je bio direktno vezan. Najnovije implementacije DAS rešenja otišla su u pravcu direktnog povezivanja 2 do maksimalno 4 servera, ali ta rešenja i dalje predstavljaju lokalne solucije a skladišni prostor je i dalje na fizičkom nivou dodeljen serverima (2 diska jednom, 3 drugom serveru, itd.) što investiranje u ovaj vid rešenja čini neisplativim čak i u kraćem vremenskom periodu.

 

NAS i SAN

 

Novija i trenutno aktuelna rešenja namenjenu skladištenju podataka mrežnog su tipa. Mrežni u ovom slučaju ne znači da se bukvalno ubacuju kao još jedan element vec više asocira na činjenicu da mu se može direktno pristupiti sa mreže (NAS) ali i da sa serverima može formirati zasebnu mrežu preko koje serveri dinamički alociraju resurse iz storage pool-a.

 

Postoje dve vrste arhitekture i njima pripadajući protokoli koji se koriste pri opisu “mrežnog okruženja” u kome se storage može naći. To su NAS i SAN. Razlika koja postoji sastoji se u tome što je pristup skladišnom prostoru u NAS slučaju na file nivou, sto znači da je storage taj koji brine o tome gde i kako su podaci organizovani (što ujedno znači da storage čuva tabelu file sistema) dok u SAN okruženju taj posao preuzima server (host) a storage je tu samo kao uredjaj koji mu obezbedjuje blokove u koje server po svom nahodjenju i prema svojim pravilima smešta podatke (server je odgovoran za organizaciju podataka koje smešta). SAN implementacija podrazumeva da storage uredjaj nema baš puno  znanja o tome šta ti blokovi podataka koje upisuje server predstavljaju i kako su ti blokovi organizovani u okviru jednog dokumenta. (pod dokumentom se podrazumeva čak i baza podataka). 

 

Još jedna bitna razlika je u tome što u SAN okruženju storage-u server direktno pristupa u cilju obezbedjenja skladišnog prostora, dok je u NAS okruženju nebitno da li je host klijent ili server. Prostor na storage-u svako od njih vidi kao mapiran mrežni disk (network drive) odredjene veličine.

 

Primer prednosti korišćenja mrežnog storage uredjaja

 

Pretpostavimo da u kompanijskoj mrezi postoji nekoliko servera na kojima se nalazi po 2 produkciona diska. U slučaju da želimo da ti podaci budu dostupni u slučaju otkaza jednog od diskova, u server (ako je uopšte moguće) moramo da ugradimo nekakav RAID kontroler i nezavisno od  RAID nivoa koji koristimo, minimalno moramo dodati još jedan disk koji će imati ulogu paritetnog. Ako želimo da podaci povremeno budu bekapovani u cilju njihovog čuvanja u dužem vremenskom periodu (mesec dana), moraćemo da nabavimo ili CD/DVD rezač koji ćemo manuelno popunjavati podacima svakog dana) ili na samom serveru instalirati neki tape uredjaj. I dalje će bekap morati da se radi ručno…

 

U zavisnosti od količine podataka koje bekapujemo, vreme potrebno za bekap može da bude izuzetno dugo, nekada čak duže od vremena u kome server može da bude offline. U slučaju da serveri moraju konstantno da budu uključeni i procesuiraju zahteve klijenata, ovaj vid backup-a biće poprilično nezgodan, nekada čak i nemoguć zbog vremena i resursa koji moraju biti utrošeni na izvršenje ovog zadatka.

 

U slučaju korišćenja mrežnog storage uredjaja, postoji nekoliko krucijalnih prednosti. Prvo, virtualizacijom skladišnog prostora, svaki od servera koristiće samo onu količinu prostora koja mu je neophodna, ostavljajući preostali prostor na diskovima u storage pool-u dostupan serverima ili klijentima kojima je potrebniji u tom trenutku. Na taj način, centralizuje se skladišni prostor i koristi najoptimalnije moguće.

 

Drugo, RAID grupa koja omogućava isti ili bolji nivo zaštite, zbog centralizacije prostora, zahteva mnogo manji broj paritetnih diskova obezbedjujući dostupnost podataka većem broju servera. Bekap podataka vrši se centralizovano.

 

 

Šta je NAS?

        

NAS arhitektura predstavlja mrežno rešenje u kome je storage direktno (preko postojećeg ethernet sviča) vezan u kompanijsku Ethernet mrežu, na taj način obezbedjujuci resurse svim klijentima koji se u toj mreži nalaze, nezavisno od toga da li se radi o Windows baziranim radnim stanicama (CIFS) ili stanicama baziranim na Linux i UNIX platformi (NFS). Čak i uredjaj koji ima namenu servera (sa instaliranim serverskim OS-om) može ravnopravno pristupati storage-u i mapirati resurs u vidu mrežnog diska.

 

slika2Na slici iznad prikazana je NAS implementacija. Preko naojbičnijeg ethernet porta komponente na slici (serveri i radne stanice) vezani su na ethernet switch. Storage uredjaj, takodje, preko jednog od svojih ethernet portova. Hostovi (serveri i klijentske radne stanice) pristupaju storage-u kao da pristupaju najobičnijem file serveru.

 

Kao što je već pomenuto, koji od ta dva protokola ćete koristiti u cilju povezivanja storage-a sa host-ovima (klijentima i serverima) zavisi od operativnog sistema koji koristite na host-u. Ako koristite Windows platformu (od Windows 95 OS-a, pa do Windows Server 2008 i Vista platforme) koristićete CIFS. Ako pak, za pristup skladišnom prostoru na storage-u koristite UNIX i UNIX-like platformu (Linux, itd.), tačnije bilo koju verziju UNIX-a (jer sve imaju mogucnost korišćenja NFS protokola) koristićete isključivo NFS u verzijama 2,3 ili 4.

 

Primer : korišćenje CIFS protokola

 

Recimo da u kompanijskoj mreži postoje Windows bazirane radne stanice  i pretpostavimo da je svakoj od njih potreban skladišni prostor koji ce moći izuzetno lako da se proširi u slučaju potrebe i na kome će podaci biti sigurno i pouzdano uskladišteni, čak i u slučaju kompletnog otkaza radne stanice na koju je disk mapiran.

 

Korisnik će u ovom (NAS) slučaju direktno mapirati resurs (u ovom slučaju kao mrežni disk) sa postojećeg storage uredjaja i na njemu čuvati sve podatke koje generiše i koji su mu bitni. To može biti Word dokument, AutoCad ili Photoshop crtež, itd. Ukratko. identičan sadržaj koji bi korisnik uskladištio na lokalnom hard disku, pri čemu je pristup podacima teorijski brži jer ne uključuje lokalne diskove.

 

 slika31

Šta je SAN?

 

SAN arhitektura predstavlja mrežno rešenje u kojoj storage direktno komunicira isključivo sa serverima (u najvećem broju slučajeva preko zasebne Ethernet ili Fibre Channel mreže) obezbedjujući im na taj način potrebne resurse namenjene skladištenju podataka. Ove resurse serveri vide kao lokalne diskove i nad njima se mogu vršiti sve operacije vezane za upravljanje lokalnim diskovima: formatiranje, particionisanje itd. U oba slučaja, bez obzira da li se koristila Fibre Channel ili Ethernet infrastruktura, radi se o prenošenju SCSI komandi preko medijuma različitog od SCSI kabla. Ali, filozofija prenosa podataka identična je kao i kod SCSI vezanog DAS rešenja.

 

 

slika4

Naravno, pod direktnim se smatra i mogućnost posrednog komuniciranja korišćenjem ethernet (iSCSI) ili Fibre Channel (FC) sviča.

 

Povezivanje servera sa storage uredjajem moguće je izvesti na dva načina.

 

Korišćenjem iSCSI protokola server se povezuje sa storage uredjajem putem najobičnijeg ethernet kabla (ili posredno preko ethernet sviča). iSCSI protokol predstavlja rešenje u kome se najobičnije SCSI komande po utvrdjenim pravilima pakuju u IP pakete, predstavljajući običan “payload” IP paketa i tako umotani bivaju prenešeni na Ethernet port storage-a koji dalje te pakete analizira, i nakon toga, kao SCSI komande sa odgovarajućim komandama šalje sistemu na dalju obradu i skladištenje. Ono što je u ovom slučaju još potrebno (da bi se SCSI komande spakovale na jednom i raspakovale na drugom kraju ethernet kabla) je poseban softver na oba uredjaja (ili posebne ethernet kartice sa potrebnom inteligencijom tzv. Ethernet HBA kartice). Na strani storage-a, softver je već implementiran, dok se na strani hosta (servera) to parče softvera naziva Software iSCSI Initiator. Ovde se pominje reč Initiator. U  SAN komunikaciji uredjaja, jedan od uredjaja je uvek INITIATOR (onaj koji inicira komunikaciju) dok je drugi TARGET (onaj koji odgovara na zahteve). Da ne bi bilo zabune, reći ćemo da identičan uredjaj, čak i port na njemu (na primer storage) u jednoj situaciji može biti u ulozi INITIATOR-a na jednom portu, a u drugoj TARGET-a, na tom istom portu.

Kada je storage port u ulozi INITIATOR-a? Kada se koristi za vezu sa diskovima (FC slučaj) ili sa backup serverom (iSCSI ili FC slučaj). Uloga TARGET-a je mnogo češća i tada prima zahteve od host-a (servera). Jedan port ne može istovremeno imati obe uloge.

 

slika51Na slici iznad vidi se izgled mreže u iSCSI implementaciji SAN okruženja. Storage je, preko sopstvenog Ethernet porta i Ethrnet switch-a logički vezan sa jednim UNIX i Windows serverom. Logički, jer resurse za oba servera obezbedjuje preko jednog fizičkog porta. Možete da primetite da (iako isti fizički medijum) server za vezu koristi dva porta (jedan za vezu sa storage-om drugi za vezu sa kompanijskim LAN-om) u cilju razgraničavanja saobraćaja i veće sigurnosti podataka koji se prenose.

 

Korišćenjem FC protokola, server se sa storage uredjajem povezuje putem posebnih (dodatnih) FC kartica koje se smeštaju u slobodne PCI slotove na serveru dok se na drugoj strani (na samom storage uredjaju) FC portovi nalaze onboard ili slično ugradjeni kao proširenja (PCI slotovi). Ovde je komunikacija prilično različita jer se radi o posebno dizajniranom protokolu za tu namenu.

slika6Na slici iznad vidi se FC SAN implementacija. Storage je u ovom slučaju preko posebnog FibreChannel switch-a vezan za servere koje opslužuje. Serveri za vezu sa switch-em koriste posebne FC HBA kartice, obično preko PCI slotova za proširenje. Sa druge strane, server je preko Ethernet infrastrukture vezan za ostatak kompanijske LAN mreže.

 

Na kraju, kada se sve sabere i oduzme i ovde se po precizno utvrdjenoj proceduri,  najobičnije SCSI komande prenose kao deo FC paketa (putem FC posebnog protokola) i predstavljaju njegov “payload”.

slika7

 

Na slici iznad se vidi da je All-in-one storage uredjaj u stanju da obezbedi istovremeni rad, (na istom uredjaju) oba protokola/arhitekture, i iSCSI i FC (IP SAN i FC SAN, respektivno).

 

Nezavisno od vrste protokola koji se u SAN okruženju koristi, server resurse sa storage-a “vidi” kao lokalne diskove i sa njima manipuliše na isti način kao da su lokalno smešteni u kućištu ili direktno vezani SCSI kablom za matičnu ploču.

 

U slučaju povezivanja putem iSCSI protokola (ponekad se ova arhitektura i IP SAN), trenutno dostupne brzine prenosa ne razlikuju se ni po čemu od klasičnih ethernet mreža pa je i najveća brzina prenosa 10Gbps.

 

U slučaju korišćenja FC protokola, na  raspolaganju su brzine od 1,2 i 4 Gbps. Maksimalna brzina koja je trenutno u opticaju je 8Gbps.

 

 

 

SAN BOOT

 

Posle osnovne priče o SAN okruženju ali i opterećenju koje server “trpi” kada mora direktno da upravlja diskovima, red je da pojasnimo ovaj termin. SAN boot pretpostavlja sistem u kome server nema diskova i butuje image operativnog sistema sa samog storage-a. Ovo ima višestruke prednosti. Prva je da storage mnogo bolje upravlja diskovima od servera. Druga je sigurnost podataka koju storage obezbedjuje po RAID grupii  u sastavu koje može biti sadržano mnogo više diskova i koja može biti korišćena za nekoliko servera. Backup podataka je lakši, čak i sistemskih dokumenata. Takodje, u slučaju korupcije sistemskog diska/particije, storage (sa diskova) boot-uje poslednje ispravno stanje sistema i na taj način skraćuje proces reinstalacije sistema i dostupnosti servera/sistema. Server bez diskova radi mnogo brže a na storage-u je da podatke koji su potrebni serveru dobavi ili uskladišti mnogo brže i efikasnije.

Osnovni pojmovi

VLAN – Virtual LAN

Grupa host-ova na mreži koja medjusobno komunicira u okviru istog broadcast domena bez obzira na fizičku lokaciju. VLAN ima iste osobine kao LAN ali dopušta da kranje radne stanice budu grupisane u isti broadcast domain i ako fizički nisu povezani na isti mrežni switch. (Re)konfiguracija mreže se vrši putem software-a a ne fizičkim prespajanjem kablova. Drugim rečima, VLAN tehnologija nam pruža mugćnost da u data-centru jednu istu kablovsku instalaciju koristimo u bilo kojoj logičkoj konfiguraciji koja se može menjati shodno potrebama. Druga mogućnost koja se pruža je korišćenje TRUNK moda na switch-evima i serverima za prenos informacija iz više VLAN-ova kroz isti mrežni kabl tj. ako želimo da spojimo dve lokacije na kojma imamo više logičkih LAN-ova, ne moramo da koristimo pojedinačni kabl za svaki LAN već možemo koristi VLAN-ove i samo jedan kabl ako mrežne portove postavimo u TRUNK režim rada.

VPS – Virtual Private Server (VDS – Virtual Dedicated Server ili Semi-Dedicated Server)

Koncept deljenja resursa fizičkog (realnog/HOST) servera na više logičkih (virtuelnih/GUEST) servera. Virtuelni serververi su medjusobno izolovani i pojedinačno su im dodeljeni odredjeni resursi odnosno prioriteti a pri tome svi koriste isti hardware. VPS može biti ostvaren na dva načina:

1. Full Virtualization – kada Virtuelni/Guest server nije svestan virtuelizacije i koristi klasične drivere za periferije. Preduslov je da CPU Host servera podržava virtuelizacionu tehnologiju (Intel-VT, AMD-V). Prednost je mogućnost virtualizovanja bilo kog operativnog sistema a mane su: lošiji monitoring i nemogućnost dinamičke rekonfiguracije resursa dodeljenih Guest serveru.

2. Paravirtualization – kada su i Host i Guest serveri svesni virtuelizacije i tada se koriste modifikovani driveri za periferije. Prednosti su: lakši monitoring i upravljanje, dinamičko dodeljivanje resursa i mogućnost migracije VPS-a sa jednog fizićkog servera na drugi bez prekida rada VPS-a. Mana je to što operativni sistem mora da koristi modifikovane drivere odnosno kernel, koji su svesni virtuelizacione tehnologije i obično operativni sistemi Host i Guest servra moraju biti srodni.

HYPERVISOR

Software koji omogućava virtuelizaciju realnog servera. Postoje dva kocepta hypervisora:

1. Hosted hypervisor koji se instalira kao dodatak već postojećem operativnom sistemu ( Xen, HyperV, VmWare server, VirtualBox, KVM, Qemu …). Prednosti su laka i brza instalacija i to što je podržan svaki hardware koji podržava Host operativni sistem. Kao glavna mana se navodi samo postojanje Host operativnog sistema kao posredničkog sloja izmedju hypervisor-a i hardware-a što može uticati i na bezbednost sistema jer je svaki Host OS podložan nekoj vrsti virusa, exploit-a i sličnih rizika.

2. Bare-Metal hypervisor koji se direktno instalira na realni server ( Virtual Iron, VmWare ESX/ESXi, Oracle VM…). Prednosti su bolje performanse i direktna komunikacija izmedju hypervisor-a i hardware-a i smanjeni sigurnosni rizici. Glavna mana je slabija podrška hardware-skih komponenti.

hosted vs bare metal

Počeci virtuelizacije

Virtuelizacija je vrlo širok pojam i ako bismo se ograničili samo na Internet tehnologije, možemo reći da postoji od samog početka. Zamislite situaciju u kojoj bi za svaki websajt bilo potrebno da postoji poseban serverski računar, kako bi to izgledalo? Od samog početka Interneta postoje virtuelni hostovi čijom primenom se postiže da jedan fizički web server može da opsluži više web sajtova i to na istoj IP adresi. Takodje ako bi bilo potrebno da za svaku IP adresu, računar poseduje poseban mrežni interfejs, takodje bismo bili ograničeni na par IP adresa po računaru a današnji web serveri mogu da imaju onoliko IP adresa, koliko im dozvoljava memorijski prostor za adresiranje tj. praktično neograničen broj.

Analogno web serveru i IP adresama, na virtuelizaciju nailazimo i u svim drugim Internet servisima, počev od mail servera pa na dalje. Virtuelizacija je kao neophodnost dovela do toga da se danas koristi u svim slojevima internet tehnologija od etherneta, preko IP adresiranja do već pomenutih web servera. U narednim tekstovima ćemo objasniti glavne virtuelizacione tehnologije.

DAS, NAS, SAN ukratko

DAS – Direct-Attached Storage

Kao što i samo ime kaže, DAS podrzumeva konfiguraricije u kojima je storage sistem direktno povezan sa serverima. Najčešće tehnologije povezivanja su ATA, SATA, SCSI, SAS i Fiber-Chanel. Prednost ovog koncepta je brz prenos podataka a mana je slaba iskorišćenost prostora jer se kapacitet storage-a ne može deliti sa drugim serverima. Preciznosti radi, treba napomenuti da u ovu kategoriju spadaju i USB, CD/DVD-ROM i slično ali za naš sajt ove tehnologije nisu značajne.

NAS – Network-Attached Storage

Konfiguracija u kojoj više servera koristi jedan isti storage sistem preko računarske mreže. Ovaj koncept upravo reševa gore pomenuti problem i pruža bolje iskorišćenje kapaciteta storage-a a kao nedostatak se najčešće navode slabije performanse i bezbednost podataka. Tehnologije koje se najčešće koriste su iSCSI, NFS, CIFS, FCoE.

SAN – Storage Area Network

Jednostavno, SAN je definicija računarske mreže koja za cilj ima samo prenos podataka Server-Storage ili Storage-Storage. Mreža može biti i često jeste, geografski raširena na više lokacija u cilju bezbednosti, redundanse i ispunjavanja raznih standarda poslovanja. Na primer, posle 11. Septembra 2001. u USA-a je donet zakon po kojem sve banke i druge ustanove koje čuvaju bitne informacije, moraju da imaju kopiju podataka na geografskoj lokaciji koja je udaljena minimalno 150km od osnovne lokacije. Sličan zakom je na snazi i u Srbiji u Bankarskom poslovanju. Tehnologije izvodjenja SAN-a obuhvataju sve moguće načine prenosa podataka pa čak i regularnu poštu ali najčešće se izvode raznim tipovima WAN, LAN, MAN računarskih mreža.