Hadoop, un sistema de fitxers distribu

Compartir

Permet gestionar de forma òptima un conjunt de discos en xarxa, de manera que la informació estigui disponible fins i tot quan fallen alguns dels components de l’array de discos.


Redacció imatica.org – En un món amb un volum d’informació que creix de forma desmesurada, els centres de dades comencen a guanyar punts i a recuperar el protagonisme que van tenir abans de l’eclosió de la microinformàtica personal i domèstica. Per a ells, i per a la sempre creixent informació que han de guardar les empreses i altres organitzacions, un sol disc dur (per gran que aquest sigui) comença a no ser prou, i es demanen solucions fiables, segures i extensibles (que puguin créixer sense haver de retocar el que ja s’ha fet).

Hadoop és un projecte nascut en el si de la Fundació Apache el nucli del qual és constituït per un sistema de fitxers que permet solucionar els problemes abans exposats. Aquest nucli consisteix en un sistema de fitxers distribuït, el que li permet repartir les dades a emmagatzemar entre els diferents nodes que conformen el clúster Hadoop. A més, divideix les dades en trossos petits emprant el model MapReduce creat per Google per a l’anomenat GFS (Google File System), de manera que davant la fallada d’un dels nodes, tenim altes probabilitats de recuperar la informació que en ell s’hi trobava.

Si bé fins ara Hadoop amb prou feines havia estat emprat només en grans empreses de la talla de Yahoo! o Amazon, ara tenim a la nostra disposició gràcies al projecte OpenSolaris un Live CD que ens permet provar aquest sistema de fitxers distribuït en qualsevol sistema informàtic d’una forma fàcil, ràpida i còmoda.

A la pàgina d’aquest projecte hi podem trobar a més de l’enllaç corresponent per a la descàrrega de la imatge, la descripció tècnica del que tenim exactament a les mans i unes breus instruccions per a començar. El Live CD de Hadoop es dirigeix eminentment a propòsits educatius i experimentals per a una posterior implementació real d’aquest sistema. Així, si per exemple som els responsables del centre de dades d’una gran empresa, podrem provar un nou tipus de sistema de fitxers sense haver de modificar absolutament res del que ja tenim implementat, per tal de poder-nos fer una idea del que ens ofereix i com treballar amb ell.

Guillem Alsina