Étude du système de fichiers distribués GoogleFS

Par André Latulippe et Francis Bolduc


GFS est un système de fichier distribué propriétaire, ce qui veut dire que les droits et donc le code source appartiennent à la compagnie Google. La communauté internaute n’a donc aucune connaissance des techniques utilisées sauf ce qui est divulgué par la compagnie.


Le système de fichier GFS est basé sur Linux et a été développé pour supporter les applications de la compagnie en matière de stockage de données. GFS est née suite à leur premier projet nommé « BigFiles. » Il est conçu de façon à soutenir une très forte croissance en demande d’espace de stockage et est optimisé pour la gestion de très gros fichiers. Les données utilisées par le système, proviennent des Web robots (web-crawling).


Documentation complète du projet