Cloud et datacenters

Introduction :

Historiquement chaque utilisateur stockait ses données personnelles sur sa propre machine. Dans les organisations, les données pouvaient être partagées localement. Le développement de l’Internet a progressivement chamboulé ces pratiques, en proposant de délocaliser les données puis les services.

Dans un premier temps nous préciserons en quoi consistent ces prestations de stockage et de services en ligne, communément désignées par cloud ou nuage informatique. Nous préciserons ensuite les modalités de stockage et de synchronisation des données dans le nuage, puis comment nos données du quotidien sont incorporées à ce cloud.

Nuage informatique

Le symbole du nuage est utilisé depuis longtemps en informatique pour matérialiser des réseaux d’équipements reliés entre eux. Assez naturellement l’Internet a été représenté de la même manière. Puis lorsque l’offre de stockage et de services en ligne s’est développée, la métaphore du nuage a continué à être employée.

L’expression anglaise cloud computing, souvent raccourcie en cloud, peut se traduire en français par informatique en nuage, ou encore informatique dématérialisée.

bannière definition

Définition

Informatique en nuage (cloud) :

L’informatique en nuage désigne la mise à disposition de ressources ou de services informatiques situés quelque part sur l’Internet.

Cette définition est volontairement vague sur le « quelque part » : le développement de l’informatique en nuage a en effet conduit à un niveau d’abstraction de plus en plus élevé par rapport aux ressources physiques sur lesquelles cette offre est construite.

Les utilisateurs de ressources dans le nuage disposent d’une certaine capacité, de stockage ou de calcul, mais sans nécessairement connaître la manière dont cette capacité est mise à disposition.

bannière exemple

Exemple

Un espace disque virtuel d’une capacité donnée sur Internet peut correspondre :

  • à un disque dur de capacité identique,
  • au partitionnement d’un disque dur de capacité supérieure,
  • à l’agrégation de plusieurs disques durs physiquement distincts.

De même une puissance de calcul peut être fournie par un ou plusieurs serveurs.

Du point de vue de l’utilisateur, il accède à un service dématérialisé : gratuit ou payant, ce service est défini par des caractéristiques générales telles que la capacité de stockage ou de calcul, indépendamment de l’infrastructure qui permet de proposer ce service. Cette infrastructure peut évoluer, de même, les offres de cloud permettent facilement à l’utilisateur d’augmenter si nécessaire l’étendue des ressources mises à sa disposition.

Le cloud public désigne des ressources publiquement accessibles, tandis que le cloud privé désigne des ressources réservées à certaines organisations. Cette offre dans le nuage couvre à la fois le stockage de données et la fourniture de services.

Stockage de données

De vastes espaces de stockages répartis sur l’Internet permettent d’entreposer des volumes parfois colossaux de données. Les infrastructures proposant ces offres sont appelées datacenters ou centres de données.

bannière definition

Définition

Datacenter  (centre de données) :

Centre informatique dédié au stockage de données.

Les centres de données concentrent un nombre souvent très important d’équipements informatiques installés dans des locaux hautement sécurisés et comprenant des dispositifs garantissant la continuité de leur fonctionnement : connexions redondantes à l’Internet, onduleurs et groupes électrogènes pour pallier les coupures électriques, astreinte technique permanente, etc.

Les données stockées sur le territoire européen telles que les données qui concernent nominativement les citoyens européens doivent respecter les dispositions édictées par le RGPD. Ce règlement de l’Union européenne applicable depuis mai 2018 définit un cadre juridique européen unique pour la protection des données à caractère personnel.

bannière definition

Définition

RGPD :

Le règlement général sur la protection des données est le texte de référence pour la protection des données personnelles dans l’Union européenne.

  • Les organisations qui collectent, stockent, traitent et parfois vendent des données doivent impérativement respecter ce règlement.

Mais le cloud ne se limite pas seulement au stockage de données, des services sont également proposés en ligne, et font partie intégrante du cloud.

Services en ligne

L’Internet met en réseau toutes sortes de machines. Certaines stockent des données, d’autres proposent des services. Les plus connues sont sans doute les serveurs web qui permettent de répondre aux requêtes des internautes lorsqu’ils consultent des sites. Mais il existe d’autres catégories de serveurs et de services spécialisés, entre autres pour la messagerie, la vidéo, les bases de données, les applications web.

L’offre historique d’hébergement s’appuyait sur des machines physiques, partagées (hébergement mutualisé) ou non (location de serveur). Mais cette offre s’est en grande partie dématérialisée. De nombreux acteurs proposent aujourd’hui, à partir d’une myriade de machines interconnectées, des serveurs virtualisés divers pour répondre à tous types de besoins.

serveur matériel espace virtuel achat location machine physique location machine virtuelle systèlme d’exploitation application logiciel de virtualisation serveur web

La dématérialisation de l’offre permet également de moduler ponctuellement les ressources.

bannière exemple

Exemple

En cas de besoin, la puissance informatique d’une plateforme louée sous forme de service dans le cloud peut être augmentée ou réduite d’un simple clic dans une interface d’administration : il est ainsi possible, si nécessaire, d’accélérer les traitements ou d’augmenter les capacités de stockage, ponctuellement ou durablement.

Infrastructures, plateformes et logiciels sont aujourd’hui proposés sous forme de services, qu’il est possible de louer pour des durées variables.

bannière definition

Définition

Logiciel en tant que service (SaaS) :

Un logiciel en tant que service (ou Software as a Service, abrégé SaaS) consiste en une mise à disposition d’un service en ligne.

De nombreux logiciels sont désormais proposés sous forme de service. Ces derniers peuvent être soit gratuits, soit payants, auquel cas ils sont accessibles par abonnement.

Coût énergétique

Les offres de stockage et de services en ligne sont construites sur de nombreux datacenters aux capacités toujours plus importantes. Leur consommation, estimée entre 2 et 4 % de la production électrique mondiale, est en très forte croissance. Certaines études prévoient que l’Internet consommera globalement un cinquième de la puissance électrique mondiale à l’horizon 2025.

Pour estimer le coût global du cloud, il faut également prendre en compte le coût économique et écologique de fabrication des équipements informatiques, dont certains nécessitent des métaux rares.

L’internaute n’a pas nécessairement conscience des coûts induits par son utilisation quotidienne de l’Internet.

  • Si de nombreux services sont souvent gratuits pour l’internaute, leur coût est loin d’être nul.

Dans une logique de développement durable, il paraît nécessaire de sensibiliser les internautes et les développeurs informatiques à cette problématique.

Données dans le nuage

Le nuage peut être utilisé de différentes façons et pour différents usages : on peut à la fois y sauvegarder des données, les partager, ou synchroniser des données entre différents appareils par l’intermédiaire du nuage.

Il est important de bien faire la distinction entre deux usages : la sauvegarde et la synchronisation. Certains utilisateurs confondent ces deux notions, ce qui peut conduire à des pertes de données parfois irréversibles.

bannière definition

Définition

Sauvegarde :

La sauvegarde consiste en la réalisation périodique de copies de sécurité sur un support distinct.

bannière definition

Définition

Synchronisation :

La synchronisation consiste à maintenir à l’identique l’état des données sur différents supports ainsi synchronisés entre eux.

bannière à retenir

À retenir

Quand on supprime une sauvegarde, l’original n’est pas affecté.
Quand on supprime un élément synchronisé, celui-ci n’est plus accessible nulle part.

Sauvegarde

On peut vouloir utiliser le cloud pour sauvegarder des données stockées localement sur une machine, de la même manière qu’on peut utiliser un disque dur externe ou une solution de stockage sur un réseau local. Avec une sauvegarde dans le cloud, l’utilisateur est à l’abri des risques de perte, de vol ou des destructions physiques pouvant survenir localement suite à un cambriolage, un incendie ou une inondation.

La sauvegarde peut être réalisée simplement de manière manuelle, en enregistrant sur un espace de stockage en ligne le ou les fichiers à sauvegarder, comme on le ferait sur un support externe local. En cas de perte de l’original, l’utilisateur pourra rapatrier la copie déposée dans le cloud et ainsi récupérer ses données.

Les sauvegardes dans le cloud peuvent être utilisées de manière complémentaire à des sauvegardes locales. Certains matériels et logiciels spécialisés proposent des sauvegardes automatiques dites hybrides, avec une copie de sauvegarde effectuée localement, et une autre effectuée parallèlement dans le cloud : les données sont redondantes et physiquement distantes, ce qui réduit les risques de perte. Il faut toutefois prendre en considération les implications de sécurité inhérentes à ce type de sauvegarde, puisque les données ne sont pas stockées localement sur des supports dont le propriétaire peut assurer la sécurité physique.

Synchronisation

bannière à retenir

À retenir

Lorsque des éléments sont synchronisés sur plusieurs supports, toute modification effectuée sur un élément synchronisé est automatiquement répercutée sur tous les supports synchronisés.

Selon ses modalités de mise en œuvre, la synchronisation peut porter :

  • sur certains types de données tels que les contacts, photos, courriels, signets de navigateur ;
  • sur certains espaces de stockages, avec des répertoires spécifiques synchronisés.

La synchronisation confère une certaine indépendance par rapport au terminal à partir duquel on accède aux données.

bannière attention

Attention

Si l’on supprime un élément synchronisé sur un appareil, il est supprimé partout et ne sera plus accessible nulle part.

Accès collaboratif aux données

Les espaces de stockage du cloud ont également été conçus pour permettre le travail collaboratif. Des fonctionnalités sont donc présentes pour partager des fichiers et des dossiers, en accordant des droits plus ou moins importants aux destinataires de ces partages.

Si les modalités précises peuvent varier d’un service à l’autre, il est en général possible de :

  • permettre la lecture d’un fichier ou d’un document ;
  • permettre sa modification ;
  • permettre sa suppression.
  • L’administrateur du document peut choisir d’accorder, collectivement ou individuellement, tout ou partie de ces droits.

L’accès peut être protégé par un mot de passe, ou simplement par la connaissance de l’adresse URL précise d’accès à la ressource. Ces URL sont suffisamment longues et complexes pour rendre hautement improbable leur découverte accidentelle ou intentionnelle, d’autant que ces ressources ne sont pas parcourues par les moteurs de recherche.

Les espaces collaboratifs du cloud intègrent également des fonctionnalités de travail collaboratif sur les documents ainsi partagés, avec des mécanismes permettant d’identifier les contributions individuelles.

Présente sous différentes formes, l’informatique en nuage fait partie du quotidien des internautes et des mobinautes.

Le cloud au quotidien

L’utilisateur de services numériques n’a pas toujours conscience que les services qu’il utilise ont recours à l’informatique en nuage. Nous allons l’illustrer à l’aide de quelques exemples simples.

Messagerie électronique

L’échange de courrier électronique fait partie des services de base disponibles sur l’Internet. Dans la plupart des cas, les internautes et mobinautes y ont recours par le biais de services dans le cloud.

Avec une application cliente de messagerie traditionnelle, les messages sont stockés sur la machine de l’internaute, qui peut choisir de les effacer des serveurs de son fournisseur de messagerie électronique dès leur téléchargement. Mais de nombreux utilisateurs ont recours à une messagerie web.

bannière definition

Définition

Messagerie web (webmail) :

Un webmail est un service de courrier électronique accessible depuis un navigateur web.

Avec un webmail rien n’est stocké sur la machine de l’internaute, si ce n’est éventuellement les cookies nécessaires au bon fonctionnement de l’application. L’ensemble des données est stocké dans le nuage du fournisseur de service mail. La protection des données repose sur la capacité du fournisseur de ce service à protéger efficacement ses équipements informatiques et sur son bon respect de la confidentialité des données personnelles appartenant aux utilisateurs de son service.

Contacts téléphoniques

Les données téléphoniques sont un autre exemple de données fréquemment stockées dans le cloud. L’internaute mobile, parfois appelé mobinaute, dispose avec son téléphone intelligent d’un accès permanent à l’Internet. Sauf s’il a été configuré de manière très restrictive, son téléphone a fréquemment recours au cloud, notamment pour synchroniser différentes données.

Parmi les fonctionnalités de base de tout téléphone portable figure la gestion des contacts. Les téléphones intelligents sont capables d’effectuer de nombreux traitements en lien avec ces contacts.

Plusieurs acteurs se proposent de gérer la sauvegarde ou la synchronisation des contacts du propriétaire du téléphone :

  • l’opérateur de téléphonie mobile,
  • le fournisseur du système d’exploitation mobile,
  • certains fournisseurs d’applications mobiles.
bannière exemple

Exemple

Les applications mobiles éditées par les réseaux sociaux, les services de messagerie instantanée ou les applications de téléphonie par Internet proposent généralement au mobinaute d’accéder à ses contacts pour le connecter facilement avec ses connaissances. S’il accepte, il permet à l’éditeur du service de consulter les fiches de contacts qui seront croisées avec les personnes inscrites sur le service de l’éditeur.

bannière à retenir

À retenir

S’ils sont simples en apparence, les carnets de contacts sont en réalité de véritables bases de données qui contiennent des informations nominatives. Tout partage doit être réfléchi en termes de sécurité et de confidentialité, en s’interrogeant notamment sur le sérieux du service qui souhaite y accéder.

Les données de contact sont le plus souvent manipulées dans le format ouvert vCard.

bannière definition

Définition

Format vCard :

Format ouvert conçu pour la manipulation des coordonnées de contacts personnels ou professionnels.

Ces cartes de visite électroniques ont pour extension le .vcf pour Virtual Contact File, que l’on peut traduire par fichier de contact électronique. Largement répandu, ce format est notamment employé par de nombreux gestionnaires de carnets d’adresses mobiles, clients de courrier électroniques et de messagerie instantanée.

bannière exemple

Exemple

Voici un exemple de fiche d’un contact fictif au format vCard.

BEGIN:VCARD
VERSION:3.0
FN;CHARSET=UTF-8:Aleksandre Durand
N;CHARSET=UTF-8:Durand;Aleksandre;;;
NICKNAME;CHARSET=UTF-8:Alex
GENDER:M
BDAY:19840712
EMAIL;CHARSET=UTF-8;type=HOME,INTERNET:durand1984@monmail.com
EMAIL;CHARSET=UTF-8;type=WORK,INTERNET:aleksandre@schoolmouv.fr
TEL;TYPE=CELL:+33 6 78 90 12 34
TEL;TYPE=WORK,VOICE:+33 1 23 45 67 89
ADR;CHARSET=UTF-8;TYPE=HOME:;;177 chemin du Verdon;Toulouse;;31000;France
REV:2019-10-10T12:16:36.461Z
END:VCARD

Les données issues des contacts peuvent être utilisées par le téléphone notamment pour :

  • initier des appels téléphoniques,
  • identifier les appels entrants de correspondants connus,
  • envoyer des courriels aux contacts,
  • envoyer des messages écrits aux contacts,
  • partager les informations sur un contact avec des tiers.

Le format ouvert vCard permet de stocker de manière structurée toutes les informations rattachées à un contact, et principalement :

  • nom et prénoms,
  • organisation d’appartenance le cas échéant,
  • photo du contact,
  • numéro(s) de téléphone,
  • adresse(s) de courrier électronique,
  • adresse(s) de messagerie instantanée,
  • adresse(s) postale(s).

L’ensemble des contacts constitue une base de données, dans laquelle il est possible d’effectuer un certain nombre de recherches. L’étendue de ces recherches dépend de la manière dont on accède aux données : le gestionnaire de contacts du téléphone propose généralement une recherche alphabétique par nom ou par prénom et une recherche libre, incluant la recherche inversée à partir d’un numéro de téléphone que l’on saisit.

Le format vCard structure précisément les informations sur les contacts. On peut donc utiliser un outil de type tableur ou base de données, avec lequel il est facilement possible d’effectuer des recherches, des sélections et des tris sur la base de critères précis comme l’existence d’un téléphone professionnel, d’une adresse mail, d’une date d’anniversaire, ou l’appartenance à une organisation.

La synchronisation de ces données de contacts revêt un indéniable aspect pratique au quotidien, en permettant d’accéder en permanence à tous ses contacts sur l’ensemble des appareils synchronisés. Cette synchronisation s’avère particulièrement utile en cas de remplacement d’un appareil : il suffira de synchroniser le nouvel appareil pour y retrouver ses contacts.

bannière exemple

Exemple

En cas d’achat d’un nouveau téléphone intelligent, la configuration de ce nouvel appareil peut en grande partie se résumer à sa synchronisation avec les données personnelles de l’utilisateur disponibles dans le nuage.

Les contacts ne sont pas les seuls éléments d’un téléphone susceptibles d’être stockés dans le cloud. D’autres éléments liés à l’activité du téléphone et de son propriétaire produisent des données et des métadonnées.

Métadonnées

Les données sur les données sont appelées métadonnées ou données d’accompagnement.

bannière definition

Définition

Métadonnées :

Les métadonnées, ou données d’accompagnement, apportent des informations sur d’autres données.

Quand l’utilisateur d’un téléphone passe un appel ou envoie un message, il produit des données (sa conversation ou son message écrit) mais aussi des métadonnées : la date et l’heure de son appel ou de son message, la durée de sa conversation ou le nombre d’échanges, et l’identifiant de son correspondant. Ces métadonnées sont stockées sur son téléphone mais également dans le cloud privé de son opérateur téléphonique, qui est légalement tenu de les conserver un certain temps.

De la même manière, les photographies sont accompagnées de métadonnées. Issues d’un appareil photo numérique ou d’un téléphone intelligent, ces métadonnées renseignent sur les conditions de prise de vue : date, heure, localisation, type d’appareil, réglages photographiques appliqués, etc.

Le téléversement de photos sur des services dans le cloud conduit l’auteur des photos à fournir, s’il ne les a pas supprimées avant, toutes les données d’accompagnement de ces photos. Les services d’hébergement de photos ou les réseaux sociaux recevant ces photos peuvent donc effectuer un certain nombre de traitements et d’analyse sur ces métadonnées.

bannière exemple

Exemple

La date et l’heure de prise de vue figurent dans les métadonnées photographiques comme les coordonnées géographiques du lieu de la prise de vue, pour peu que le réglage l’ait autorisé. Il est donc possible de déterminer précisément le moment où la photo a été prise et de géolocaliser l’appareil à cet instant.

Métadonnées photographiques coordonnées date prise de vue résolution dimensions taille fichier Métadonnées photographiques

bannière à retenir

À retenir

Les utilisateurs produisent donc quotidiennement des données et des métadonnées dont certaines sont stockées dans le cloud.

Services cloud usuels

Les services de cloud proposés classiquement par les systèmes d’exploitation Windows et MacOS sont respectivement Microsoft OneDrive et iCloud. Google propose également la synchronisation des photos d’un smarthpone dans le cloud Google Photos.

Alt texte Logo de OneDrive

Alt texte Logo de l’iCloud

Alt texte Logo de Google Photos

Conclusion :

Nous avons dans un premier temps présenté l’informatique en nuage comme un centre à la fois de données et de services en ligne dématérialisés. Nous avons ensuite précisé les possibilités de stockage, de synchronisation et de partage collaboratif de données permises par le cloud. Nous avons enfin souligné par des exemples du quotidien dans quelle mesure nos données et les métadonnées associées peuvent intégrer le cloud.