IMT : Seafile et Borg sont dans un labo

Habil Sanni - Pierre Gambarotto

Historique & Contexte

IMT

  • ~ 400 personnes
  • des Matheux

Traduction :

  • plutôt des petits fichiers (latex, pdf)
  • petite volumétrie par utilisateur
  • beaucoup de fichiers en commun

stockage NetApp

  • accessible par un poste fixe
  • ou passerelle ssh
  • en fin de vie, ~ 30000€
  • 20Go pour chaque utilisateur
  • Copy On Write -> sauvegarde par instantanné
  • dump externe régulier (bandes ou disques)

Accès logiciel NFS/Samba/ssh

  • linux et kerberos : poste fixe à l’IMT
  • windows et ad : poste fixe à l’IMT
  • sshfs/sftp à partir d’une passerelle ssh

=> pas d’accès web

=> difficile de partager des fichiers entre plusieurs utilisateurs

Nexcloud

  • partage de fichier pour des besoins administratifs
  • travail en commun sur des projets de recherche
  • espace supplémentaire

2020 …

  • Covid
  • généralisation du télétravail

    Travailler à distance : pas un cas particulier

2020/2021

Passer à un nouveau modèle pour les données :

  • systématiser le portable
  • une personne = un portable
  • passage à une solution cloud pour les données
  • archivage en lecture seule, SÉPARÉ du stockage

données sur le cloud : Plmbox

BY

Seafile opéré par Mathrice

  • serveurs hébergés dans un datacenter à Bordeaux (IMB), plus efficace que nos salles machines
  • 50 Go pour un espace personnel, partageable
  • sur demande pour un espace «institutionnel» partagé
  • lié au compte plm, suit le matheux dans sa vie professionnelle

Borgbox

solution d’archivage en local à l’IMT, basée sur borgbackup

Habil vous en parlera en suivant.

Seafile -> Plmbox

  • stockage cloud, à la (Next|Own)cloud/Dropbox …
  • 1 serveur, N clients
  • réplication par synchronisation
  • ldap pour la gestion des comptes -> plm
  • openid-connect -> plm/renater

3 types de client

  • interface web
  • seafile, client lourd
  • seadrive, client lourd

Client Seafile vs Seadrive

Sur votre PC, à installer

2 logiciels, subtilement différents

  • seadrive : disque réseau

=> il faut être connecté au réseau pour travailler.

  • seafile : on a toujours une copie en local, synchronisation quand connexion réseau

solution de synchronisation : les fichiers sont recopiés sur votre PC pour que vous les consultiez.

  • Seadrive : au moment où vous accéder à un fichier
  • Seafile : à n’importe quel moment, par lot de fichiers

Dans les 2 cas :

Modification fichier sur PC

—> modification serveur plmbox

—> modification sur d’autres PC !

Utilisation

La configuration basique conseillée pour notre population :

  • seafile pour gérer le répertoire Documents
  • seadrive pour les fichiers partagés

Point sensible

  • NTP !
  • comme toutes les solutions de réconciliation de version

Seafile : les aspects sauvegarde

réplication : 1 serveur, N clients

sauvegarde intégré : accessible par le web

  • corbeille pour les choses effacées
  • sur chaque fichier, historique

Les réglages :

[library_trash]
expire_days = 30 # days, default

[history]
keep_days = days of history to keep

Sauvegarde/Restauration pour l’utilisateur

Aaaaaaaah, j’ai effacé un fichier supra important !!!!!!!

Icône recyclage > cliquer sur restaurer

Aaaaaaaah, j’ai fait une modification de trop !!!!!!

Historique, puis restaurer/récupérer/afficher

Sauvegarde => Archivage !

Sauvegarde : garder une copie, accessible depuis le système initial

Archivage : copie en lecture seule

Mais pourquoi ? La sauvegarde n’est pas suffisante ?

Aaaaaaaaah, Cryptolocker

un méchant cryptolocker a tout verrouillé, y compris l’historique !

exorcisme réinstallation de l’ordinateur. Et les données ?

La mode des cryptolocker :

  1. prise de contrôle du PC
  2. chiffrement de toutes les données accessibles
  3. demande de rançon par cryptomonnaie

Vraiment à la mode !

source

L’archivage est une solution

  • on réinstalle complètement le PC initial
  • on restaure les données à partir de l’archive la plus récente.

=> archive journalière

Moins à la mode, mais tout aussi efficace

  • destruction accidentelle des données
  • destruction du support de données

Ovh cloud vs smoke

Bonnes pratiques

  • gestion des données et sauvegarde primaire dans un lieu, manipulable directement par l’utilisateur
  • archivage dans un autre lieu, en lecture seule pour l’utilisateur