Architecture des projets

Dette technique

L’analyse des projets menés à l'Abes a permis de découvrir des structures de projets hétérogènes dépendant de plusieurs facteurs : IDE utilisé, plugins d’IDE, type de projet, expérience personnelle de l'agent dans le développement. Lors d'un transfert de responsabilité d'application vers un autre agent, ou lors de l'intervention d’un développeur sur le code de l’application, il était donc difficile de s'approprier le code en raison de ces aspects hétérogènes.

C'est pourquoi l'utilisation de frameworks spécifiques à chaque type de projet est maintenant préconisée.

Types de projets

Nous pouvons classer nos projets / applications de la façon suivante :

Applications Web

Nous privilégions dorénavant systématiquement une architecture avec un fort découplage entre client et serveur : ceci permet une meilleure expérience utilisateur (le client s'exécute dans le navigateur) et donne la possibilité d'ajouter ou de remplacer facilement le client. La partie serveur se traduit par une API qui est un ensemble de services web accessibles, versionnés et documentés.

Pour développer la partie cliente, nous avons choisi d'utiliser le framework VueJs. Quant aux API, elles sont développées avec le framework Spring Boot et les différents composants Spring : web, security etc.

Les services web sont sécurisés

l'authentification (sur LDAP, base de données, service web etc.) et une gestion via l'utilisation de token JWT
l'autorisation: droits sur les services vérifiés par spring security

Le versionning des API

cf. Gestion des API

Cas particulier des applications J2EE / architecture MVC

Certaines de nos applications ont été développées entièrement en Java, notamment la couche UI avec des frameworks comme JSF. Ces applications Java web sont en général structurées en couches (DAO pour l’accès à la base de données, métier, contrôleur, interface).

Application Batch

Ces applications permettent de réaliser des tâches côté serveur sans IHM. L'utilisation du framework Spring Batch est devenu notre standard.

Tous nos projets Java sont obligatoirement gérés via Maven.

Nom d'un projet/application

Un projet dont l'objectif est de créer ou de faire évoluer une application donnera forcément lieu tôt ou tard au choix d'un nom d'application. Généralement le nom d'un projet réutilise le nom de l'application mais ce sont deux notions distinctes.

Au niveau technique il est nécessaire de choisir un nom d'application respectant les règles suivantes :

réutiliser le nom public de l'application (exemple : on choisirait "qualimarc" et pas "outil-qualite-sudoc" car c'est comme ça qu'il est connu par le public)
ne pas utiliser de majuscules
si nécessaire de plusieurs mots, les séparer avec des tirets "-" (tiret du 6)
ne pas terminer par un chiffre (c'est une contrainte du puits de log de l'Abes qui n'accepte pas que le nom de l'application se termine par un chiffre, par exemple privilégier "projetetab" plutôt que "projet2024")

Ce nom sera ensuite utilisé dans le nom des dépôts github, dans le code source et sa documentation, dans les images et les conteneurs docker, dans les tests, dans les scripts de déploiement, dans le nom de domaine du site web. Si ce nom change, il devient alors nécessaire de modifier l'ensemble de la chaine technique (attention cette opération peut être couteuse d'où l'importance de bien choisir le nom le plus en amont possible).

Configuration d'un projet

La première étape lorsque nous démarrons un projet est de créer un dépôt dans le gestionnaire de source : nos nouveaux projets étant par défaut open source, il s'agit d'un dépôt Github. Puis nous créons ensuite les jobs de construction et de déploiement sur Jenkins. L'application peut nécessiter la création d'autres services : indexation Solr ou ElasticSearch, bases de données relationnelles Oracle etc. Pour les projets Java qui sont gérés avec Maven, le fichier pom.xml est configuré pour que notre Jenkins local puisse envoyer les artifacts (code compilé) sur notre Artifactory local. La balise scm doit être renseignée pour faciliter les release via Jenkins. L'encodage des fichiers est UTF-8.

Le groupId doit être le même pour toutes les applications de l’Abes : fr.abes
L'artifactId doit correspondre au nom de l’application. Les applications peuvent parfois être composée de plusieurs modules. Enfin, pour nos projets interne, les pom.xml peuvent dépendre du pom parent Abes.
Les fichiers de configuration dépendant de l’environnement d'exécution de l'application (contenant par exemple les chaines de connexion à la base de données qui sera différente si l’application est exécutée sur l’environnement de test, de développement ou de production) sont déposés dans le répertoire /resources. Un fichier par environnement d’exécution est présent et porte un nom spécifique à cet environnement suivant la convention Spring :
application-DEV.properties pour l’environnement de développement
application-TEST.properties pour l’environnement de test
application-PROD.properties pour l’environnement de production
application.properties pour les éléments partagés par tous les environnements.

pour les dépôts Github, les fichiers de configuration ne sont pas versionnés avec le projet. Ils sont versionnés sur un dépôt interne et envoyés sur les environnements de déploiement au moment de l'exécution du job de déploiement.

Les fichiers journaux de l’application doivent se situer dans un répertoire nomAppli/logs. Un fichier log4j.properties est fourni dans l’application pour déterminer la structure du fichier de log.

Configuration d'un projet avec docker

Configuration d'une application docker

Une application dockerisée respecte plusieurs règles :

l'application possède un dépôt pour son code source et c'est ce même dépôt qui est chargé de générer et de publier son image docker.
- ce dépôt contient le Dockerfile de l'application dont l'objectif est de produire l'image docker de l'application pour qu'elle soit ensuite prête à être exécutée (ex: sur abes-hello-back)
- le Dockerfile de l'application execute également les tests de l'application ce qui permet d'éviter de produire une image docker embarquant un code qui ne fonctionne pas (exemple de paramétrage maven sur abes-hello-back)
- ce dépôt contient une github action souvent nommée build-test-pubtodockerhub.yml (ex: sur abes-hello-front) permettant de construire l'image Docker et de la publier sur l'espace abesesr sur dockerhub.
- ce dépôt contient une github action souvent nommée create-release.yml (ex: sur abes-hello-front) permettant de créer une nouvelle version/release de l'application
l'application peut avoir besoin de plusieurs images docker, par exemple pour le front en vuejs (ex: abes-hello-front), ou pour l'API en java Spring (ex: abes-hello-back)
l'application possède un dépôt dédiée à son déploiement avec docker-compose, cf section suivante.

Déploiement d'une application docker

Un dépôt github dédié au déploiement doit être créé pour l'application. La règle de nommage de ce dépôt est de commencer par le nom de l'application et de terminer par le suffix -docker (ex: abes-hello-docker). Il permet à n'importe qui sur le web de venir tester l'application sur son environnement local ou sur son serveur. Ce dépôt permet de faciliter la réutilisation et les contributions externes.

Les éléments obligatoires de ce dépôt sont :

le fichier docker-compose.yml : c'est la liste de tous les conteneurs et leurs configurations/articulations utilisés par l'application. Des règles doivent être respectées, cf paragraphe plus bas.
le fichier .env-dist : c'est un fichier contenant les paramètres de l'application avec des exemples de valeurs. Il est destiné à être copié vers un fichier .env au moment de l'installation initiale de l'application et à personnaliser son contenu (ex: mot de passe d'une base de données, chaine de connexion etc ...)
le fichier README.md : c'est la fiche d'exploitation de l'application qui explique comment installer, démarrer, stopper, superviser et sauvegarder l'application (ex: sur abes-hello-docker).

Le fichier docker-compose.yml de l'application décrit tous les conteneurs de l'application et leurs articulations, il doit respecter les règles suivantes :

chaque nom de service doit être préfixé par le nom (court) de l'application, ex avec le préfix abes-hello ceci afin de mieux les distinguer et le regrouper au niveau d'un serveur hébergeant plusieurs applications différentes :
```
services:
  abes-hello-front:
```
chaque service doit nommer son conteneur en réutilisant le même nommage que le service, ex sur abes-hello :
```
container_name: abes-hello-front
```
chaque service (sauf rares exceptions) doit se configurer pour redémarrer automatiquement au démarrage de la machine, sauf si l'humain a stoppé intentionnellement le conteneur, cf la directive suivante :
```
restart: unless-stopped
```

chaque service doit limiter sa consommation mémoire et cpu à 5Go et 5 cpu max (sauf rares exceptions) et désactiver la mémoire swap, cf la directive suivante :
Dans docker-compose.yml :

mem_limit: ${MEM_LIMIT}
memswap_limit: ${MEM_LIMIT}
cpus: ${CPU_LIMIT}

Dans dans .env-dist :

######################################################
# Memory caping for containers : 5Go
# CPU caping for containers : 5 CPU
MEM_LIMIT=5g
CPU_LIMIT=5

les ports externes utilisés par l'application doivent être contiguës dans une plage de port définie au début du projet (par exemple en réservant 10 ports contiguës) en prenant soin que cette plage de ports n'empiète pas sur d'autres plages de ports utilisées par d'autres applications du SI de l'Abes (l'application interne https://devops.abes.fr/index_ports_containers/ doit être utilisée pour identifier cette plage libre), et que cette plage de ports soit libre sur toutes les machines hébergeant les containers (diplotaxis1, 2, 3, etc.). Cette plage de ports doit être choisie à la suite de la dernière plage de port utilisée par la dernière application ajoutée au SI de l'Abes. Les ports utilisés par une application déployée en dev, test ou prod sont considérés comme occupés, indépendement de l'environnement (par exemple les ports d'une application déployée uniquement en dev sont considérés comme occupés, même si cette dernière n'est pas en prod). Le fichier .env-dist doit indiquer dans des variables ces ports choisis qui deviennent donc les ports par défaut de l'application mais qui si besoin peuvent être paramétrés du fait qu'il sont variabilisés et pas codés en dur dans le docker-compose.yml.
reverse proxy & belle URL :
- un reverse proxy applicatif embarqué dans le docker-compose.yml est préconisé dans le cas où l'application nécessite une URL pour y accéder. Il est préconisé de baser le reverse proxy applicatif sur une base d'image nginx (serveur web léger et particulièrement adapté pour les reverse proxy). Le nomage du conteneur embarquant le reverse proxy application doit se terminer par "-rp" : <appli>-rp
- la mise en place d'une "belle URL" en HTTPS est préconisée pour les applications nécéssitant un accès via le web qu'il soit interne ou public. La "belle URL" est constituée d'un sous-domaine raccrochée à un domaine principal (exemple : https://item.sudoc.fr). Cette "belle URL" est paramétrée au niveau du reverse proxy d'entreprise (raiponce : le même pour toute l'Abes), et il est préconisé de faire pointer cette l'URL vers l'URL interne du reverse proxy applicatif quand il existe (ce qui permet d'avoir un seul mapping) ou, à défaut, vers les différentes URL internes de l'application si cette dernière n'a pas encore de reverse proxy applicatif.

Configuration des logs des conteneurs dockers

Chaque application qui est "dockerisée" et qui produit des logs (c'est-à-dire toutes les applis ?), doit les produire de la même façon et indiquer au démon filebeat comment les récupérer pour qu'il puisse ensuite les envoyer correctement au puits de log (logstash / elasticsearch / kibana).

L'application doit respecter quelques règles :

produire ses logs à surveiller sur stdout et stderr
paramétrer filebeat avec des labels docker
produire ses logs personnalisés en respectant un format

stderr stdout

Pour que le conteneur de l'application produise ses logs sur stdout et stderr, il y a plusieurs possibilités.

Si c'est une application Java le mieux est d'exécuter le process java en premier plan (foreground). Exemple de point d'entrée docker exécutant l'appli java à partir d'un JAR en premier plan : ENTRYPOINT ["java","-jar","/app.jar"]
Si c'est une script shell (exemple un batch), alors on logguer sur stdout ou stderr au choix en utilisant >/dev/stdout (par défaut si rien n'est précisé c'est sur stdout que ça va) ou >/dev/stderr pour logguer les erreurs. Exemple :
```
echo "INFO: ma ligne de log pour aller sur stdout" >/dev/stdout
echo "ERROR: ma ligne de log pour aller sur stderr" >/dev/stderr
```
Si c'est une application tierce qu'on ne peut donc pas trop modifier et qui loggue déjà dans un fichier, alors on peut soit configurer l'application pour lui demander de logguer les erreurs sur le fichier /proc/self/fd/2 (c'est la même chose que le fichier /dev/stderr) sur le fichier /proc/self/fd/1 (ou au choix /dev/stdout), soit identifier le chemin du fichier vers lequel l'application va logguer et s'en sortir avec un système de lien symbolique comme par exemple ce que l'image docker officielle de nginx fait : cf son Dockerfile.

paramètres pour filebeat - labels docker

Le paramétrage de la remontée des logs dans filebeat se fait au niveau de chaque conteneur en suivant une nomenclature de "labels docker" (cf recommandations).

La configuration la plus simple est de seulement signaler à filebeat que les logs du conteneur sont à prendre en compte en n'indiquant aucun format de log. Pour cela il est nécessaire d'ajouter les labels suivant au conteneur. Voici un extrait à copier coller dans un docker-compose.yml qui montre comment signaler à filebeat de prendre les logs en compte :

    labels:
      - "co.elastic.logs/enabled=true"
      - "co.elastic.logs/processors.add_fields.target="
      - "co.elastic.logs/processors.add_fields.fields.abes_appli=monapplication"
      - "co.elastic.logs/processors.add_fields.fields.abes_middleware=httpd"

Les labels ont la signification suivante :

co.elastic.logs/enabled=true : signifie qu'on souhaite que filebeat remonte les logs de ce conteneur (par défault c'est false)
co.elastic.logs/processors.add_fields.target= : signifie qu'on souhaite ajouter les deux champs abes_appli et abes_middleware dans le puits de logs en rateau à la racine des champs (cf la doc)
co.elastic.logs/processors.add_fields.fields.abes_appli=monapplication : signifie qu'on souhaite faire remonter un champs personnalisé nommé "abes_appli" qui contiendra comme valeur "monapplication" pour le conteneur présent. Ce champ "abes_appli" est obligatoire, il doit contenir le nom de l'application qui peut elle-même être éclatée en plusieurs conteneurs pour chaque middleware (un pour le web, un pour le back, un pour les batch etc ...), c'est ce champ qui permet de regrouper tous les conteneurs d'une même application au niveau du puits de logs. Remarque : le puits de logs n'accepte pas que le nom de l'application se termine par un chiffre (ex: si l'appli s'appelle "projet2024" ça ne convient pas, il faut que le nom se termine par une lettre, dans notre exemple ça pourrait donner "projetetab"). Remarque : dans une architecture de type orchestrateur (ex: OKD), c'est probablement le nom du pod qui remplacera la valeur de "abes_appli".
co.elastic.logs/processors.add_fields.fields.abes_middleware=Httpd : le champs "abes_middleware" est obligatoire, il permet d'indiquer au puits de logs de l'Abes (via logstash précisément) la nature des logs envoyés et donc dans quel index elasticsearch doit-il classer ces logs. Les valeurs possibles sont : "adhoc", "Httpd" (mettre "adhoc" si ce sont des logs dont le format est spécifique à l'application).

Pour un exemple complet qui montre aussi comment spécifier un format de log précis, on peut se référer à https://github.com/abes-esr/abes-filebeat-docker/blob/f4b19dfdccab690801c550c61724bd09cbeb6f5b/docker-compose.yml#L24-L37

On trouve alors d'autres labels dont voici la signification :

co.elastic.logs/module=nginx : signifie qu'on dit à filebeat que ce conteneur produit des logs au format nginx ce qui lui permettra de les envoyer découpés dans le puits de logs (cf la liste des modules filebeat disponibles)
co.elastic.logs/fileset.stdout=access : signifie que filebeat doit surveiller les logs stdout du conteneur
co.elastic.logs/fileset.stderr=error : signifie que filebeat doit surveiller les logs stderr du conteneur

La dernière étape pour que les logs remontent jusqu'au puits de logs de l'Abes est de solliciter l'équipe puits de log de l'Abes pour lui demander d'intégrer (configuration à faire au niveau de la brique logstash) les logs de l'application en s'appuyant sur clé "co.elastic.logs/processors.add_fields.fields.abes_appli=monapplication"

format pour les log personnalisées

TODO expliquer ici que les applis java/métier doivent produire des logs spécifiques en respectant certaines règles, lister les règles, donner des exemples de configuration de log4j etc ...

Bonnes pratiques de programmation

En termes d'architecture, nous cherchons à privilégier :

la programmation avec des interfaces et non des implémentations
l'inversion de contrôle pour réduire le couplage entre classes
l'utilisation des design patterns reconnus (tout en prenant soin d'éviter l'écueil de la sur-utilisation)

Concernant plus spécifiquement la notion d’informatique et liberté, on peut dégager les bonnes pratiques suivantes :

Ne pas effectuer de développements ni de tests sur les environnements de production.
Ne pas effectuer de tests sur des données personnelles réelles et utiliser des techniques d’anonymisation.
Prévoir une gestion rigoureuse des habilitations et droits d’accès sur les applications.
Prévoir en préalable à la mise en production d’une application la durée de conservation de tous les comptes utilisateurs et administrateurs.
Ne pas partager les comptes administrateurs entre plusieurs personnes.
Sécuriser systématiquement l’interface d’administration des applications.
Dans le cadre des données personnelles, prévoir des systèmes de purge automatique afin de respecter la durée de conservation des données, définie en amont de la mise en production.
Etre vigilant quant à la compatibilité du format des données avec la durée de conservation (ex : date sur 4 caractères et non 2).
Prévoir des modalités sécurisées lorsque l’application permet le dépôt de fichiers.
Prévoir dans les applications une mention de mise en garde contre un contenu abusif, pour toutes les zones de texte libre.
Prévoir une page Mentions légales dès lors que l’application contient des données personnelles.

De façon générale, il faut se référer au guide RGPD fourni par la CNIL : https://github.com/LINCnil/Guide-RGPD-du-developpeur

Frameworks préconisés

Quelques considérations sur les frameworks

Le framework sont des cadres de développement qui permettant de définir de manière standardisée l'architecture d’une application. Les développeurs peuvent focaliser leur travail sur la conception de la couche métier de l’application, le framework prenant en charge un ensemble de tâches techniques récurrentes telles que :

l'accès aux données
l'internationalisation
la journalisation des événements (logging)
la sécurité (authentification et gestion des rôles)
le paramétrage de l'application

La mise en oeuvre d'un framework permet notamment :

de capitaliser le savoir-faire sans "réinventer la roue"
d'accroître la productivité des développeurs une fois le framework pris en main
d'homogénéiser les développements des applications en assurant la réutilisation de composants fiables
de faciliter la maintenance notamment évolutive des applications

Framework Spring pour les applications serveurs (Java)

Le framework qui s'est imposé ces dix dernières années est Spring. Il est très largement utilisé dans le monde Java, ce qui en fait un standard de fait et constitue une certaine garantie sur la pérennité du framework. Spring propose une très bonne intégration avec d'autres frameworks open source comme Hibernate ou des standards de Java (Servlets, JMS, JDO etc.) Toutes les fonctionnalités de Spring peuvent s'utiliser dans un serveur Java EE et pour la plupart dans un simple conteneur web ou une application standalone.

Les fonctionnalités offertes par Spring sont très nombreuses et les sujets couverts ne cessent d'augmenter au fur et mesure des nouvelles versions et des nouveaux projets ajoutés au portfolio.

La documentation de Spring est complète et régulièrement mise à jour lors de la diffusion de chaque nouvelle version. La mise en oeuvre de Spring n'est pas toujours aisée, car il existe généralement plusieurs solutions pour implémenter une fonctionnalité. Nous essayons autant que possible de réutiliser des architectures validées dans nos différents projets.

A noter qu'il n'est pas rare que les livrables aient une taille importante du fait des nombreuses librairies requises par Spring et ses dépendances.

Framework VueJs pour les applications clientes (CSS/Javascript)

Les frameworks Javascript permettent de construire des applications s'exécutant essentiellement dans le navigateur web en minimisant les échanges avec la partie serveur. Ce fonctionnement permet d'obtenir une expérience utilisateur plus fluide et riche. Côté développeur, ces frameworks ajoutent une couche d'abstraction qui manquait dans l'univers Javascript. Actuellement les frameworks Javascript les plus populaires sont React, Angular et VueJs.
Nous avons fait le choix de VueJs pour sa légèreté et facilité à prendre à main. Nous utilisons également Vuetify qui propose une galerie de composants graphiques. Ce framework implémente le modèle MVVM (modèle-vue-vue-modèle) via un système de binding qui permet d'échanger instantanément des données entre le modèle et la vue.

Technique du "cache busting" pour les applications clients pas encore en VueJS

Il est préconisé de mettre en place la technique du cache busting pour les applications HTML/CSS/JS qui n'utilisent pas encore VueJS. Cette technique permet de palier les problèmes de mise en cache des "vieilles" ressources statiques (CSS/JS) lorsque l'on publie une nouvelle version de l'application (et évite par exemple de demander aux utilisateurs de faire CTRL+F5 pour avoir la bonne version des ressources). Cette technique consiste à ajouter le numéro de version ou le hash du dernier commit dans l'URL de la CSS/JS au moment de l'inclusion ou bien d'y indiquer une valeur arbitraire qui est modifiée au moment où la ressource statique CSS/JS a été modifiée.

Voici un exemple sur IdRef avant la mise en place du cache busting :

<link rel="stylesheet" type="text/css" href="css/style.css" title="style" media="screen"/>

Et voici ce que cela donne après la mise en place du cache busting :

<link rel="stylesheet" type="text/css" href="css/style.css?v1" title="style" media="screen"/>

Dette technique​

Types de projets​

Applications Web​

Application Batch​

Nom d'un projet/application​

Configuration d'un projet​

Configuration d'un projet avec docker​

Configuration d'une application docker​

Déploiement d'une application docker​

Configuration des logs des conteneurs dockers​

stderr stdout​

paramètres pour filebeat - labels docker​

format pour les log personnalisées​

Bonnes pratiques de programmation​

Frameworks préconisés​

Quelques considérations sur les frameworks​

Framework Spring pour les applications serveurs (Java)​

Framework VueJs pour les applications clientes (CSS/Javascript)​

Technique du "cache busting" pour les applications clients pas encore en VueJS​