• 14 déc. 2023
  • 2 min read

Speech to document - création de procès-verbal pour les collectivités

Introduction

En 2022, l'article L2121-15 du code général des collectivités territoriales a introduit une nouvelle obligation pour les collectivités :

  • le procès-verbal d'une séance doit être arrêté lors de la séance suivante
  • il doit être publié dans la semaine suivante la séance au cours de laquelle il a été arrêté

Le respect de cette réglementation nécessite d'ajuster le processus de réalisation des procès-verbaux, notamment dans les collectivités où cette tâche n'était pas priorisée.

Au moment de la création du projet, en 2024, la CTM collectivité majeure de la Martinique avait régulièrement un retard dans la publication des procès-verbaux autour d'une année.

Exemple de délibération : la séance du 1er février 2024 arrête le procès verbal de la séance du 25 mai 2023. L'arrêté est publié document est publié 8 semaines plus tard. Source : site de la CTM (archive.org)

Réalisation

Le projet a consisté à découper la réalisation d'un procès verbal en plusieurs parties :

IA : transcription et reconnaissance du locuteur

A partir d'un modèle ouvert (whisper) et d'une source audio, la source audio est transformée en texte.

Simultanément, la source audio est découpée par locuteur. Ce locuteur est identifié en utilisant une base de locuteurs connus ; s'il n'est pas connu, il est ajouté à la base des locuteurs.

Edition collaborative

Une interface web utilisateur permets de synchroniser le contenu multimédia à la transcription. Cette transcription peut alors être corrigée simultanément par plusieurs éditeurs (CRDT) avec les objectifs suivants :

  • un besoin de correction aussi limité que possible
  • une procédure d'édition très rapide, idéalement proche du temps du contenu

Production du document

Une fois le document corrigée, il est alors intégré au sein d'un système de template pour produire :

  • une page web
  • une sortie markdown
  • une sortie latex qui sera ensuite compilée en PDF pour archivage.

Exemple de transcription des séances du 23 et 24 mars 2023 Transcription des séances du 23 et 24 mars 2023, fourni à la CTM à J+1