# language: fr @moderation @processing Fonctionnalité: Traitement des signalements par l'IA et les modérateurs # 14.2 - Traitement des signalements Contexte: Étant donné que le système de modération est actif # 14.2.1 - IA pré-filtre (Whisper + NLP) Scénario: Signalement ajouté à la file d'attente asynchrone Étant donné qu'un utilisateur envoie un signalement pour un contenu audio Quand le signalement est reçu Alors le signalement est ajouté à la file d'attente asynchrone Et un worker de traitement est déclenché Et le traitement se fait en arrière-plan sans bloquer l'utilisateur Scénario: Transcription automatique avec Whisper large-v3 Étant donné qu'un contenu audio signalé dure 5 minutes Quand le worker de traitement démarre Alors le système utilise Whisper large-v3 pour transcrire l'audio Et la transcription est en self-hosted (pas de service cloud) Et le texte transcrit est enregistré en base de données Et le délai de transcription est de 1-3 minutes Plan du Scénario: Délai de transcription selon durée audio Étant donné qu'un contenu audio signalé dure minutes Quand le système transcrit l'audio Alors la transcription prend environ Exemples: | duree | delai | | 2 | 1-3 minutes | | 10 | 3-10 minutes | | 45 | 10-20 minutes | Scénario: Analyse automatique du contenu transcrit Étant donné que la transcription audio est terminée Quand le système analyse le texte transcrit Alors les analyses suivantes sont effectuées: | analyse | technologie | | Analyse de sentiment | distilbert-base-uncased | | Détection de haine | facebook/roberta-hate-speech | | Mots-clés interdits | Liste noire FR/EN + regex | Et chaque analyse génère un score de confiance (0-100%) Scénario: Génération du score de confiance IA Étant donné que toutes les analyses sont terminées Quand le système calcule le score final Alors un score de confiance IA entre 0-100% est généré Et le score indique la probabilité que le contenu viole les règles Et la catégorie la plus probable est identifiée Et les timestamps des passages problématiques sont extraits Scénario: Détection automatique de contenu clairement inapproprié Étant donné qu'un contenu contient des insultes graves et répétées Quand l'IA analyse la transcription Alors le score de confiance IA est >95% Et la catégorie détectée est "Haine & violence" Et les passages problématiques sont identifiés avec timestamps précis: | timestamp | durée | texte problématique | score confiance | | 02:15 | 12s | [insulte discriminatoire] | 97% | | 03:42 | 18s | [propos haineux] | 95% | Et chaque passage problématique a un timestamp de début et de fin Et le signalement est classé en priorité CRITIQUE Et les timestamps sont utilisés pour générer les marqueurs audio dans le dashboard modérateur # 14.2.2 - Délais de traitement (SLA) Plan du Scénario: SLA selon priorité du signalement Étant donné qu'un signalement a une priorité "" Quand le signalement entre en file d'attente Alors le délai de traitement cible est "" Et le responsable du traitement est "" Exemples: | priorite | delai | responsable | | CRITIQUE | <2h (24/7) | Modérateur senior (astreinte) | | HAUTE | <24h (jours ouvrés) | Modérateur junior/senior | | MOYENNE | <24h (jours ouvrés) | Modérateur junior | | BASSE | <72h (jours ouvrés) | Modérateur junior | Scénario: Traitement automatique pour score IA >95% Étant donné qu'un signalement a un score IA de 97% Et que la catégorie détectée est "Spam" (évidente) Quand le système évalue le signalement Alors une action automatique immédiate est déclenchée Et le contenu est retiré automatiquement Et le créateur est notifié de la modération Et le créateur peut faire appel de la décision Et un modérateur senior vérifie l'action a posteriori Scénario: Signalement CRITIQUE traité en moins de 2h Étant donné qu'un signalement de priorité CRITIQUE est reçu à 14:00 Et que le contenu concerne une menace de violence Quand le signalement est assigné à un modérateur senior d'astreinte Alors le modérateur est alerté immédiatement (push + SMS) Et le signalement est traité avant 16:00 (2h) Et une décision est prise et appliquée Et les autorités peuvent être contactées si nécessaire Scénario: Astreinte modérateur 24/7 pour signalements CRITIQUES Étant donné qu'un signalement CRITIQUE est reçu un dimanche à 03:00 Quand le signalement est classé en priorité CRITIQUE Alors le modérateur senior d'astreinte est alerté Et le signalement est traité dans les 2h (avant 05:00) Et le service d'astreinte garantit une disponibilité 24/7 Scénario: Signalement HAUTE priorité traité en moins de 24h Étant donné qu'un signalement de priorité HAUTE est reçu lundi à 10:00 Et que le contenu concerne du harcèlement Quand le signalement entre en file d'attente Alors le signalement est assigné à un modérateur (junior ou senior) Et le signalement est traité avant mardi 10:00 (24h jours ouvrés) Et une décision est prise et appliquée Scénario: Signalement BASSE priorité traité en moins de 72h Étant donné qu'un signalement de priorité BASSE est reçu lundi à 10:00 Et que le contenu concerne des tags incorrects Quand le signalement entre en file d'attente Alors le signalement est traité avant jeudi 10:00 (72h jours ouvrés) Et un modérateur junior peut traiter ce type de signalement # 14.2.3 - Priorisation automatique Scénario: Calcul du score de priorité Étant donné qu'un signalement a les caractéristiques suivantes: | caractéristique | valeur | | Score IA | 85% | | Signalements cumulés | 3 | | Fiabilité du signaleur | 75% | Quand le système calcule la priorité Alors la formule appliquée est: """ Priorité = (Score_IA × 0.7) + (Signalements_cumulés × 0.2) + (Fiabilité_signaleur × 0.1) """ Et le score de priorité est: (85 × 0.7) + (3 × 0.2) + (75 × 0.1) = 67.5 Et le signalement est classé en priorité MOYENNE Plan du Scénario: Classification selon score de priorité Étant donné qu'un signalement a un score de priorité de Quand le système classe le signalement Alors la priorité assignée est "" Et le signalement entre dans la file "" Exemples: | score | priorite | file | | 95 | CRITIQUE | Immédiate | | 82 | HAUTE | Prioritaire | | 55 | MOYENNE | Normale | | 25 | BASSE | Différée | Scénario: Boost de priorité avec signalements cumulés Étant donné qu'un contenu a été signalé par 1 utilisateur avec un score IA de 60% Et que le signalement est classé en priorité MOYENNE (score 42) Quand 5 autres utilisateurs signalent le même contenu Alors le nombre de signalements cumulés passe à 6 Et le score de priorité augmente significativement Et le signalement peut passer en priorité HAUTE Et le traitement est accéléré Scénario: Impact de la fiabilité du signaleur Étant donné qu'un utilisateur de confiance (90% fiabilité) envoie un signalement Et qu'un utilisateur suspect (20% fiabilité) envoie un signalement similaire Quand le système calcule les priorités Alors le signalement de l'utilisateur de confiance a un score plus élevé Et son signalement est traité en priorité Et le signalement de l'utilisateur suspect est traité plus tard Scénario: Évolution du score de fiabilité du signaleur Étant donné qu'un utilisateur a envoyé 10 signalements Et que 8 d'entre eux ont été acceptés par les modérateurs Quand le système calcule son score de fiabilité Alors le score est de 80% (8 acceptés / 10 total) Et ses futurs signalements auront plus de poids Et il peut devenir "utilisateur de confiance" # File d'attente intelligente Scénario: Files d'attente séparées par priorité Étant donné que 50 signalements sont en attente Quand le système organise la file d'attente Alors les signalements sont répartis dans les files suivantes: | file | nombre | priorité | | Immédiate (24/7) | 5 | CRITIQUE | | Prioritaire | 15 | HAUTE | | Normale | 20 | MOYENNE | | Différée | 10 | BASSE | Et les modérateurs traitent en priorité la file Immédiate Scénario: Modérateurs assignés selon compétences Étant donné qu'un signalement complexe de harcèlement est reçu Quand le système assigne un modérateur Alors un modérateur senior est prioritairement assigné Et les modérateurs juniors peuvent traiter les cas simples (spam, tags) Et les modérateurs seniors traitent les cas complexes (haine, violence, appels) # Technologies opensource Scénario: Stack technique 100% opensource Étant donné que le système de modération IA est déployé Quand on analyse les technologies utilisées Alors toutes les technologies sont opensource: | composant | technologie | hébergement | | Transcription | Whisper large-v3 | Self-hosted | | Analyse sentiment | distilbert-base-uncased | Self-hosted | | Détection haine | facebook/roberta-hate-speech | Self-hosted | | Mots-clés interdits | Liste noire FR/EN + regex | PostgreSQL | Et aucune dépendance à Google, AWS, Azure # Coût infrastructure Plan du Scénario: Coût selon phase du projet Étant donné que RoadWave est en phase "" Quand on calcule le coût de l'infrastructure IA Alors le coût mensuel est "" Exemples: | phase | cout | | MVP | 0-50€ (CPU) | | Scale | 50-200€ (GPU VPS) | Scénario: Processing asynchrone en MVP avec CPU Étant donné que RoadWave est en phase MVP Et que le volume est <1000 signalements/mois Quand le système traite les signalements Alors un serveur CPU standard est suffisant Et le coût est de 0€ (serveur existant) Et le processing asynchrone absorbe les pics de charge Et les délais restent acceptables (1-20 minutes) Scénario: Scaling avec GPU pour gros volumes Étant donné que RoadWave reçoit >1000 signalements/jour Quand le système nécessite un scaling Alors un VPS avec GPU est requis Et le coût passe à 50-200€/mois Et les délais de transcription sont divisés par 5-10 Et le système peut gérer 10 000+ signalements/mois # Logs et audit Scénario: Logs d'audit pour chaque traitement Étant donné qu'un signalement est traité Quand une action est prise (rejet, acceptation, sanction) Alors un log d'audit complet est créé: | champ | description | | signalement_id | ID unique du signalement | | content_id | ID du contenu signalé | | ia_score | Score de confiance IA | | ia_category | Catégorie détectée par IA | | priority | CRITIQUE / HAUTE / MOYENNE / BASSE | | moderator_id | ID du modérateur assigné | | action_taken | Retiré / Rejeté / Strike | | processing_time | Durée du traitement | | timestamp | Date et heure de la décision | Et le log est conservé pour conformité DSA Et les logs sont anonymisés après 3 ans (RGPD) # Conformité DSA Scénario: Traçabilité complète pour conformité DSA Étant donné que le système de modération est actif Quand un audit DSA est effectué Alors toutes les actions de modération sont tracées Et les délais de traitement sont mesurés et respectés Et les décisions sont justifiées et documentées Et la transparence vis-à-vis des utilisateurs est garantie Et le système est conforme au Digital Services Act