Soutenances autorisées pour l'ED ED 590 MIIS

Sécurité d'un système d'authentificatiοn biοmétrique basé sur les cοdes cοrrecteurs d'erreurs

Doctorant·e: MAJBOUR Sara
Direction de thèse: LE BARS Jean Marie (Directeur·trice de thèse)
Date de la soutenance: 18/07/2025 à 10:00
Lieu de la soutenance: le campus 2 Bât sciences 3 Boulevard du Maréchal Juin CS 14032 · 14032 Caen cedex 05
Rapporteurs de la thèse: CANARD Sebastien Telecom Paris
CAYREL PIERRE-LOUIS Université Jean Monnet, Saint-Etienne
Membres du jurys: BARBIER Morgan, , UCN - Université de Caen Normandie
CANARD Sebastien, , Telecom Paris
CAYREL PIERRE-LOUIS, , Université Jean Monnet, Saint-Etienne
CHARRIER Christophe, , UCN - Université de Caen Normandie
LE BARS Jean Marie, , UCN - Université de Caen Normandie
MINIER MARINE, , Université de Lorraine

Résumé: Cette thèse étudie les limites et les améliorations possibles du schéma original du \textit{Fuzzy Vault}, proposé par Juels et Sudan pour l'authentification biométrique. Ce schéma repose sur la transformation des templates en ensembles non ordonnés, ce qui empêche l'accès direct aux données biométriques et limite l'exposition des informations sensibles. Cependant, sa structure introduit des biais exploitables compromettant la sécurité des ensembles stockés. De plus, l’utilisation des codes correcteurs dans ce contexte soulève des questions quant à leur adaptation et leur impact sur la capacité du système à tolérer les variations biométriques. Nous montrons que l'exploitation de ces biais réduit la sécurité du \textit{Fuzzy Vault}. Une analyse sur trois bases de données biométriques de différentes modalités et qualités évalue la vulnérabilité du schéma face à ces attaques. Nous proposons une contre-mesure n'utilisant pas d'informations supplémentaires pour limiter ces faiblesses. La transformation des templates en ensembles pose des difficultés liées à la structure du schéma et à la gestion de la confidentialité. Nous définissons une construction générique applicable à tout template biométrique, respectant les contraintes d'authentification, de sécurité et de confidentialité. Enfin, le schéma original repose sur les codes de Reed-Solomon. Nous généralisons cette approche en définissant les opérations de codage et de décodage pour d'autres codes linéaires, en précisant les contraintes liées à leur choix et leur impact sur l'authentification.
Abstract: This thesis examines the limitations and possible modifications of the original \textit{Fuzzy Vault} scheme, proposed by Juels and Sudan for biometric authentication. This scheme transforms templates into unordered sets, preventing direct access to biometric data and limiting the exposure of sensitive information. However, its structure introduces exploitable biases that compromise the security of stored sets. Additionally, the use of error correction codes in this context raises questions about their adaptability and their impact on the system's ability to tolerate biometric variability. We show that exploiting these biases reduces the security of the \textit{Fuzzy Vault}. An analysis on three biometric datasets of different modalities and quality levels assesses the scheme’s vulnerability to such attacks. We propose a countermeasure that does not require additional information to mitigate these weaknesses. The transformation of templates into sets presents structural challenges related to the scheme’s design and data privacy. We define a generic construction applicable to any biometric template while maintaining authentication, security, and confidentiality constraints. Finally, the original scheme relies on Reed-Solomon codes. We generalize this approach by defining encoding and decoding operations for other linear codes, specifying the constraints related to their selection and their impact on authentication.

Cοmbinatοrics οf cactus grοups, interesting subgrοups and generalisatiοns

Doctorant·e: CHEMIN Hugo
Direction de thèse: GUASCHI John (Directeur·trice de thèse)
BELLINGERI Paolo (Co-directeur·trice de thèse)
Date de la soutenance: 11/07/2025 à 15:00
Lieu de la soutenance: Caen
Rapporteurs de la thèse: AUDOUX BENJAMIN Aix-Marseille université
KAMNITZER JOËL MC GILL UNIVERSITE MC GILL QUEBEC
Membres du jurys: AUDOUX BENJAMIN, , Aix-Marseille université
BELLINGERI Paolo, , UCN - Université de Caen Normandie
FROMENTIN Jean, , ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
GUASCHI John, , UCN - Université de Caen Normandie
HALACHEVA IVA, , Université Northeastern
KAMNITZER JOËL, , MC GILL UNIVERSITE MC GILL QUEBEC
LEBED Victoria, , UCN - Université de Caen Normandie

Résumé: Dans cette thèse, nous nous intéressons à l'étude des groupes de cactus, de certains de leurs sous-groupes et de leurs extensions. Les groupes de cactus ont été introduits par Devadoss sous le nom de `quasi-tresses' et sont reliés aux catégories de cobordisme et aux espaces de modules. Par ailleurs, leurs similitudes avec les groupes de tresses et les groupes de Coxeter ont mené à l'étude de familles de groupes généralisant les groupes de cactus. Nous étudions donc les propriétés combinatoires des groupes de cactus, tel que l'existence d'une solution au problème du mot, d'éléments centraux ou d'éléments possédant de la torsion. Par ailleurs, nous nous intéresserons à certains sous-groupes remarquables, tel que les groupes de cactus purs, pour lesquels nous étudions des questions similaires à celles posées pour les groupes de cactus. De plus, nous donnons une nouvelle présentation des groupes de cactus, ce qui nous permet de construire certains quotients remarquables, ainsi que de calculer les quotients de la série centrale descendante des groupes de cactus. Enfin, nous nous intéressons aux propriétés combinatoires d'une extension des groupes de cactus, nommée groupe de cactus affine, pour lesquels nous étudions des questions similaires à celles posées pour les groupes de cactus.
Abstract: In this thesis, we are interested in the study of cactus groups, some of their subgroups and their extensions. Cactus groups were introduced by Devadoss under the name `quasi-braids' and are related to cobordism categories and moduli spaces. Moreover, their similarities with braid groups and Coxeter groups have led to the study of families of groups generalizing cactus groups. We therefore study the combinatorial properties of cactus groups, such as the existence of a solution to the word problem, central elements or elements possessing torsion. Furthermore, we will be interested in some remarkable subgroups, such as pure cactus groups, for which we study questions similar to those asked for cactus groups. In addition, we give a new presentation of cactus groups, which allows us to construct some remarkable quotients, as well as to compute the quotients of the lower central series of cactus groups. In the last chapter of this thesis, we discuss the combinatorial properties of an extension of cactus groups, called the affine cactus group, for which we study questions similar to those posed for cactus groups.

Unsupervised Learning-based Ιnfοrmatiοn Retrieval Applied tο Spοt Ρatterns in Ηistοrical Dοcument Ιmages

Doctorant·e: ASSAKER Joseph
Direction de thèse: HEUTTE LAURENT (Directeur·trice de thèse)
Date de la soutenance: 04/07/2025 à 10:00
Lieu de la soutenance: Université de Rouen Normandie - Site Madrillet
Rapporteurs de la thèse: AUBRY MATHIEU Ecole des Ponts Paristech
MOKRAOUI ANISSA UNIVERSITE PARIS 13 PARIS-NORD
Membres du jurys: AUBRY MATHIEU, , Ecole des Ponts Paristech
EGLIN VERONIQUE, , Institut National des Sciences Appliquees de Lyon
HEUTTE LAURENT, , URN - Université de Rouen Normandie
MOKRAOUI ANISSA, , UNIVERSITE PARIS 13 PARIS-NORD
NICOLAS STEPHANE, , URN - Université de Rouen Normandie

Résumé: Les documents historiques possèdent une valeur culturelle immense, mais leur exploitation soulève de nombreux défis en matière d’accès à l’information et d’analyse. Cette thèse s’intéresse à deux tâches spécifiques dans le contexte des images de documents historiques : la recherche de sous-images (sub-image retrieval) et la détection de motifs (pattern spotting). La recherche de sous-images consiste à retrouver les images contenant une requête image donnée, tandis que la détection de motifs va plus loin en localisant les occurrences de cette requête image au sein des images retrouvées. Ces tâches présentent deux défis majeurs : i) les requêtes de recherche sont arbitraires et ne se limitent pas à un ensemble prédéfini de motifs, ce qui impose à l’approche proposée de pouvoir traiter des requêtes non connues à l’avance ; ii) la plupart des méthodes modernes d’apprentissage profond reposent sur des données annotées, qui sont rares, voire inexistantes, dans le domaine des documents historiques. En raison de ces contraintes, les travaux antérieurs sur ces tâches se sont limités à des approches sans apprentissage, s’appuyant uniquement sur des réseaux pré-entraînés disponibles. Dans cette thèse, nous proposons la première approche basée sur l’apprentissage pour traiter ces problématiques. Cela implique de relever le défi de concevoir une solution d’apprentissage dans un contexte sans données d’entraînement disponibles et sans ensemble fixe de motifs à détecter ou à retrouver. Notre objectif est d’ouvrir une nouvelle voie pour aborder ces tâches, que nous considérons comme plus évolutive et pérenne, car l’apprentissage de représentations spécifiques au domaine et à la tâche devrait permettre des solutions plus flexibles et adaptables. À cette fin, nous développons un nouveau modèle pour le repérage de motifs, nommé OS-DETR. Ce modèle adapte l’architecture performante DETR, à base de transformeurs et initialement conçue pour la détection d’objets, afin de répondre aux tâches de recherche de sous-image et de détection de motifs. Pour pallier le manque de données étiquetées, nous proposons une méthode simple de génération de données synthétiques annotées, adaptées à ces tâches. Ces données synthétiques sont ensuite utilisées pour entraîner notre modèle OS-DETR, et différentes variantes et choix de conception sont explorés. Un ensemble de techniques de généralisation est ensuite introduit, visant à améliorer les performances du modèle au-delà du domaine synthétique. Ces techniques interviennent à plusieurs niveaux du pipeline, allant de l’architecture du modèle et des stratégies d’entraînement jusqu’à la génération des données synthétiques et les étapes de post-traitement. Nous montrons l'impact de ces techniques et le bien fondé de notre démarche via de nombreuses expérimentations, à la fois sur un ensemble de tests générés synthétiquement, et sur un ensemble de données de référence publiquement disponible pour les images de documents historiques. Enfin, nous présentons des expérimentations préliminaires explorant une approche alternative pour la génération de données d’entraînement, ouvrant ainsi des perspectives de recherche prometteuses.
Abstract: Historical documents hold immense cultural value, yet working with them poses numerous challenges for information access and analysis. This thesis addresses two such tasks in the context of historical document images: sub-image retrieval and pattern spotting. While sub-image retrieval involves retrieving images that contain a given query image, pattern spotting extends this further by localizing occurrences of that query image within the retrieved images. These tasks present two major challenges: i) search queries are arbitrary and not limited to a predefined set of patterns, requiring the proposed approach to handle previously unseen queries; ii) most modern deep learning methods rely on labeled training data, which is scarce or nonexistent in the domain of historical documents. Due to these constraints, prior work on these tasks has been limited to learning-free approaches, relying exclusively on off-the-shelf pre-trained networks. In this thesis, we propose the first learning-based approach to address these tasks. This involves the challenge of developing a learning-based solution in a setting with no available training data and no fixed set of patterns to detect or retrieve. Our aim is to open a new direction for tackling these problems — one that we believe is more scalable and future-proof, as learning task-specific and domain-specific representations should enable more flexible and adaptable solutions. To this aim, we develop a novel model for pattern spotting, dubbed OS-DETR. This model adapts the competitive transformer-based DETR architecture, originally designed for object detection, to address the tasks of sub-image retrieval and pattern spotting. To overcome the scarcity of labelled data, we propose a simple technique for generating annotated synthetic data tailored to these tasks. This synthetic data is then used to train our OS-DETR model, and we investigate various design choices and their impact. A set of generalization techniques is then introduced, that aims to improve the performance of the model beyond the source domain. These techniques span multiple aspects of the pipeline, from adjustments to the model architecture and training schedule to improvements in synthetic data generation and post-processing strategies. We show the impact of these techniques and the validity of our approach via numerous experiments, both on a synthetically generated testing set as well as on a publicly available benchmark dataset for historical document images. Finally, we present preliminary experiments exploring an alternative approach to training data generation, which opens promising avenues for future research.

Décimatiοn hiérarchique pοur l'apprentissage sur graphes

Doctorant·e: STANOVIC Stevan
Direction de thèse: BRUN Luc (Directeur·trice de thèse)
Date de la soutenance: 27/06/2025 à 13:00
Lieu de la soutenance: Salle des thèses
Rapporteurs de la thèse: LLADOS CANET JOSEP l'Université autonome de Barcelone
RAMEL JEAN-YVES Université Savoie Mont Blanc
Membres du jurys: BRUN Luc, , ENSICAEN
GAUZERE BENOIT, , INSA Rouen Normandie
LLADOS CANET JOSEP, , l'Université autonome de Barcelone
RAMEL JEAN-YVES, , Université Savoie Mont Blanc
SOLNON CHRISTINE, , Institut National des Sciences Appliquees de Lyon

Résumé: Cette thèse s’intéresse au pooling hiérarchique dans les réseaux de neurones sur graphes (GNNs), une opération essentielle visant à réduire la taille des graphes tout en préservant leurs informations pertinentes. Les méthodes existantes reposent généralement soit sur la sélection d’un sous-ensemble de sommets, en supprimant les autres, soit sur un regroupement peu contraint, ignorant la structure initiale du graphe. Ces approches souffrent de plusieurs limitations : perte d’information, absence de prise en compte de la structure initiale du graphe, et densification excessive des graphes réduits. Par ailleurs, les GNNs profonds sont confrontés à deux phénomènes majeurs : l’over-smoothing, où les représentations des sommets tendent à converger vers une représentation prédéterminée, indépendamment de leurs représentations initiales, et l’over-squashing, qui désigne la difficulté à propager efficacement des informations sur de longues distances dans le graphe. Dans ce manuscrit, nous proposons plusieurs méthodes de pooling hiérarchique fondées sur les ensembles indépendants maximaux, qui permettent de respecter la structure du graphe tout en préservant les attributs des sommets. Par ailleurs, nous fournissons une étude théorique et empirique de ces approches, en mettant en lumière leur impact positif sur les phénomènes d’over-smoothing et d’over-squashing. Nos résultats expérimentaux confirment non seulement l’intérêt de l’utilisation d’ensembles indépendants maximaux pour définir des opérations de pooling, mais démontrent également leur rôle crucial dans l’atténuation de l’over-smoothing et de l’over-squashing.
Abstract: This thesis focuses on hierarchical pooling in graph neural networks (GNNs), a key operation aimed at reducing the size of graphs while preserving their relevant information. Existing methods typically rely either on selecting a subset of vertices, discarding the others, or on loosely constrained clustering, which ignores the original graph structure. These approaches suffer from several limitations : loss of information, lack of consideration for the original graph structure, and excessive densification of the reduced graphs. Moreover, deep GNNs face two major phenomena : over-smoothing, where node representations tend to converge towards a predetermined representation regardless of their initial features, and over-squashing, which refers to the difficulty in efficiently propagating information across long distances within the graph. In this manuscript, we propose several hierarchical pooling methods based on maximal independent sets, which preserve the graph structure while maintaining vertex attributes. Additionally, we provide a theoretical and empirical study of these approaches, highlighting their positive impact on over-smoothing and over-squashing. Our experimental results not only confirm the value of using maximal independent sets for defining pooling operations but also demonstrate their crucial role in mitigating over-smoothing and over-squashing.

Sοficity οf multidimensiοnal subshifts

Doctorant·e: CALLARD Antonin
Direction de thèse: VANIER Pascal (Directeur·trice de thèse)
Date de la soutenance: 24/06/2025 à 14:30
Lieu de la soutenance: campus 2
Rapporteurs de la thèse: KARI JARKKO TURKU - UNIVERSITY OF TURKU
ROMASHCHENKO ANDREI Université de Montpellier
Membres du jurys: KARI JARKKO, , TURKU - UNIVERSITY OF TURKU
LABBÉ SÉBASTIEN, , Universite de Bordeaux
MARCOVICI IRENE, , URN - Université de Rouen Normandie
OLLINGER NICOLAS, , Université d'Orléans
ROMASHCHENKO ANDREI, , Université de Montpellier
THEYSSIER GUILLAUME, , Aix-Marseille université
VANIER Pascal, , UCN - Université de Caen Normandie

Résumé: En dynamique symbolique, un sous-shift multidimensionnel est un language formel de coloriages infinis de l'espace discret défini en termes de motifs interdits. Comme les langages de mots finis, pour lesquels ont été définies des classes de complexité (qui incluent classiquement les langages locaux, rationnels, algébriques ou calculablement énumérables…) en fonction de l'expressivité des différentes machines qui les reconnaissent (respectivement : les automates locaux, les automates finis, les automates à piles et les machines de Turing), les sous-shifts ont été classifiés en sous-shifts de types finis (définis par des familles finies de motifs interdits), sous-shifts effectifs (définis par des familles calculablement énumérables) et sous-shifts sofiques : ces derniers forment une classe intermédiaire entre les deux précédentes, et sont définis comme les images morphiques des sous-shifts de types finis par des automates cellulaires. Nous nous intéressons à la question suivante : quand un sous-shift donné est-il sofique ? Autrement dit, comment prouve-t-on (ou réfute-t-on) la soficité d'un sous-shift ? Si cette question est résolue en dimension 1 (les sous-shifts sofiques en dimension 1 étant similaires aux langages rationnels, le théorème de Myhill-Nerode caractérise la soficité en dimension 1 par comptage du nombre de « contextes »), décrire la frontière entre les sous-shifts multidimensionnels sofiques et effectifs reste un problème ouvert en dynamique symbolique. Cette thèse se divise en deux parties indépendantes, précédées de chapitres préliminaires d'introduction et de définitions des notions étudiées (de dynamique symbolique, calculabilité…). Dans la première partie, nous étudions les ensembles d'extensions des sous-shifts multidimensionnels (qui, informellement, comptent les classes de motifs qui peuvent être librement échangés dans les configurations d'un sous-shift) selon leur (in)calculabilité : en particulier, nous prouvons que les entropies d'extensions des sous-shifts (i.e. le taux de croissance du nombre d'ensemble d'extensions) peuvent être entièrement caractérisées calculablement dans la hiérarchie arithmétique des nombres réels, le niveau précis dépendant de la complexité et des propriétés dynamiques vérifiées par le sous-shift considéré. Dans la seconde partie, nous prouvons une condition suffisante pour la soficité des sous-shifts multidimensionnels s'appuyant sur une quantification de « l'information utile » contenue dans les motifs : plus précisément, nous introduisons une notion de représentation inductive (qui, informellement, décrit l'information échangée par des motifs adjacents d'une taille donnée pour vérifier la validité locale d'une configuration), et nous prouvons qu'admettre des représentations calculables de petites complexité est une condition suffisante pour la soficité d'un sous-shift. Enfin, nous présentons ces résultats comme une complexité de communication sur des coloriages infinis, et argumentons que la complexité de communication non-déterministe forme un cadre riche pour l'étude de la soficité des sous-shifts multidimensionnels.
Abstract: In symbolic dynamics, a multidimensional subshift is a formal language of infinite colorings of the discrete space defined in terms of forbidden patterns. As languages of finite words have been classified into several complexity classes (which, classically, include the local regular, context-free, and computably enumerable languages…) depending on the expressiveness of the various devices used for their descriptions (respectively: local automata, finite automata, pushdown automata, Turing machines…), subshifts have been classified into subshifts of finite type (definied by finite families of forbidden patterns), effective subshifts (defined by computably enumerable families of forbidden patterns) and the sofic subshifts: the latter form an intermediary class, and are defined as the morphic images of subshifts of finite type by cellular automata. We are interested in the following question: when is a given subshift actually sofic? In other words, how does one prove or disprove the soficity of a subshift? While this question is entirely solved in the one-dimensional setting (as one-dimensional sofic subshifts are very similar to regular languages of finite words, the Myhill-Nerode theorem characterizes one-dimensional soficity by counting the number of possible “contexts”), describing the frontier between sofic and effective multidimensional subshifts is still an open problem in symbolic dynamics. This thesis is divided in two independent parts, with preliminary chapters of introduction and definitions of the relevant notions being considered (from symbolic dynamics, computability theory…). In the first part, we study the extender sets of multidimensional subshifts (which, informally, count the classes of patterns that can be freely exchanged in the configurations of a subshift) using computability theory: in particular, we prove that extender entropies of multidimensional subshifts (i.e. the growth rate of the number of extender sets) can be fully characterized computationally in the arithmetical hierarchy of real numbers, the precise level depending on the complexity and the dynamical properties verified by the considered subshifts. In the second part, we prove a sufficient condition for multidimensional soficity based on a quantification of the “useful information” contained in patterns: more precisely, we introduce a notion of inductive representations (which, informally, describe the information exchanged between adjacent patterns of a given size to check the local validity of a configuration), and prove that admitting computable representations of small complexity is a sufficient condition for soficity. Finally, we describe these results as a variant of communication complexity on infinite colorings, and argue that non-deterministic communication complexity is a fruitful context of the study of multidimensional soficity.

Equatiοns de Ηamiltοn-Jacοbi sur des graphes

Doctorant·e: ZANTOUT RITA
Direction de thèse: FORCADEL NICOLAS (Directeur·trice de thèse)
IBRAHIM HASSAN (Co-directeur·trice de thèse)
Date de la soutenance: 20/06/2025 à 14:00
Lieu de la soutenance: INSA Rouen, Amphi Marie Curie, 685 avenue de l'université 76801 SAINT ETIENNE DU ROUVRAY
Rapporteurs de la thèse: CARLINI ELISABETTA Sapienza Università di Roma, Italy
TOLEDO JULIAN University of Valencia, Espagne
Membres du jurys: BALLESTER COLOMA, , Universitat Pompeu Fabra in Barcelona, Espagne
CARLINI ELISABETTA, , Sapienza Università di Roma, Italy
ELMOATAZ ABDERRAHIM, , Université de Caen Normandie
FADILI JALAL, , Université de Caen Normandie
FORCADEL NICOLAS, , INSA Rouen Normandie
IGBIDA NOUREDDINE, , Université de Limoges
THORPE MATTHEW, , University of Warwick, Royaume Uni
TOLEDO JULIAN, , University of Valencia, Espagne

Résumé: Ce manuscrit s’intéresse à l’analyse mathématique rigoureuse d’équations aux dérivées partielles (EDP) posées sur des graphes et des variétés riemanniennes discrètes, avec un accent particulier sur les équations d’Eikonal et d’osmose. Ces équations apparaissent naturellement dans de nombreuses applications, notamment en traitement d’images, apprentissage semi-supervisé et physique mathématique. Nous développons d’abord une théorie de la solution de viscosité adaptée à un cadre non local pour l’équation d’Eikonal dans un domaine euclidien. Nous prouvons l’existence, l’unicité et la régularité des solutions pour les équations locales et non locales. Nous établissons ensuite des bornes d’erreur explicites entre les solutions des problèmes non locaux et leurs analogues locaux, à la fois en temps continu et sous discrétisation temporelle (Euler explicite et implicite). Ces résultats sont ensuite appliqués à des graphes pondérés aléatoires, démontrant que la solution discrète converge uniformément vers la solution de viscosité du problème local lorsque le nombre de sommets croît et que le pas de temps tend vers zéro. Le chapitre suivant étend cette analyse au cadre des variétés riemanniennes compactes, permettant de généraliser l’équation d’Eikonal à des graphes définis sur des espaces non-euclidiens. Sous des hypothèses naturelles sur la géométrie de la variété et l’échelle du noyau, nous prouvons la consistance des modèles non-locaux et la convergence quasi-sûre de la solution discrète vers la solution de viscosité locale, avec des bornes d’erreur explicites en fonction de la taille du graphe et du pas de temps. Enfin, le manuscrit traite de l’équation d’osmose, une EDP linéaire de type diffusion-transport asymétrique, couramment utilisée en traitement d’images. Nous introduisons une version non locale de ce modèle et démontrons sa bien-poséité. Nous établissons la convergence des solutions non locales vers celles du modèle local, puis nous proposons une discrétisation sur graphe qui conserve la positivité, la moyenne et l’unicité de l’état stationnaire. Des résultats numériques illustrent l’efficacité du modèle pour des tâches d’édition de couleur sur des maillages.
Abstract: This thesis presents a rigorous mathematical analysis of partial differential equations (PDEs) defined on graphs and discrete Riemannian manifolds, with a particular focus on Eikonal and osmosis equations. These equations are central in applications such as image processing, semi-supervised learning, and mathematical physics. We first develop a theory of viscosity solutions adapted to a nonlocal framework for the Eikonal equation posed on Euclidean domains. We establish existence, uniqueness, and regularity results for both local and nonlocal problems. We then derive explicit error bounds between the nonlocal and local solutions in both continuous and discretized time (using forward and backward Euler schemes). These results are extended to fully discretized nonlocal Eikonal problems defined on sequences of random weighted graphs, where we prove that under suitable scaling of the kernel, the discrete solutions converge uniformly almost surely to the viscosity solution of the local problem. Next, we generalize this analysis to compact Riemannian manifolds, allowing for Eikonal equations on graph structures embedded in non-Euclidean spaces. Under natural geometric and regularity assumptions, we prove that the nonlocal problem is well-posed, and we obtain convergence results with explicit rates as the number of graph nodes increases and the time step vanishes. Finally, the manuscript addresses the osmosis equation, a linear, non-symmetric diffusion-transport PDE originally motivated by physical osmosis and adapted for image analysis. We introduce a nonlocal version of the model and analyze its well-posedness and convergence toward the local version. A graph-based discretization is proposed, ensuring positivity, conservation of average intensity, and uniqueness of the steady state. Numerical simulations demonstrate its utility for color manipulation tasks on meshes.

Οptimal cοntrοl prοblems and Ηamiltοn-Jacοbi-Bellman equatiοns in sοme curved metric spaces

Doctorant·e: AUSSEDAT AVERIL
Direction de thèse: FORCADEL NICOLAS (Directeur·trice de thèse)
ZIDANI HOUSNAA (Co-directeur·trice de thèse)
Date de la soutenance: 19/06/2025 à 14:00
Lieu de la soutenance: INSA Rouen Normandie
Rapporteurs de la thèse: GIGLI NICOLA Scuola Internazionale Superiore di Studi Avanzati (SISSA), Trieste, Italie
MERIGOT QUENTIN Université Paris-Saclay
Membres du jurys: ACHDOU YVES, , Université Paris-Diderot
CARDALIAGUET PIERRE, , Université Paris-Dauphine
FORCADEL NICOLAS, , INSA Rouen Normandie
GIGLI NICOLA, , Scuola Internazionale Superiore di Studi Avanzati (SISSA), Trieste, Italie
JIMENEZ CHLOÉ, , Université de Bretagne Occidentale
MERIGOT QUENTIN, , Université Paris-Saclay
SANTAMBROGIO FILIPPO, , Université Claude Bernard Lyon 1
ZIDANI HOUSNAA, , INSA Rouen Normandie

Résumé: Cette thèse est dédiée aux problèmes de contrôle dans certains espaces non vectoriels, avec pour objectif d'en étendre le lien avec les équations de Hamilton-Jacobi-Bellman prises au sens de viscosité. Le choix des espaces considérés est guidé par le contrôle de populations évoluant sur un réseau routier. Dans un premier temps, nous considérons le cas d'un seul conducteur, pour reporter toute la difficulté sur l'irrégularité de l'espace ambiant. Nous proposons un cadre de résolution des problèmes de contrôle avec dynamique Cauchy-Lipschitz sur les espaces de type CAT(0), via lequel il est possible de donner des conditions suffisantes pour l'existence d'un contrôle optimal, et de caractériser la fonction valeur via une équation de Hamilton-Jacobi-Bellman. Dans un second temps, nous considérons cette fois une mesure de probabilité représentant une population de conducteurs sur un espace euclidien. Nous donnons un principe de comparaison applicable à des équations posées sur les mesures ; les arguments utilisés se transposent au cas plus général d'espaces à courbure bornée inférieurement au sens d'Alexandrov, et les résultats sont formulés dans ce cadre. Une troisième partie vient joindre les deux premières en s'intéressant au cas d'une mesure évoluant sur un réseau. Ce type d'espace n'est pas courbe, et les résultats des premiers chapitres ne s'y appliquent pas. Nous prouvons que le carré de la distance de Wasserstein est différentiable au sens directionnel, ce qui permet de généraliser la formulation au sens de viscosité des équations de Hamilton-Jacobi-Bellman des chapitres précédents. Enfin, une dernière partie développe certains résultats techniques nécessaires à l'emploi des équations de continuité dans la formulation des problèmes de contrôle, et plus généralement quelques résultats sur la géométrie induite par le transport optimal.
Abstract: The thesis studies optimal control problems in some spaces that are not vector spaces, with a focus on the link with Hamilton-Jacobi-Bellman equations understood in the viscosity sense. The red wire is the control of a population of drivers in a traffic network. At first, we focus on a single driver, addressing the difficulty of the lack of regularity of the ambient space. We propose a framework for Cauchy-Lipschitz control problems in CAT(0) spaces, in which we are able to give sufficient conditions for the existence of an optimal control, and characterize the value function as the unique viscosity solution to a Hamilton-Jacobi-Bellman equation. Secondly, we consider a probability measure evolving on the Euclidean space, representing a population of drivers. We obtain a comparison principle that is applicable to the control of such a population, that we prove in more generality in spaces with curvature bounded from below. Thirdly, we provide a first step towards the treatment of populations evolving on networks, by proving that the squared Wasserstein distance over a network is directionally differentiable. In formulating the Hamilton-Jacobi-Bellman equation in the Wasserstein space using solely the metric structure, one needs some technical argument to use continuity equations as characteristics; this is developed in a last chapter, focussing in more details about the geometry induced by optimal transport on measures.

Οn zeta and multizeta values in pοsitive characteristic

Doctorant·e: LE Khac Nhuan
Direction de thèse: NGO DAC Tuan (Directeur·trice de thèse)
Date de la soutenance: 18/06/2025 à 09:30
Lieu de la soutenance: Salle des thèses Campus 2 Bâtiment S3
Rapporteurs de la thèse: MAURISCHAT ANDREAS UNIVERSITE AACHEN ALLEMAGNE
OUKHABA HASSAN Université Besançon Franche Comté
Membres du jurys: ANGLES Bruno, , UCN - Université de Caen Normandie
CARUSO XAVIER, , Universite de Bordeaux
IM BO-HAE, , KAIST
MAURISCHAT ANDREAS, , UNIVERSITE AACHEN ALLEMAGNE
NGO DAC Tuan, , UCN - Université de Caen Normandie
OUKHABA HASSAN, , Université Besançon Franche Comté
PELLARIN Federico, , ROME - UNIVERSITA ROMA "LA SPIENZA"

Résumé: Dans cette thèse, nous étudions les valeurs zêta multiples dans les algèbres de Tate, telles qu'introduites par Pellarin. Récemment, Gezmis et Pellarin ont formulé une conjecture concernant l'injectivité d'une certaine application qui relie les valeurs zêta multiples de Pellarin aux valeurs zêta multiples en caractéristique positive. Nous déterminons d'abord la structure du noyau et de l'image de cette application. Puis, nous donnons une réponse à la conjecture de Gezmis et Pellarin. Enfin, nous montrons que les valeurs zêta multiples de Pellarin possèdent une structure d'algèbre.
Abstract: In this thesis, we study multiple zeta values in Tate algebras as introduced by Pellarin. Recently, Gezmis and Pellarin formulated a conjecture regarding the injectivity of a certain map that relates Pellarin's multiple zeta values to multiple zeta values in positive characteristic. We first determine the structure of the kernel and the image of this map. As a consequence, we provide an answer to the Gezmis-Pellarin conjecture. Finally, we show that Pellarin's multiple zeta values carry the structure of an algebra.

Aspects οf the p-adic Κudla prοgram fοr the unitary grοup GU(2, 1)

Doctorant·e: IUDICA Francesco Maria
Direction de thèse: NICOLE Marc-Hubert (Directeur·trice de thèse)
Date de la soutenance: 17/06/2025 à 14:00
Lieu de la soutenance: Université de Caen Normandie
Rapporteurs de la thèse: ANDREATTA FABRIZIO MILAN - UNIVERSITA DEGLI STUDI
FREIXAS I MONTPLET GÉRARD ECOLE POLYTECHNIQUE DE PALAISEAU
Membres du jurys: ANDREATTA FABRIZIO, , MILAN - UNIVERSITA DEGLI STUDI
FREIXAS I MONTPLET GÉRARD, , ECOLE POLYTECHNIQUE DE PALAISEAU
GEHRMANN LENNART, , Universität Bielefeld
LONGO MATTEO, , PADOUE -UNIVERSITA DEGLI STUDI DI PADOVA
NICOLE Marc-Hubert, , UCN - Université de Caen Normandie
PATI MARIA ROSARIA, , GENES - UNIVERSITA DI GENOVA
VONK JAN, , Universiteit Leiden

Résumé: Ce manuscrit explore quelques aspects du programme de Kudla p-adique pour les surfaces modulaires de Picard associées au groupe GU(2,1). En particulier, nous nous intéressons à la variation p-adique du théorème de Cogdell, qui est l'analogue du résultat célèbre de Hirzebruch et Zagier pour les surfaces modulaires de Hilbert. Cette thèse suit l'exemple de Longo--Nicole visant à relier le programme de Kudla aux familles p-adiques de Hida. Après avoir interpolé p-adiquement le relèvement de Kudla et son adjoint, nous construisons des cycles spéciaux de poids supérieurs sur des variétés de Kuga--Sato, et nous appliquons le formalisme de Loeffler, en obtenant des familles Lambda-adiques de classes de cohomologie de cycles spéciaux. Enfin, nous construisons une série génératrice Lambda-adique des "gros cycles" ci-dessus, qui a la propriété d'interpoler les formes modulaires étudiés par Cogdell.
Abstract: In this thesis, we explore some aspects of the p-adic Kudla program for Picard modular surfaces associated to the group GU(2,1). In particular, we are interested in the p-adic variation of Cogdell's theorem, the latter being the analogue of the celebrated result of Hirzebruch and Zagier for Hilbert modular surfaces. This work treads in the footsteps of Longo--Nicole in the attempt of relating the program initiated by Kudla to the p-adic families of Hida. After having p-adically interpolated the Kudla lift and its adjoint, we focus on the construction of special cycles on Kuga--Sato varieties and we apply Loeffler's formalism to our setting, obtaining Lambda-adic families of cohomology classes of special cycles. Finally, we construct a Lambda-adic generating series of such "big cycles", which interpolates the modular forms appearing in Cogdell's theorem.

Améliοratiοn de la Détectiοn d'Οbjets 3D Μοnοculaire basée sur l'ΙA: Applicatiοn au Τrain Autοnοme Μοnοrail par Stabilisatiοn Gyrοscοpique

Doctorant·e: EVAIN Alexandre
Direction de thèse: KHEMMAR REDOUANE (Directeur·trice de thèse)
AHMED ALI SOFIANE (Co-directeur·trice de thèse)
Date de la soutenance: 05/05/2025 à 14:00
Lieu de la soutenance: ESIGELEC, Bâtiment Turing, Amphi Robert Vallée
Rapporteurs de la thèse: CHECCHIN PAUL Universite Clermont Auvergne Clermont Auvergne
GRUYER DOMINIQUE Ifsttar (Champs Sur Marne)
Membres du jurys: AHMED ALI SOFIANE, , Université d'Evry Paris-Saclay
AINOUZ SAMIA, , INSA Rouen Normandie
CHECCHIN PAUL, , Universite Clermont Auvergne Clermont Auvergne
GRUYER DOMINIQUE, , Ifsttar (Champs Sur Marne)
HAMMOUDI KARIM, , Université de Haute-Alsace
KHEMMAR REDOUANE, , ESIGELEC ROUEN
ORZALESI MATHIEU, ,
TEBBANI SIHEM, , CentraleSupélec

Résumé: Cette thèse présente plusieurs contributions au développement de la détection monoculaire d'objets en 3D pour des applications autonomes de monorail. Tout d'abord, une plateforme expérimentale de monorail a été conçue et mise en œuvre, ainsi que des lois de contrôle pour assurer sa stabilisation. Sur cette base, des améliorations ont été apportées aux systèmes de détection monoculaire d'objets en 3D en mettant en œuvre les améliorations existantes pour les méthodes de détection d'objets en 2D. Pour améliorer encore les performances de détection, de nouvelles fonctions de transition de perte ont été développées et évaluées, permettant de donner la priorité à des métriques spécifiques pendant l'apprentissage du modèle. En outre, des méthodes ont été proposées pour combiner efficacement des ensembles de données réelles et synthétiques, en relevant des défis tels que les incohérences dans les matrices intrinsèques des caméras, la normalisation des ensembles de données et l'augmentation des données. Ces approches visent à améliorer les capacités d'apprentissage et de généralisation des modèles. Enfin, des techniques de transfert de style ont été employées pour augmenter les ensembles de données de formation en simulant diverses conditions environnementales, telles que les changements d'éclairage et de temps.
Abstract: This thesis presents several contributions to the development of monocular 3D object detection for autonomous monorail applications. First, an experimental monorail platform was designed and implemented, along with control laws to ensure its stabilization. Building upon this foundation, improvements were made to monocular 3D object detection systems by implementing existing improvements for 2D object detection methods. To further enhance detection performance, novel loss transition functions were developed and evaluated, allowing the prioritization of specific metrics during model training. Additionally, methods were proposed to effectively combine real and synthetic datasets, addressing challenges such as inconsistencies in camera intrinsic matrices, dataset normalization, and data augmentation. These approaches aim to improve model learning and generalization capabilities. Finally, style transfer techniques were employed to augment training datasets by simulating various environmental conditions, such as changes in lighting and weather.

ΡreDiViD Τοwards the Ρredictiοn οf the Disseminatiοn οf Viral Disease cοntagiοn in a pandemic setting

Doctorant·e: ALENCAR MEDEIROS Gabriel Henrique
Direction de thèse: SOUALMIA FATIMA (Directeur·trice de thèse)
ZANNI-MERK CECILIA (Co-directeur·trice de thèse)
Date de la soutenance: 31/03/2025 à 14:00
Lieu de la soutenance: Université de Rouen Normandie
Rapporteurs de la thèse: LAMY JEAN-BAPTISTE Sorbonne Universite
LE BER FLORENCE Engees (Strasbourg)
Membres du jurys: FRYDMAN CLAUDIA, , Aix-Marseille université
LAMY JEAN-BAPTISTE, , Sorbonne Universite
LE BER FLORENCE, , Engees (Strasbourg)
OSMANI AOMAR, , INSA Rouen Normandie
PERNELLE NATHALIE, , UNIVERSITE PARIS 13 PARIS-NORD
SOUALMIA FATIMA, , URN - Université de Rouen Normandie
ZANNI-MERK CECILIA, , INSA Rouen Normandie

Résumé: Les systèmes de surveillance basés sur les événements (EBS) sont essentiels pour détecter et suivre les phénomènes de santé émergents tels que les épidémies et crises sanitaires. Cependant, ils souffrent de limitations, notamment une forte dépendance à l’expertise humaine, des difficultés à traiter des données textuelles hétérogènes et une prise en compte insuffisante des dynamiques spatio-temporelles. Pour pallier ces limites, nous proposons une approche hybride combinant des méthodologies guidées par les connaissances et les données, ancrée dans l’ontologie des phénomènes de propagation (PropaPhen) et le cadre Description-Detection-Prediction Framework (DDPF), afin d’améliorer la description, la détection et la prédiction des phénomènes de propagation. PropaPhen est une ontologie FAIR conçue pour modéliser la propagation spatio-temporelle des phénomènes et a été spécialisée pour le biomédical grâce à l’intégration de UMLS et World-KG, menant à la création du graphe BioPropaPhenKG. Le cadre DDPF repose sur trois modules : la description, générant des ontologies spécifiques ; la détection, appliquant des techniques d'extraction de relations sur des textes hétérogènes ; et la prédiction, utilisant des méthodes avancées de clustering. Expérimenté sur des données du COVID-19 et de la variole du singe et validé avec les données de l’OMS, DDPF a démontré son efficacité dans la détection et la prédiction de clusters spatio-temporels. Son architecture modulaire assure son évolutivité et son adaptabilité à divers domaines, ouvrant des perspectives en santé publique, environnement et phénomènes sociaux.
Abstract: Event-Based Surveillance (EBS) systems are essential for detecting and tracking emerging health phenomena such as epidemics and public health crises. However, they face limitations, including strong dependence on human expertise, challenges processing heterogeneous textual data, and insufficient consideration of spatiotemporal dynamics. To overcome these issues, we propose a hybrid approach combining knowledge-driven and data-driven methodologies, anchored in the Propagation Phenomena Ontology (PropaPhen) and the Description-Detection-Prediction Framework (DDPF), to enhance the description, detection, and prediction of propagation phenomena. PropaPhen is a FAIR ontology designed to model the spatiotemporal spread of phenomena. It has been specialized in the biomedical domain through the integration of UMLS and World-KG, leading to the creation of the BioPropaPhenKG knowledge graph. The DDPF framework consists of three modules: description, which generates domain-specific ontologies; detection, which applies relation extraction techniques to heterogeneous textual sources; and prediction, which uses advanced clustering methods. Tested on COVID-19 and Monkeypox datasets and validated against WHO data, DDPF demonstrated its effectiveness in detecting and predicting spatiotemporal clusters. Its modular architecture ensures scalability and adaptability to various domains, opening perspectives in public health, environmental monitoring, and social phenomena.

Τοwards efficient Κnοwledge Graph-based Retrieval Augmented Generatiοn fοr cοnversatiοnal agents

Doctorant·e: SCHAEFFER MARION
Direction de thèse: ZANNI-MERK CECILIA (Directeur·trice de thèse)
KOTOWICZ JEAN-PHILIPPE (Co-encadrant·e de thèse)
Date de la soutenance: 25/03/2025 à 14:00
Lieu de la soutenance: INSA Rouen Normandie
Rapporteurs de la thèse: CELLIER PEGGY INSA Rennes
VELCIN JULIEN Université de Lyon 2
Membres du jurys: AINOUZ SAMIA, , INSA Rouen Normandie
CELLIER PEGGY, , INSA Rennes
KOTOWICZ JEAN-PHILIPPE, , INSA Rouen Normandie
TRONCY RAPHAËL, , EURECOM
VELCIN JULIEN, , Université de Lyon 2
ZANNI-MERK CECILIA, , INSA Rouen Normandie

Résumé: Les agents conversationnels se sont largement répandus ces dernières années. Aujourd'hui, ils ont dépassé leur objectif initial de simuler une conversation avec un programme informatique et sont désormais des outils précieux pour accéder à l'information et effectuer diverses tâches, allant du service client à l'assistance personnelle. Avec l'essor des modèles génératifs et des grands modèles de langage (LLM), les capacités des agents conversationnels ont été décuplées. Cependant, ils sont désormais sujets à des hallucinations, générant ainsi des informations erronées. Une technique populaire pour limiter le risque d'hallucinations est la génération augmentée par récupération (RAG), qui permet d'injecter des connaissances lors de la génération de texte. Ces connaissances peuvent être extraites de graphes de connaissances (KG), qui sont des représentations structurées et accessibles pour les systèmes informatiques. Ainsi, nous explorons les architectures de KG-RAG pour construire des agents conversationnels de confiance. Nous démontrons l'intérêt de notre approche pour un cas d'usage réel de support citoyen·ne en construisant un agent conversationnel traitant les mesures autour du handicap dans des villes françaises. Nous présentons d'abord un historique des agents conversationnels, en introduisant les méthodes mises en œuvre au fil des années et les techniques d'évaluation. Nous définissons ensuite les KG et les ontologies, et explorons les techniques de construction et d'évaluation. Ne trouvant pas de KG directement exploitable, notre première contribution introduit OLAF : Ontology Learning Applied Framework. Ce système modulaire est conçu pour une construction automatisée et reproductible de KG à partir de textes non structurés. OLAF intègre des techniques linguistiques, statistiques et basées sur des LLM pour générer des ontologies minimales viables sur des domaines spécifiques. Appliqué à des ensembles de données réels, OLAF démontre des performances robustes grâce à des évaluations basées sur des ontologies de référence et des questions de compétence spécifiques à une tâche. Nous détaillons le processus de construction d'un KG sur la thématique du handicap dans une ville française. Nous proposons ensuite une architecture pour les systèmes de KG-RAG afin d'améliorer la recherche d'information en alignant les requêtes des utilisateur·rice·s avec les structures des graphes via la liaison d'entités, les patrons de requêtes et les méthodes de récupération basées sur les LLM. Nous démontrons l'intérêt de notre architecture sur différents cas d'utilisation, que nous évaluons selon des critères tels que la performance, les préférences humaines et l'impact environnemental. Bien que les préférences des utilisateur·rice·s avantagent l'architecture de Text-RAG, l'impact environnemental réduit de l'architecture de KG-RAG souligne son potentiel pour des pratiques d'IA durables. Enfin, nous identifions comme élément clé de l'architecture la partie concernant la recherche d'information. Nous abordons donc cette tâche dans notre architecture en explorant les techniques de vectorisation dans divers contextes, c'est-à-dire en améliorant la liaison d'entités, la recherche des données contextuelles et en fournissant un système de cache. Nous proposons également des mécanismes pour gérer les conversations multi-tours. Ce travail établit un cadre complet pour les systèmes de KG-RAG, combinant la sémantique des KG avec les capacités génératives des LLM pour construire des agents conversationnels précis, spécialisés et durables. Les contributions incluent OLAF pour une construction automatisée de KG, un pipeline de KG-RAG robuste, et des améliorations basées sur des représentations vectorielles pour la précision de la recherche d'information et la qualité des interactions. En répondant aux défis industriels des agents conversationnels, ces travaux posent les bases du déploiement de systèmes de KG-RAG dans des domaines spécialisés et variés.
Abstract: Conversational agents have become widespread in recent years. Today, they have transcended their initial purpose of simulating a conversation with a computer program and are now valuable tools for accessing information and carrying out various tasks, from customer service to personal assistance. With the rise of text-generative models and Large Language Models (LLMs), the capabilities of conversational agents have increased tenfold. However, they are now subject to hallucinations, producing false information. A popular technique to limit the risk of hallucinations is Retrieval Augmented Generation (RAG), which injects knowledge into a text generation process. Such injected knowledge can be drawn from Knowledge Graphs (KGs), which are structured machine-readable knowledge representations. Therefore, we explore Knowledge Graph-based Retrieval Augmented Generation (KG-RAG) to build trusted conversational agents. We demonstrate our approach on a real-world use case for citizen support by building conversational agents for disability management in cities. We first present a history of conversational agents, introducing the approaches implemented over the years and the evaluation techniques. We then define KGs and ontologies, and explore construction and evaluation techniques. As we could not find a directly exploitable KG, our first contribution introduces the Ontology Learning Applied Framework (OLAF). This modular system is built for automated and repeatable KG construction from unstructured text. OLAF integrates linguistic, statistical, and LLM-based techniques to generate Minimum Viable Ontologies for specific domains. Applied to real-world datasets, OLAF demonstrates robust performance through gold-standard evaluations and task-specific Competency Questions. We detail the construction process for a KG about disability management in a French city. We then propose an architecture for KG-RAG systems to enhance information retrieval by aligning user queries with KG structures through entity linking, graph queries, and LLM-based retrieval approaches. We demonstrate our architecture on different use cases, which we evaluate using criteria such as performance, human preference, and environmental impact. While user preferences advantage Text-RAG, KG-RAG's reduced computational footprint underscores its potential for sustainable AI practices. Finally, we identify the critical part of the architecture as the retriever. Therefore, we tackle the retrieval task in our architecture by exploring embeddings in various contexts, i.e. improving EL, retrieval, and providing a caching system. We also propose mechanisms for handling multi-turn conversations. This work establishes a comprehensive framework for KG-RAG systems, combining the semantic depth of KGs with the generative capabilities of LLMs to deliver accurate, contextual, and sustainable conversational agents. Contributions include OLAF for scalable KG construction, a robust KG-RAG pipeline, and embedding-based enhancements for retrieval and interaction quality. By addressing conversational agents' industrial challenges, such as scalability, retrieval precision, and conversational coherence, this research lays the foundation for deploying KG-RAG systems in diverse and specialised domains.

Μulti-dοmain translatiοn in a semi-supervised setting

Doctorant·e: MAYET TSIRY
Direction de thèse: CHATELAIN CLEMENT (Directeur·trice de thèse)
HERAULT ROMAIN (Co-directeur·trice de thèse)
BERNARD SIMON (Co-encadrant·e de thèse)
Date de la soutenance: 19/12/2024 à 09:30
Lieu de la soutenance: INSA de Rouen au campus du Madrillet
Rapporteurs de la thèse: KURTZ CAMILLE Université Paris Cité
TALBOT HUGUES CentraleSupélec
Membres du jurys: BERNARD SIMON, , URN - Université de Rouen Normandie
CHATELAIN CLEMENT, , INSA Rouen Normandie
GALASSI FRANCESCA, , ESIR Rennes
HERAULT ROMAIN, , Université de Caen Normandie
KURTZ CAMILLE, , Université Paris Cité
MOUCHERE HAROLD, , Université de Nantes
TALBOT HUGUES, , CentraleSupélec

Résumé: Cette thèse explore la génération multi-modale dans un contexte d'apprentissage semi-supervisé, en abordant deux défis cruciaux: la prise en charge de configurations flexibles d'entrées et de sorties à travers plusieurs domaines, et le développement d'une stratégie d'entraînement efficace des données semi-supervisées. Alors que les systèmes d'intelligence artificielle progressent, il existe un besoin croissant de modèles capables d'intégrer et de générer de manière flexible plusieurs modalités, reflétant les capacités cognitives humaines. Les systèmes d'apprentissage profond conventionnels peinent souvent lorsqu'ils s'écartent de leur configuration d'entraînement, notamment lorsque certaines modalités sont indisponibles dans les applications réelles. Par exemple, dans le domaine médical, les patients pourraient ne pas faire tous les examens possibles pour un système d'analyse complet. Obtenir un contrôle plus fin sur les modalités générées est crucial pour améliorer les capacités de génération et fournir des informations contextuelles plus riches. De plus, l'augmentation du nombre de domaines rend plus difficile l'obtention d'une supervision simultanée. Nous nous concentrons sur la translation multi-domaine dans un contexte semi-supervisé, étendant le paradigme classique de translation de domaine. Plutôt que de considérer une direction de translation spécifique ou de les limiter entre paires de domaines, nous développons des méthodes facilitant les translations entre toutes les configurations possibles de domaines. L'aspect semi-supervisé reflète des scénarios réels où une annotation complète des données est souvent infaisable ou prohibitivement coûteuse. Notre travail présente trois contributions: (1) l'étude des fonctions de régularisation pour l'espace latent avec une supervision limitée, (2) l'étude de la mise à l'échelle et de la flexibilité des modèles de translation basés sur les modèles de diffusion, et (3) l'amélioration de la vitesse de génération des modèles d'inpainting par diffusion. Premièrement, nous proposons LSM, un modèle de translation semi-supervisé exploitant des données d'entrée supplémentaires et des données de sortie structurées pour régulariser les dépendances inter-domaines et intra-domaines. Deuxièmement, nous développons MDD, un modèle semi-supervisé de translation multi-domaine basé sur la diffusion. MDD transforme la fonction de perte classique des modèles de diffusion d'une fonction de reconstruction vers une fonction de translations en modélisant différents niveaux de bruit par domaine. Le modèle exploite les domaines moins bruités pour reconstruire les domaines plus bruités, permettant de modéliser les données manquantes comme du bruit pur et d'obtenir une configuration flexible des domaines condition et cible. Enfin, nous introduisons TD-Paint, un modèle d'inpainting basé sur la diffusion améliorant la vitesse de génération et à réduire la charge de calcul associée à la génération. Notre étude révèle que les modèles d'inpainting par diffusion souffrent d'une désynchronisation entre génération et conditionnement. Les solutions existantes, reposant sur le rééchantillonnage ou des régularisations supplémentaires, augmentent la complexité computationnelle. TD-Paint résout ce problème en modélisant des niveaux de bruit variables au niveau des pixels, permettant une utilisation efficace de la condition dès le début du processus.
Abstract: This thesis explores multi-modal generation and semi-supervised learning, addressing two critical challenges: supporting flexible configurations of input and output across multiple domains, and developing efficient training strategies for semi-supervised data settings. As artificial intelligence systems advance, there is growing need for models that can flexibly integrate and generate multiple modalities, mirroring human cognitive abilities. Conventional deep learning systems often struggle when deviating from their training configuration, which occurs when certain modalities are unavailable in real-world applications. For instance, in medical settings, patients might not undergo all possible scans for a comprehensive analysis system. Additionally, obtaining finer control over generated modalities is crucial for enhancing generation capabilities and providing richer contextual information. As the number of domains increases, obtaining simultaneous supervision across all domains becomes increasingly challenging. We focus on multi-domain translation in a semi-supervised setting, extending the classical domain translation paradigm. Rather than addressing specific translation directions or limiting translations to domain pairs, we develop methods facilitating translations between any possible domain configurations, determined at test time. The semi-supervised aspect reflects real-world scenarios where complete data annotation is often infeasible or prohibitively expensive. Our work explores three main areas: (1) studying latent space regularization functions to enhance domain translation learning with limited supervision, (2) examining the scalability and flexibility of diffusion-based translation models, and (3) improving the generation speed of diffusion-based inpainting models. First, we propose LSM, a semi-supervised translation framework leveraging additional input and structured output data to regularize inter-domain and intra-domain dependencies. Second, we develop MDD, a novel diffusion-based multi-domain translation semi-supervised framework. MDD shifts the classical reconstruction loss of diffusion models to a translation loss by modeling different noise levels per domain. The model leverages less noisy domains to reconstruct noisier ones, modeling missing data from the semi-supervised setting as pure noise and enabling flexible configuration of condition and target domains. Finally, we introduce TD-Paint, a novel diffusion-based inpainting model improving generation speed and reducing computational burden. Through investigation of the generation sampling process, we observe that diffusion-based inpainting models suffer from unsynchronized generation and conditioning. Existing models often rely on resampling steps or additional regularization losses to realign condition and generation, increasing time and computational complexity. TD-Paint addresses this by modeling variable noise levels at the pixel level, enabling efficient use of the condition from the generation onset.

Μοdèles affines généralisées et symétries d'équatiοns aux dérivés partielles

Doctorant·e: OUKNINE Anas
Direction de thèse: LESCOT PAUL (Directeur·trice de thèse)
Date de la soutenance: 19/12/2024 à 14:00
Lieu de la soutenance: UFR sciences et techniques salle des séminaires
Rapporteurs de la thèse: LORINCZI JOZSEF Institut de Mathématiques Alfred Renyi
THIEULLEN MICHELE UNIVERSITE PARIS 6 PIERRE ET MARIE CURIE
Membres du jurys: CALKA PIERRE, , URN - Université de Rouen Normandie
LEONARD CHRISTIAN, , Universite Paris 10 Paris-Nanterre
LESCOT PAUL, , URN - Université de Rouen Normandie
LORINCZI JOZSEF, , Institut de Mathématiques Alfred Renyi
THIEULLEN MICHELE, , UNIVERSITE PARIS 6 PIERRE ET MARIE CURIE

Résumé: Cette thèse se consacre à étudier les symétries de Lie d'une classe particulière d'équations différentielles partielles (EDP), désignée sous le nom d'équation de Kolmogorov rétrograde. Cette équation joue un rôle essentiel dans le cadre des modèles financiers, notamment en lien avec le modèle de Longstaff-Schwartz, qui est largement utilisé pour la valorisation des options et des produits dérivés. Dans un contexte plus générale, notre étude s'oriente vers l'analyse des symétries de Lie de l'équation de Kolmogorov rétrograde, en introduisant un terme non linéaire. Cette généralisation est significative, car l'équation ainsi modifiée est liée à une équation différentielle stochastique rétrograde et progressive (EDSRP) via la formule de Feynman-Kac généralisée (non linéaire). Nous nous intéressons également à l'exploration des symétries de cette équation stochastique, ainsi qu'à la manière dont les symétries de l'EDP sont connectées à celles de l'EDSRP. Enfin, nous proposons un recalcul des symétries de l'équation différentielle stochastique rétrograde (EDSR) et de l'EDSRP, en adoptant une nouvelle approche. Cette approche se distingue par le fait que le groupe de symétries qui opère sur le temps dépend lui-même du processus $Y$, qui constitue la solution de l'EDSR. Cette dépendance ouvre de nouvelles perspectives sur l'interaction entre les symétries temporelles et les solutions des équations.
Abstract: This thesis is dedicated to studying the Lie symmetries of a particular class of partial differential equations (PDEs), known as the backward Kolmogorov equation. This equa- tion plays a crucial role in financial modeling, particularly in relation to the Longstaff- Schwartz model, which is widely used for pricing options and derivatives. In a broader context, our study focuses on analyzing the Lie symmetries of the backward Kolmogorov equation by introducing a nonlinear term. This generalization is significant, as the modified equation is linked to a forward backward stochastic differ- ential equation (FBSDE) through the generalized (nonlinear) Feynman-Kac formula. We also examine the symmetries of this stochastic equation and how the symmetries of the PDE are connected to those of the BSDE. Finally, we propose a recalculation of the symmetries of the BSDE and FBSDE, adopting a new approach. This approach is distinguished by the fact that the symme- try group acting on time itself depends also on the process Y , which is the solution of the BSDE. This dependence opens up new perspectives on the interaction between temporal symmetries and the solutions of the equations.

Οptimizatiοn οf Synchrοmοdal Cοntainer Τranspοrtatiοn

Doctorant·e: VAIKKATHE Ananthakrishnan
Direction de thèse: BOUKACHOUR JAOUAD (Directeur·trice de thèse)
BENAINI ABDELHAMID (Co-directeur·trice de thèse)
Date de la soutenance: 19/12/2024 à 15:00
Lieu de la soutenance: PIL
Rapporteurs de la thèse: FONLUPT CYRIL ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
ZARGAYOUNA MAHDI Université Marne La Vallée
Membres du jurys: BENAINI ABDELHAMID, , ULHN - Université Le Havre Normandie
BOUDEBOUS DALILA, , ULHN - Université Le Havre Normandie
BOUKACHOUR JAOUAD, , ULHN - Université Le Havre Normandie
FONLUPT CYRIL, , ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
SALLEZ YVES, , UNIVERSITE POLYTECHNIQUE HAUTS DE FRANCE
ZARGAYOUNA MAHDI, , Université Marne La Vallée

Résumé: Cette thèse explore la mise en œuvre de la synchromodalité dans le transport de conteneurs en arrière-pays. La synchromodalité, une forme avancée de transport multimodal, offre une flexibilité et une résilience accrues pour le transport de fret conteneurisé. Bien que le transport routier ait traditionnellement dominé ce secteur, la synchromodalité vise à promouvoir un transfert modal stratégique vers des modes de transport plus durables, tels que le rail et les voies navigables intérieures. Le principal défi opérationnel réside dans la détermination de l’itinéraire optimal pour le transport des marchandises entre les terminaux d’origine et de destination. Dans la première partie de cette thèse, un modèle mathématique est développé pour identifier les meilleurs itinéraires de transport, en minimisant à la fois les émissions de carbone et la durée de transit. Compte tenu de la complexité NP-difficile de ce problème de chemin le plus court capacitaire, un algorithme génétique est proposé pour résoudre des instances de grande taille. Ces instances sont basées sur le corridor de fret de l’Axe Seine en France. Les résultats montrent qu’un transfert modal du camion vers le rail et les voies navigables intérieures peut permettre de réduire les émissions de carbone jusqu’à 80 %. La deuxième partie étend le modèle mathématique en intégrant des impacts environnementaux supplémentaires, appelés coûts externes. Un cadre d’optimisation multi-objectifs basé sur la métaheuristique NSGA-II est mis en œuvre pour résoudre efficacement le problème à grande échelle. Dans la troisième partie, le modèle prend en compte les incertitudes liées aux temps de trajet et de transport. Pour y faire face, une approche d’optimisation robuste basée sur une formulation min-max est employée, permettant de résoudre le problème de transport multimodal dans des conditions incertaines.
Abstract: This thesis explores the implementation of synchromodality in hinterland container transportation. Synchromodality, an advanced form of multimodal transportation, offers enhanced flexibility and resilience for containerized freight movement. While road transport has traditionally dominated this sector, synchromodality aims to promote a strategic modal shift toward more sustainable modes of transportation, such as rail and inland waterways. The primary operational challenge lies in determining the optimal route for transporting shipments between origin and destination terminals. In the first part of this thesis, a mathematical model is developed to identify the best transportation routes, minimizing both carbon emissions and transit duration. Given the NP-hard complexity of this capacitated shortest path problem, a genetic algorithm is proposed to solve large-scale problem instances. These instances are based on the Seine Axis freight corridor in France. The results demonstrate that a modal shift from truck to rail and inland waterways can achieve up to an 80% reduction in carbon emissions. The second part extends the mathematical model to incorporate additional environmental impacts, known as external costs. A multi-objective optimization framework using the NSGA-II metaheuristic is implemented to solve the problem for large-scale scenarios effectively. In the third part, the model accounts for uncertainties in travel and transportation times. To address this, a robust optimization approach based on a min-max formulation is employed, enabling the solution of the multimodal transportation problem under uncertain conditions.

Synthèse d'algοrithmes d'estimatiοn intelligents en vue du cοntrοle de trajectοire d'une flοtte de véhicules autοnοmes en platοοning (cοnvοi)

Doctorant·e: ABDL GHANI Hasan
Direction de thèse: CRAYE ETIENNE (Directeur·trice de thèse)
AHMED ALI SOFIANE (Co-directeur·trice de thèse)
Date de la soutenance: 19/12/2024 à 14:00
Lieu de la soutenance: IRSEEM, ESIGELEC, Technopôle du Madrillet, Av. Galilée, 76800 Saint-Étienne-du-Rouvray
Rapporteurs de la thèse: BASSET MICHEL Ens Ingenieurs Sud Alsace Universite Mulhouse
NEJJARI-AKHI-ELARAB FATIHA Univ. Polytechnique de Barcelone (ESP)
Membres du jurys: AHMED ALI SOFIANE, , Université d'Evry Paris-Saclay
AINOUZ SAMIA, , INSA Rouen Normandie
BASSET MICHEL, , Ens Ingenieurs Sud Alsace Universite Mulhouse
CRAYE ETIENNE, , ESIGELEC ROUEN
NEJJARI-AKHI-ELARAB FATIHA, , Univ. Polytechnique de Barcelone (ESP)
TELJ REINE, , UNIV TECHNOLOGIE COMPIEGNE UTC COMPIEGNE
TRAN NGUYEN ANH-TU, , UNIVERSITE VALENCIENNES UVHC

Résumé: Cette thèse présente une exploration complète de la conception d’observateurs avancés pour les systèmes de véhicules terrestres, en mettant particulièrement l’accent sur l’intégration de techniques de réseaux neuronaux pour relever les défis liés à la dynamique non linéaireet aux complexités de mesure. La recherche est systématiquement divisée en trois parties distinctes, chacune se concentrant sur un aspect spécifique de la conception d’observateurset de leur application pratique aux véhicules terrestres. La première partie introduit une conception d’observateur novatrice utilisant un réseau neuronal multicouche pour les véhicules terrestres autonomes. Ce segment de l’étude propose un observateur en réseau neuronal continu-discret (NSNNO), particulièrement adapté aux systèmes caractérisés par une non-linéarité significative et sans nécessité de connaissances préalables sur la dynamique du système. L’observateur, conçu comme un réseau neuronal feedforward à trois couches, est méticuleusement entraîné en utilisant l’algorithme d’apprentissage par rétropropagation de l’erreur, amélioré par un terme de modification e pour la robustesse. Cette partie aborde efficacement les défis associés à la mesure en temps discret dans les systèmes de véhicules. La deuxième partie se penche sur l’amélioration de l’estimation de l’état dans la dynamique des véhicules terrestres grâce à l’application de réseaux neuronaux à fonction de base radiale (RBF). Cette section est articulée à travers trois articles pivots, chacun apportant une perspective et une solution uniques. Ces articles abordent collectivement divers défis en matière de mesure et de modélisation, démontrant la polyvalence et l’efficacité des réseaux RBF dans l’estimation de la dynamique complexe des véhicules. La troisième partie s’appuie sur la conception réussie d’observateurs basés sur des réseaux neuronaux pour des véhicules terrestres individuels et étend leur application au contexte du pelotonnage de véhicules sous des mesures retardées. Cette partie de la recherche se concentre sur les défis uniques inhérents à l’environnement de pelotonnage, en particulier l’impact des retards de communication entre les véhicules. Elle montre comment les conceptions d’observateurs avancés peuvent être adaptées à l’environnement interconnecté et dynamique des pelotons de véhicules, garantissant la stabilité et la précision de la formation, même en présence de retards de communication. Dans l’ensemble, cette thèse apporte une contribution significative au domaine des systèmes de contrôle de véhicules terrestres, offrant des perspectives précieuses et des solutions pratiques pour le développement de systèmes d’observateurs avancés et fiables capables de naviguer dans les complexités de la dynamique véhiculaire moderne.
Abstract: This thesis explores advanced observer designs to improve state estimation and system performance in vehicle dynamic environments. The research is divided into three parts, where each part focuses on a specific aspect of observer design and its practical application to ground vehicles. Part One introduces a novel observer design using a multi-layer neural network for autonomous ground vehicles. This part of the study proposes a continuous-discrete time neural network observer, that is designed for systems that have significant non-linearity and without the necessity for prior knowledge of system dynamics. The observer, which is designed as a three-layer feedforward neural network, trained using the error backpropagation learning algorithm, and enhanced with an e-modification term for robustness. A closed-loop output predictor is added to the design of the neural network observer to solve the challenge of discrete time measurement in vehicle systems. Part two of this thesis introduces a novel approach using radial basis function neural networks, which is used to enhance observer designs for nonlinear dynamic systems. In this part, we propose a new weight updating function that improves the performance of RBF networks, which was designed for systems with both partially or completely unknown dynamics. The proposed observers are also designed to manage the discrete-time measurements with delay measurements to ensure accurate state estimation and improved performance of the system under these conditions. Part Three focuses on robust platooning in multi-agent systems to address the challenges that are posed by internal and communication delays, measurements uncertainties, and the system heterogeneity. A consensus-based high-gain observer and a novel-based observer are presented to enhance the stability and coordination of platoons under different conditions. These methods here are validated by extensive simulations that shows the efficiency of the observers to maintain synchronization and robustness under challenging scenarios. Overall, this thesis contributes in the field of ground vehicle control systems that offers valuable understanding and practical solutions for developing advanced observer systems that are capable of solving the complexities of modern vehicle dynamics

Ιntelligent apprοach fοr trafic cοngestiοn predictiοn

Doctorant·e: AMOR Yasmine
Direction de thèse: HOBLOS GHALEB (Directeur·trice de thèse)
BEN SAID LAMJED (Co-directeur·trice de thèse)
Date de la soutenance: 18/12/2024 à 14:30
Lieu de la soutenance: ESIGELEC
Rapporteurs de la thèse: AYACHI GANNOUCHI SONIA Université de Sousse
GUESSOUM ZAHIA Université de Reims Champagne Ardenne
Membres du jurys: AYACHI GANNOUCHI SONIA, , Université de Sousse
BEN SAID LAMJED, , Université de Tunis (Tunisie)
ELOUEDI ZIED, , Université de Tunis (Tunisie)
GUESSOUM ZAHIA, , Université de Reims Champagne Ardenne
HOBLOS GHALEB, , ESIGELEC ROUEN
SAHLI NABIL, , German University of Technology

Résumé: La congestion routière constitue un défi majeur pour les zones urbaines, car le volume de véhicules continue de croître plus rapidement que la capacité globale du réseau routier. Cette croissance a des répercussions sur l'activité économique, la durabilité environnementale et la qualité de vie. Bien que des stratégies visant à atténuer la congestion routière ont connu des améliorations au cours des dernières décennies, de nombreux pays ont encore du mal à la gérer efficacement. Divers modèles ont été développés pour aborder ce problème. Cependant, les approches existantes peinent souvent à fournir des prédictions en temps réel et localisées qui peuvent s'adapter à des conditions de trafic complexes et dynamiques. La plupart de ces approches s'appuient sur des horizons de prédiction fixes et manquent de l'infrastructure intelligente nécessaire à la flexibilité. Cette thèse comble ces lacunes en proposant une approche intelligente, décentralisée et basée sur l'infrastructure pour l'estimation et la prédiction de la congestion routière. Nous commençons par étudier l'Estimation du Trafic. Nous examinons les mesures de congestion possibles et les sources de données requises pour différents contextes pouvant être étudiés. Nous établissons une relation tridimensionnelle entre ces axes. Un système de recommandation basé sur des règles est développé pour aider les chercheurs et les opérateurs du trafic à choisir les mesures de congestion les plus appropriées en fonction du contexte étudié. Nous passons ensuite à la Prédiction du Trafic, où nous introduisons notre approche DECOTRIVMS. Cette dernière utilise des panneaux intelligents à messages variables pour collecter des données de trafic en temps réel et fournir des prédictions à court terme avec des horizons de prédiction variables. Nous avons utilisé des Réseaux de Graphes avec Attention en raison de leur capacité à capturer des relations complexes et à gérer des données structurées en graphes. Ils sont bien adaptés pour modéliser les interactions entre différents segments routiers étudiés. Nous avons aussi employé des méthodes d'apprentissage en ligne, spécifiquement la Descente de Gradient Stochastique et la Descente de Gradient Adaptative. Bien que ces méthodes ont été utilisées avec succès dans divers autres domaines, leur application à la prédiction de la congestion routière reste sous-explorée. Dans notre thèse, nous visons à combler cette lacune en explorant leur efficacité dans le contexte de la prédiction de la congestion routière en temps réel. Enfin, nous validons l'efficacité de notre approche à travers deux études de cas réalisées à Mascate, Oman, et à Rouen, France. Une analyse comparative est effectuée, évaluant divers modèles de prédiction, y compris les Réseaux de Graphes avec Attention, les Réseaux de Graphes Convolutionnels et des méthodes d'apprentissage en ligne. Les résultats obtenus soulignent le potentiel de DECOTRIVMS, démontrant son efficacité pour une prédiction précise et efficace de la congestion routière dans divers contextes urbains.
Abstract: Traffic congestion presents a critical challenge to urban areas, as the volume of vehicles continues to grow faster than the system’s overall capacity. This growth impacts economic activity, environmental sustainability, and overall quality of life. Although strategies for mitigating traffic congestion have seen improvements over the past few decades, many cities still struggle to manage it effectively. While various models have been developed to tackle this issue, existing approaches often fall short in providing real-time, localized predictions that can adapt to complex and dynamic traffic conditions. Most rely on fixed prediction horizons and lack the intelligent infrastructure needed for flexibility. This thesis addresses these gaps by proposing an intelligent, decentralized, infrastructure-based approach for traffic congestion estimation and prediction. We start by studying Traffic Estimation. We examine the possible congestion measures and data sources required for different contexts that may be studied. We establish a three-dimensional relationship between these axes. A rule-based system is developed to assist researchers and traffic operators in recommending the most appropriate congestion measures based on the specific context under study. We then proceed to Traffic Prediction, introducing our DECentralized COngestion esTimation and pRediction model using Intelligent Variable Message Signs (DECOTRIVMS). This infrastructure-based model employs intelligent Variable Message Signs (VMSs) to collect real-time traffic data and provide short-term congestion predictions with variable prediction horizons. We use Graph Attention Networks (GATs) due to their ability to capture complex relationships and handle graph-structured data. They are well-suited for modeling interactions between different road segments. In addition to GATs, we employ online learning methods, specifically, Stochastic Gradient Descent (SGD) and ADAptive GRAdient Descent (ADAGRAD). While these methods have been successfully used in various other domains, their application in traffic congestion prediction remains under-explored. In our thesis, we aim to bridge that gap by exploring their effectiveness within the context of real-time traffic congestion forecasting. Finally, we validate our model’s effectiveness through two case studies conducted in Muscat, Oman, and Rouen, France. A comprehensive comparative analysis is performed, evaluating various prediction techniques, including GATs, Graph Convolutional Networks (GCNs), SGD and ADAGRAD. The achieved results underscore the potential of DECOTRIVMS, demonstrating its potential for accurate and effective traffic congestion prediction across diverse urban contexts.

Ιndécidabilité des invariants géοmétriques dans les pavages

Doctorant·e: PAVIET SALOMON Leo
Direction de thèse: VANIER Pascal (Directeur·trice de thèse)
Date de la soutenance: 17/12/2024 à 14:30
Lieu de la soutenance: Bâtiment Sciences 3 - salle des thèses
Rapporteurs de la thèse: BEAL MARIE-PIERRE Université Gustave Eiffel
ROJAS CRISTOBAL Pontificia Universidad Católica de Chile
Membres du jurys: BEAL MARIE-PIERRE, , Université Gustave Eiffel
CERVELLE JULIEN, , UNIVERSITE PARIS 12 VAL DE MARNE
HOYRUP MATHIEU, , Université de Lorraine
OLLINGER NICOLAS, , Université d'Orléans
PETITE SAMUEL, , UNIVERSITE AMIENS PICARDIE JULES VERNE
VANIER Pascal, , UCN - Université de Caen Normandie

Résumé: Cette thèse est consacrée à l'étude des sous-décalages, et en particulier leurs propriétés calculatoires. De façon générale, un sous-décalage est défini par un ensemble fini de symboles, un ensemble de règles spécifiant les agencements valides et invalides de ces symboles, et un espace ambiant que l'on cherche à paver: une configuration valide consiste alors en un agencement de ces symboles couvrant l'espace entier et respectant toutes les contraintes. Le sous-décalage est alors défini comme l'ensemble de toutes les configurations valides. Dans le cas le plus simple, ces règles interdisent simplement à certains symboles d'être placés côte-à-côte, et sont donc en nombre fini. Cependant, même dans ce cas restreint, les pavages de Z^d pour d > 1 sont étonnament complexes, cette complexité se manifestant sous plusieurs aspects étudiés dans cette thèse. Cette thèse est divisée en trois chapitres essentiellement indépendants, précédés d'une introduction générale aux différents objets étudiés. Dans un premier temps, nous étudierons l'entropie d'extension des pavages de Z^d, un nombre réel associé à un sous-décalage qui quantifie le nombre de motifs qui peuvent être librement interchangés dans n'importe quelle configuration valide. Nous montrerons que les entropies d'extension possibles sont caractérisées par des restrictions calculatoires, et correspondent exactement à des niveaux de la hiérarchie arithmétique, le niveau exact dépendant de la classe de sous-décalages considérée. Dans un second chapitre, nous nous intéresserons au Groupe Fondamental Projectif des pavages du plan Z^2. Il s'agit d'un groupe associé à certains sous-décalages, qui permet de classifier les obstructions possibles qu'ont certaines configurations partielles ne pouvant être étendues en configurations valides sur tout l'espace. Nous montrerons là aussi que des classes simples de pavages, notamment les sous-décalages de type fini, peuvent exhiber un comportement complexe, et en particulier peuvent avoir comme groupe fondamental n'importe quel groupe finiment présenté. Enfin, nous étudierons dans un troisième chapitre les sous-décalages substitutifs, dans le contexte particulier des graphes. Nous proposerons une définition de graphe substitutif, et de sous-décalage substitutif défini sur ces graphes, et montrerons qu'une large classe de ces sous-décalages peuvent être obtenus à l'aide d'un nombre fini de règles locales. Ce résultat généralise partiellement un résultat classique de Mozes, dans un cadre plus combinatoire et moins géométrique.
Abstract: This thesis is devoted to the study of subshifts, and in particular their computational properties. A subshift is defined by a finite set of symbols, a set of rules specifying authorized and forbidden arrangements of these symbols, and an ambient space that we try to tile: a valid configuration is then an arrangement of these symbols, covering the entire space and respecting all the rules. A subshift is then defined as the set of all the valid configurations. In the simplest case, the rules are adjacency rules, which prevent some symbols from being placed next to one another. However, even in this restricted setting, tilings of Z^d for d > 1 can be surprinsingly complicated, in several ways studied in this thesis. The thesis is divided in three independent chapters, with a preliminary chapter introducing all the relevant background knowledge for the various objects being considered. In a first chapter, we study the extender entropy of Z^d subshifts, a real number which quantifies for any subshift the number of patterns that can freely be exchanged in all the valid configurations. We show that the possible values of extender entropies are fully characterized by computability restrictions, more precisely, they correspond exactly to levels in the arithmetical hierarchy of real numbers, the precise level depending on the specific class of subshifts being considered. In a second chapter, we study the Projective Fundamental Group of Z^2-subshifts, a group which aims at classifying the various kinds of obstructions encountered when trying to extend a partial configuration to a complete, valid configuration of the subshift. We show that even subshifts of finite type can have as fundamental group any finitely presented group. Finally, we study in a third chapter a kind of substitutive subshift defined on graphs. We propose a definition of substitutive graph, as well as substitutive graph subshift, and show that an important class of these subshifts can be obtained using only finitely many local rules. This partially generalizes a classical result from Mozes, in a more combinatorial but less geometrical setting.

Τraitement d'image pοur la valοrisatiοn et l'accessibilité des οeuvres muséales

Doctorant·e: REDON Marjorie
Direction de thèse: EL MOATAZ BILLAH Abderrahim (Directeur·trice de thèse)
Date de la soutenance: 17/12/2024 à 09:00
Lieu de la soutenance: Caen
Rapporteurs de la thèse: GOUET-BRUNET VALÉRIE Directeur de recherche Université Gustave Eiffel
TREUILLET SYLVIE Maître de conférences HDR Université d'Orléans
Membres du jurys: EL MOATAZ BILLAH Abderrahim, , UCN - Université de Caen Normandie
GOUET-BRUNET VALÉRIE, Directeur de recherche, IGN
JOUFFRAIS CHRISTOPHE, Directeur de recherche, Institut de Recherche en Informatique de Toulouse
LECOMTE CHRISTELE, Maître de conférences, URN - Université de Rouen Normandie
MARZANI FRANCK, , Universite Bourgogne Europe
QUEAU Yvain, Chargé de recherche, UCN - Université de Caen Normandie
TREUILLET SYLVIE, Maître de conférences HDR, Université d'Orléans

Résumé: La question de l’accessibilité des œuvres muséales aux personnes présentant une incapacité visuelle (PPIVs) est régulièrement soulevée par les associations et les musées. De par leur nature, certaines œuvres, telles que les tapisseries médiévales, ne peuvent être touchées et ne sont que peu souvent accessibles via l’audio-description. Aussi, la création manuelle de représentations tactiles est coûteuse et complexe, limitant leur disponibilité dans les musées. La Tapisserie de l’Apocalypse et la Tapisserie de Bayeux sont deux exemples emblématiques. Ces deux œuvres d’art de grande envergure mesurant 104 m sur 4,5 m pour la première et 70 m sur 50 cm pour la deuxième, sont devenues au fil du temps les objets de nombreuses études. Bien que le Château d’Angers propose des visites guidées adaptées aux personnes aveugles et malvoyantes, celles-ci restent limitées et nécessitent la participation de plusieurs personnes. Au musée de la Tapisserie de Bayeux, un espace de découverte tactile est proposé mais seules trois des 58 scènes peuvent être explorées. Cette thèse aborde les problématiques d'inclusion dans les musées. Ce travail a été mené dans une volonté de rendre la perception des tapisseries médiévales accessible à un plus grand nombre de personnes. Ce travail propose ainsi une méthodologie innovante de création semi-automatique d’objets 3D à partir d’une simple photographie. Nous nous intéressons dans ce manuscrit aux possibilités offertes par les outils d’intelligence artificielle pour la création de bas-reliefs imprimés en 3D, rapidement et à moindre coût. Pour cela, nous étudions des algorithmes de segmentation tels que les Mask R-CNN ; et d'autres réseaux de neurones permettant de générer des images, comme les réseaux génératifs antagonistes (GANs). En plus de la possible génération d'impressions 3D permettant une exploration tactile des œuvres, nous devons nous intéresser à la pertinence de telles représentations. Afin de nous assurer que la solution proposée permette une meilleure autonomie dans l’appréciation de l’art, nous menons également une campagne d'évaluation auprès de PPIVs. Au final, nous visons à améliorer l'expérience muséale des personnes aveugles et partiellement aveugles par une augmentation de leur autonomie dans ces lieux de culture et renforcer leur satisfaction et leur motivation à découvrir ces trésors culturels.
Abstract: The issue of accessibility to artworks in museums for visually impaired people (VIP) is frequently raised by associations and museums. Some works, such as medieval tapestries, by their very nature, cannot be touched and are often not accessible through audio-description. Moreover, the manual creation of tactile representations is costly and complex, limiting their availability in museums. The Apocalypse Tapestry and the Bayeux Tapestry are two iconic examples. These large-scale artefacts, measuring 104 m by 4.5 cm meters for the former and 70 m by 50 cm for the latter, have been the focus of numerous studies over the years. Although the Château d'Angers offers guided tours adapted for blind and partially sighted visitors, these remain limited and require the involvement of several people. At the Bayeux Tapestry Museum, there is a tactile discovery area, but only three of the 58 scenes have been adapted into tactile mock copies. This work is motivated by the challenges of inclusion in museums and aims to make the perception of medieval tapestries accessible to as many people as possible. We propose an innovative methodology for the semi-automatic creation of 3D objects from simple photographs. In this manuscript, we explore the possibilities offered by artificial intelligence tools to quickly and affordably create 3D-printed bas-reliefs. Specifically, we study segmentation algorithms like Mask R-CNN and image-generating neural networks such as generative adversarial networks (GANs). In addition to generating 3D prints that enable tactile exploration of artefacts, we also evaluate the relevance of these representations through experimentation with VIPs. Overall, our goal is to improve the museum experience for blind and partially sighted visitors by enhancing their autonomy in cultural spaces and increasing their satisfaction and motivation to discover these cultural treasures.

Smart Rοad Signs based trust management mοdels fοr cοοperative Ιntelligent Τranspοrtatiοn Systems

Doctorant·e: ABIDI Rihab
Direction de thèse: HOBLOS GHALEB (Directeur·trice de thèse)
BEN AZZOUNA NADIA (Co-directeur·trice de thèse)
Date de la soutenance: 16/12/2024 à 14:00
Lieu de la soutenance: ESIGELEC
Rapporteurs de la thèse: BONNIN JEAN-MARIE IRISA RENNES
SIALA CHAOUACHI JOUHAINA Université de Carthage
Membres du jurys: BEN AZZOUNA NADIA, , Université de Tunis (Tunisie)
BONNIN JEAN-MARIE, , IRISA RENNES
HOBLOS GHALEB, , ESIGELEC ROUEN
SIALA CHAOUACHI JOUHAINA, , Université de Carthage

Résumé: L'augmentation de la complexité des systèmes de circulation urbaine a rendu la congestion un défi majeur, entraînant des impacts économiques, environnementaux et sociaux considérables. Les Systèmes de Transport Intelligents (STIs) sont apparus comme une solution prometteuse pour atténuer ces défis en permettant une gestion dynamique du trafic. Cependant, la fiabilité des données au sein des STIs représente un enjeu de plus en plus important. L'introduction de données erronées par des capteurs défectueux ou malveillants peut entraîner des dysfonctionnements ou des perturbations intentionnelles du système. Dans ce contexte, les modèles de gestion de la confiance revêtent une importance cruciale. La plupart des modèles de confiance existants proposent des approches centrées sur les véhicules. Cependant, la forte mobilité et la nature dynamique des environnements des STIs affectent la stabilité et la scalabilité de ces systèmes. En conséquence, la proposition de nouveaux modèles de confiance conçus spécifiquement pour les STIs, afin d'améliorer la précision, la sécurité, la scalabilité et la stabilité de la diffusion des informations sur le trafic, constitue l'objectif global de cette thèse. Tout d'abord, nous avons proposé une architecture générique pour un cadre de modèle de gestion de la confiance, exploitant les Smart Road Signs (SRSs). La conception de cette architecture repose sur une étude approfondie de l'état de l'art. Cette architecture a ensuite été développée pour proposer deux nouveaux modèles de confiance. Le premier modèle, considère les informations contextuelles et l'agrégation. De plus, ce modèle prend en compte les informations contextuelles et l'agrégation des données provenant de multi-sources pour évaluer la fiabilité des événements de trafic signalés aux SRSs et des différents nœuds du réseau. De plus, le modèle applique une évaluation de confiance à deux niveaux en combinant l'inférence Bayésienne et une approche de somme pondérée dynamique. En outre, une inférence bayésienne basée sur la prédiction a été proposée pour améliorer la précision de l'évaluation de la confiance. Par la suite, un modèle de confiance en communication a été proposé, pour compléter la contribution précédente, en utilisant des métriques de Quality of Service (QoS) pour évaluer le comportement des SRSs. Ce modèle introduit un modèle de confiance auto-organisé pour suivre les comportements des SRSs et établir des environnements stables en utilisant Dempster Shafer Theory (DST) basée sur la logique floue. En effet, nous considérons un scénario plus réaliste où tous les nœuds sont vulnérables aux attaques et aux pannes. Ainsi, l'objectif principal de ce modèle est de garantir que le système reste opérationnel même dans des environnements hostiles, en atténuant la vulnérabilité des architectures de réseau centralisées, qui est le point de défaillance unique. Les modèles proposés ont été validés par des simulations, démontrant leur efficacité dans l'identification des nœuds malveillants et la réduction des rapports de trafic erronés. Les résultats montrent que la prise en compte de l'agrégation de données provenant de multi-sources et des informations contextuelles augmente la précision de l'évaluation de la confiance. De plus, l'adoption d'un modèle basé sur l'infrastructure, exploitant une architecture décentralisée et hiérarchique, améliore l'évolutivité et la stabilité des modèles de confiance, ce qui est adapté à un tel environnement.
Abstract: The increasing complexity of urban traffic systems has made congestion a significant challenge, leading to severe economic, environmental, and social impacts. Intelligent Transportation Systems (ITSs) have emerged as a promising solution to mitigate these challenges by enabling dynamic traffic management. However, the reliability of data within ITSs represents an increasingly significant challenge. The introduction of erroneous data by defective or malicious sensors can lead to malfunctions or intentional disruptions of the system. In this context, trust management models assume a crucial importance. Most of the existing trust models propose vehicle-centric approaches. However, the high mobility and dynamic nature of the ITS environments affects the stability and scalabity of such systems. Accordingly, proposing novel trust models designed specifically for ITSs to enhance the accuracy, security, scalability and stabilty of traffic information dissemination constitutes the overall goal of this thesis. First, we proposed a generic architecture for a trust framework, leveraging Smart Road Signs (SRSs). The conception of this architecture was built upon the output of a deep investigation of the state of the art. This framework has been, then, developed to propose two novel trust models. The first model, considers the contextual information and multi-source data aggregation to assess the trustworthiness of reported traffic events and the different nodes of the network. Additionally, the model applies a bi-level trust evaluation combining Bayesian Inference and a dynamic weighted sum approach. Furthermore, a predictive-based Baysian Inference was proposed to enhance the accuracy of trust evaluation. Thereafter, a communication trust model was proposed, to complement the previous contribution, using Quality of Service (QoS) metrics to evaluate the SRSs behaviour. This model introduces a self-organizing trust model to track the SRSs' behaviours and establishes stable environments using a fuzzy-based Dempster Shafer Theory (DST). In fact, we consider a more realistic scenario where all the nodes are vulnerable to attacks and failure. Thus, the main objective of this model is to ensure that the system remains operational even in hostile environments, by mitigating the inherent single point of failure vulnerability characteristic of centralized network architectures.\\ The proposed models were validated through simulations, showing their effectiveness in identifying malicious nodes and mitigating erroneous traffic reports. The results demonstrate that considering multi-source data aggregation and context-aware information increases the accuracy of trust evaluation. Furthermore, the adoption of an infrastructure-based framework leveraging a decentralized and hierarchical architecture enhances the scalability and stability of the trust models, which is suitable for such environment.

Dévelοppement de détecteurs de rayοnnement ΤΗz nοn refrοidis à base de La0.7Sr0.3ΜnΟ3

Doctorant·e: QUINTEN Thomas
Direction de thèse: GUILLET Bruno (Directeur·trice de thèse)
Date de la soutenance: 16/12/2024 à 14:00
Lieu de la soutenance: Campus 2, Caen
Rapporteurs de la thèse: BOUSSAHA FAOUZI OBSERVATOIRE DE PARIS
LECOEUR Philippe Université Paris Saclay
Membres du jurys: BOUSSAHA FAOUZI, , OBSERVATOIRE DE PARIS
GUILLET Bruno, , UCN - Université de Caen Normandie
LAMPIN JEAN-FRANÇOIS, , IEMN - Inst. d'Elec, de MIcro et de Nano
LECOEUR Philippe, , Université Paris Saclay
LOCQUET JEAN-PIERRE, , LEUVEN - KATHOLIEKE UNIVERSITEIT
ROY PASCALE, , Synchrotron SOLEIL

Résumé: Les propriétés des ondes térahertz (THz) offrent des perspectives pour relever les défis sociétaux du XXIᵉ siècle dans les domaines de la santé, de la sécurité et de l'énergie. Cette thèse examine l'utilisation de couches minces de La0.7Sr0.3MnO3 (LSMO) déposées sur silicium pour réaliser des détecteurs THz à température ambiante, en exploitant la variation de leur résistance électrique. Les détecteurs sont associés à des antennes planaires, exigeant une adaptation d’impédance optimale entre l’antenne et la couche mince. Dans ce but, les couches LSMO et leurs contacts électriques (Au/LSMO) ont été caractérisés en courant continu et dans le domaine radiofréquence (10 MHz à 325 GHz). En courant continu, l'étude révèle que de fortes résistances électriques de contact introduisent des comportements non-linéaires qui dégradent la lecture des détecteurs. Un recuit thermique associé à une géométrie adaptée du détecteur a permis de ramener les résistances de contact à un niveau négligeable, avec une résistance spécifique de 10⁻⁵ Ω·cm². L’analyse radiofréquence effectuée sur des lignes coplanaires chargées par du LSMO a montré que l’impédance du LSMO est réelle et que les résistances électriques de contact sont négligeables à ces fréquences. Ces résultats ont permis de concevoir des détecteurs couplés à une lentille diélectrique et de les tester à 640 GHz et 2.52 THz. Les performances mesurées se montrent prometteuses comparées à l’état de l’art, avec un NEP électrique de quelques pW/√Hz (limité par le bruit de phonons) et un temps de réponse de 0.1 ms. Le NEP optique, avoisinant 600 pW/√Hz dans la bande passante, pourrait être optimisé par une meilleure absorption du rayonnement.
Abstract: The properties of terahertz (THz) waves offer promising perspectives for addressing 21st-century societal challenges in the fields of health, security, and energy. This thesis investigates the use of La0.7Sr0.3MnO3 (LSMO) thin films deposited on silicon for the development of THz detectors operating at room temperature, by exploiting the variation in their electrical resistance. The films are coupled with planar antennas, requiring optimal impedance matching between the antenna and the thin film. In this context, the LSMO layers and their electrical contacts (Au/LSMO) were characterized in direct current and in the radiofrequency domain (10 MHz to 325 GHz). In direct current, the study reveals that high contact resistances introduce nonlinear behaviors that degrade detector reading. Thermal annealing combined with an optimized detector geometry allowed for contact resistances to be reduced to a negligible level, achieving a specific contact resistance of 10⁻⁵ Ω·cm². The radiofrequency analysis performed on coplanar lines loaded with LSMO showed that the LSMO impedance is real with no contact resistances. These findings enabled the design of detectors coupled with a dielectric lens, which were tested at 640 GHz and 2.52 THz. The performances are promising compared to the state of the art, with an electrical NEP of a few pW/√Hz (limited by phonons noise) and a response time of 0.1 ms. The optical NEP, around 600 pW/√Hz in the bandwidth, could be optimized through enhanced radiation absorption.

Ρarametric estimatiοn fοr a class οf multidimensiοnal affine prοcesses

Doctorant·e: DAHBI Houssem
Direction de thèse: BEN ALAYA MOHAMED (Directeur·trice de thèse)
KHENISSI MOEZ (Co-directeur·trice de thèse)
Date de la soutenance: 13/12/2024 à 14:00
Lieu de la soutenance: Rouen
Rapporteurs de la thèse: ALFONSI AURELIEN
CLEMENT EMMANUELLE Universite Gustave Eiffel
MASMOUDI AFIF Université de SFAX (Tunisie)
Membres du jurys: ALFONSI AURELIEN, ,
BEN ALAYA MOHAMED, , URN - Université de Rouen Normandie
CLEMENT EMMANUELLE, , Universite Gustave Eiffel
FATHALLAH HAMDI, , Université de Sousse
KHENISSI MOEZ, , Université de Sousse
LOUHICHI SANA, , Universite Grenoble Alpes
MASMOUDI AFIF, , Université de SFAX (Tunisie)
PERGAMENCHTCHIKOV SERGUEI, , URN - Université de Rouen Normandie

Résumé: Cette thèse traite l'inférence statistique de quelques processus de diffusion affine dans $ \R^m_+ \times \R^n $, avec $m,n\in\N$. Cette sous-classe de diffusions, notée par $\textit{AD}(m,n)$, est appliquée à la tarification des options sur obligations et des actions, ce qui est illustré pour les modèles de Vasicek, Cox-Ingersoll-Ross (CIR) et Heston. Dans cette thèse, nous considérons deux différents modèles: le premier lorsque $ m = 1 $ et $ n \in \mathbb{N} $ et le deuxième lorsque $ m = 2 $ et $ n = 1 $. Pour le modèle $\mathit{AD}(1, n)$, nous introduisons, au Chapitre 2, un résultat de classification où nous distinguons trois cas différents : sous-critique, critique et surcritique. Ensuite, nous étudions la stationnarité et l'ergodicité de sa solution sous certaines hypothèses sur les paramètres du drift. Pour le problème d'estimation paramétrique, nous utilisons deux méthodes différentes : l'estimation par maximum de vraisemblance (MLE) et l'estimation des moindres carrés conditionnels (CLSE). Au Chapitre 2, nous présentons l'estimateur obtenu par la méthode MLE basée sur des observations en temps continu et nous étudions sa consistance et son comportement asymptotique dans des cas ergodiques et non-ergodiques particuliers. Au Chapitre 3, nous présentons l'estimateur obtenu par la méthode CLSE basée sur des observations en temps continu puis discret avec haute fréquence et horizon infini et nous étudions sa consistance et son comportement asymptotique dans des cas ergodiques et non-ergodiques particuliers. Il est à noter ici que nous obtenons les mêmes résultats asymptotiques que dans le cas continu sous des hypothèses supplémentaires sur le pas de discrétisation $ \Delta_N $. Au Chapitre 4, nous étudions le modèle $\mathit{AD}(2, 1)$, également appelé modèle de double Heston. Dans un premier temps, nous introduisons sa classification suivant les cas sous-critique, critique et surcritique. Dans un second temps, nous établissons les théorèmes de stationnarité et d'ergodicité y associés. Dans la partie statistique de ce chapitre, nous étudions les éstimateurs par la méthode MLE et la méthode CLSE du modèle de double Heston en se basant sur des observations en temps continu dans le cas ergodique et nous introduisons les théorèmes de consistance et de normalité asymptotique pour chaque estimateur obtenu.
Abstract: This thesis deals with statistical inference of some particular affine diffusion processes in the state space $\R_+^m\times\R^n$, where $m,n\in\N$. Such subclass of diffusions, denoted by $\mathit{AD}(m,n)$, is applied to the pricing of bond and stock options, which is illustrated for the Vasicek, Cox-Ingersoll-Ross (CIR) and Heston models. In this thesis, we consider two different cases : the first one is when $m=1$ and $n\in\N$ and the second one is when $m=2$ and $n=1$. For the $\mathit{AD}(1,n)$ model, we introduce, in Chapter 2, a classification result where we distinguish three different cases : subcritical, critical and supercritical. Then, we study the stationarity and the ergodicity of its solution under some assumptions on the drift parameters. For the parameter estimation problem, we use two different methods: the maximum likelihood estimation (MLE) and the conditional least squares estimation (CLSE). In Chapter 2, we present the estimator obtained by the MLE method based on continuous time observations and we study its consistency and its asymptotic behavior in ergodic and particular non-ergodic cases. In Chapter 3, we present the estimator obtained by the CLSE method based on continuous then discrete time observations with high frequency and infinite horizon and we study its consistency and its asymptotic behavior in ergodic and particular non-ergodic cases. It is worth to note here that we obtain the same asymptotic results in both discrete and continuous sets under additional assumptions on the discretization step $\Delta_N$. In Chapter 4, we study the $\mathit{AD}(2,1)$ model, called also double Heston model, we introduce first its classification with respect to subcritical, critical and supercritical case and we establish the relative stationarity and ergodicity theorems. In the statistical part of this chapter, we study the MLE and the CLSE of the ergodic double Heston model based on continuous time observations and we introduce its consistency and asymtotic normality theorems for each estimation method.

Οbservatοire de la tactique en (e-)spοrt cοllectif

Doctorant·e: MORTELIER Alexis
Direction de thèse: RIOULT Francois (Directeur·trice de thèse)
Date de la soutenance: 13/12/2024 à 14:00
Lieu de la soutenance: Salle des thèses
Rapporteurs de la thèse: DEVOGELE THOMAS Universite de Tours
IODICE PIERPAOLO UNIVERSITE LE MANS
KAYTOUE MEHDI Maître de conférences HDR INSA Lyon
Membres du jurys: BEN YAHIA SADOK, Maître de conférences, Université de Tunis - Tunisie
DEVOGELE THOMAS, , Universite de Tours
GUIGNARD BRICE, Maître de conférences, Université Claude Bernard - Lyon 1
IODICE PIERPAOLO, , UNIVERSITE LE MANS
KAYTOUE MEHDI, Maître de conférences HDR, INSA Lyon
LE BER FLORENCE, Directeur de recherche, Engees (Strasbourg)
RIOULT Francois, Maître de conférences, UCN - Université de Caen Normandie

Résumé: Cette thèse explore les dynamiques de jeu et les performances collectives en alternant entre les analyses de sports traditionnels, comme le handball, et des e-sports, tels que DotA2 et OverWatch. L'objectif est de segmenter le processus de traitement des données en plusieurs étapes, chacune apportant une compréhension spécifique. En adoptant une approche comparative entre sport et e-sport, ce travail non seulement distingue les différentes étapes de traitement des données, mais propose également une vue d'ensemble de l'analyse du (e-)sport. La première contribution réside dans le développement de techniques de représentation des matchs de handball à l’aide de graphes dynamiques, ainsi que dans la simplification des trajectoires dans DotA2 grâce à des indices géométriques. Ces méthodes permettent une meilleure visualisation et compréhension des mouvements collectifs.La deuxième contribution se concentre sur la définition et le calcul de métriques de performance, essentielles pour l'apprentissage automatique. Des modèles d’expected goal (xG) pour le handball et des facteurs d’engagement dans OverWatch ont été élaborés pour servir de cibles aux algorithmes. La troisième contribution est la création d’un observatoire tactique dédié au handball, et l'étude des configurations géométriques dans DotA2 qui mènent à des événements clés. Ces analyses approfondissent la compréhension des tactiques qui influencent le déroulement des matchs.
Abstract: This thesis explores game dynamics and collective performance by alternating between analyses of traditional sports, such as handball, and e-sports, such as DotA2 and OverWatch. The aim is to segment the data processing process into several stages, each providing a specific understanding. By adopting a comparative approach between sport and e-sport, this work not only distinguishes the different stages of data processing, but also offers an overview of (e-)sport analysis. The first contribution is the development of techniques for representing handball matches using dynamic graphs, and the simplification of trajectories in DotA2 using geometric indices. The second contribution focuses on the definition and calculation of performance metrics, essential for machine learning. Expected goal (xG) models for handball and commitment factors in OverWatch have been developed as targets for algorithms. The third contribution is the creation of a tactical observatory dedicated to handball, and the study of geometric configurations in DotA2 that lead to key events. These analyses deepen our understanding of the tactics that influence the course of matches.

Ηybrid mοdels cοmbining deep neural representatiοns and nοn-parametric patch-based methοds fοr phοtοrealistic image generatiοn

Doctorant·e: SAMUTH Benjamin
Direction de thèse: TSCHUMPERLE DAVID (Directeur·trice de thèse)
RABIN Julien (Co-directeur·trice de thèse)
Date de la soutenance: 13/12/2024 à 14:30
Lieu de la soutenance: Salle des thèses, UFR Sciences, Campus 2, Caen
Rapporteurs de la thèse: CHAINAIS PIERRE Ecole centrale de Lille
GOUSSEAU YANN Telecom Paris
Membres du jurys: CHAINAIS PIERRE, , Ecole centrale de Lille
GOUSSEAU YANN, , Telecom Paris
JURIE Frederic, , UCN - Université de Caen Normandie
PAPADAKIS NICOLAS, , CNRS
RAAD LARA, Maître de conférences, Université publique - Montevideo
RABIN Julien, Maître de conférences HDR, ENSICAEN
TSCHUMPERLE DAVID, , CNRS

Résumé: Le domaine de la génération d'images a récemment connu de fortes avancées grâce aux rapides évolutions des modèles neuronaux profonds. Leur succès ayant atteint une portée au-delà de la sphère scientifique, de multiples inquiétudes et questionnements se sont légitimement soulevées quant à leur fonctionnement et notamment l'usage de leurs données d'entraînement. En effet, ces modèles sont si volumineux en paramètres et coûteux en énergie qu'il en devient difficile d'offrir des garanties et des explications concrètes. À l'inverse, des modèles légers et explicables seraient souhaitables pour répondre à ces nouvelles problématiques, mais au coût d'une qualité et flexibilité de génération moindre. Cette thèse explore l'idée de construire des « modèles hybrides », qui combineraient intelligemment les qualités des méthodes légères ou frugales avec les performances des réseaux profonds. Nous étudions d'abord le cas du transfert de style artistique à l'aide d'une méthode contrainte, multi-échelle, et à patchs. Nous déterminons alors qualitativement l'intérêt d'une métrique perceptuelle dans cette opération. Par ailleurs, nous développons deux méthodes hybrides de génération de visages photoréalistes, à l'aide d'un auto-encodeur pré-entraîné. Le premier s'attaque à la génération de visages avec peu d'échantillons à l'aide de patchs latents, montrant une notable robustesse et des résultats convaincants avec un simple algorithme séquentiel à patchs. Le second offre une solution à la généralisation de la tâche à une plus grande variétés de visages grâce à des modèles de mixtures de gaussiennes. En particulier, nous montrons que ces modèles offrent des performances similaires à d'autres modèles neuronaux, tout en s'affranchissant d'une quantité importante de paramètres et d'étapes de calculs.
Abstract: Image generation has encountered great progress thanks to the quick evolution of deep neural models. Their reach went beyond the scientific domain and thus multiple legitimate concerns and questions have been raised, in particular about how the training data are treated. On the opposite, lightweight and explainable models would be a fitting answer to these emerging problematics, but their quality and range of applications are limited. This thesis strives to build “hybrid models”. They would efficiently combine the qualities of lightweight or frugal methods with the performance of deep networks. We first study the case of artistic style transfer with a multiscale and constrained patch-based method. We qualitatively find out the potential of perceptual metrics in the process. Besides, we develop two hybrid models for photorealistic face generation, each built around a pretrained auto-encoder. The first model tackles the problem of few-shot face generation with the help of latent patches. Results shows a notable robustness and convincing synthesis with a simple patch-based sequential algorithm. The second model uses Gaussian mixtures models as a way to generalize the previous method to wider varieties of faces. In particular, we show that these models perform similarly to other neural methods, while removing a non-negligible number of parameters and computing steps at the same time.

Cοncrete security οf sοme lattice-based cryptοgraphic cοnstructiοns

Doctorant·e: NGUYEN Thi Thu Quyen
Direction de thèse: ROUX-LANGLOIS Adeline (Directeur·trice de thèse)
GIRAUD CHRISTOPHE (Co-directeur·trice de thèse)
WALLET ALEXANDRE (Co-encadrant·e de thèse)
Date de la soutenance: 12/12/2024 à 14:00
Lieu de la soutenance: Campus 2, Université Caen
Rapporteurs de la thèse: EL MRABET Nadia ENSM ST ETIENNE
LAGUILLAUMIE Fabien Université de Montpellier
Membres du jurys: COUVREUR ALAIN, , INRIA Paris
EL MRABET Nadia, , ENSM ST ETIENNE
GIRAUD CHRISTOPHE, , IDEMIA
LAGUILLAUMIE Fabien, , Université de Montpellier
PELLET-MARY ALICE, Chargé de recherche, CNRS
ROUX-LANGLOIS Adeline, Directeur de recherche, UCN - Université de Caen Normandie
WALLET ALEXANDRE, Chargé de recherche, IRISA/INRIA Rennes

Résumé: Cette thèse est préparée entre 2021 et 2024, période qui marque le début de la transition postquantique de la cryptographie à clé publique. De manière générale, la transition post-quantique se réfère à la migration de la cryptographie à clé publique classique vers une cryptographie résistante aux attaques quantiques. Cette thèse aborde certains sujets spécifiques dans la cryptographie fondées sur les réseaux Euclidiens, en particulier, la sécurité concrète de certaines constructions cryptographiques basées sur les réseaux: la signature Mitaka and le KEM Kyber. Dans l’ordre chronologique, nous avons examiné la possibilité d’améliorer la qualité de sécurité des trappes NTRU pour l’échantillonneur hybride (ce dernier étant l’échantillonneur Gaussien discret utilisé dans la signature Mitaka – une variante élégamment simplifiée du futur standard Falcon). Cela a conduit au nouveau algorithme de génération de trappes Antrag qui fournit à l’échantillonneur hybride de meilleures trappes, améliorant ainsi la sécurité des signatures produites par cet échantillonneur. La deuxième contribution concerne l’investigation de la possibilité de casser Kyber à partir d’une trace unique de puissance d’une fonction non protégée pendant le processus de génération de clés. Cela se conclut par une réponse positive pour le cas de Kyber-512.
Abstract: This thesis is prepared between 2021 and 2024 which is a period that witnesses the beginning of the post-quantum transition of the public-key cryptography. Generally speaking, post-quantum transition refers to the migration from classical public-key cryptography to a quantum-resistant one. This thesis addresses some specific topics in lattice-based cryptography, in particular, the concrete security of some lattice-based cryptographic constructions: the signature Mitaka and and the KEM Kyber. In chronological order, we investigated the possibility of improving the security quality of NTRU trapdoors for hybrid sampler (the later is the discrete Gaussian sampler used in the signature Mitaka – an elegantly simplified variant of the future standard Falcon). This led to the new trapdoor generation algorithm Antrag that provides hybrid samplers with better trapdoors, improving the security of the signatures outputted from hybrid samplers. The second contribution involves the investigation of the possibility of breaking Kyber from a single power trace. More precisely, we analysed the power trace of an unprotected function in Kyber’s key generation. The investigation is concluded with a positive answer for the case of Kyber-512.

Cοοrdinatiοn d'une flοtte hétérοgène de rοbοts pοur la récοlte d'infοrmatiοn dans un envirοnnement incοnnu

Doctorant·e: GANDOIS Alvin
Direction de thèse: MOUADDIB Abdel-Illah (Directeur·trice de thèse)
AL FALOU Ayman (Co-directeur·trice de thèse)
Date de la soutenance: 11/12/2024 à 10:30
Lieu de la soutenance: Université de Caen Normandie
Rapporteurs de la thèse: BEYNIER AURÉLIE Maître de conférences UNIVERSITE PARIS 6 PIERRE ET MARIE CURIE
CHARPILLET FRANCOIS UNIVERSITE NANCY 1 HENRI POINCARE
Membres du jurys: AL FALOU Ayman, Directeur de recherche, INST SUP D'ELECTRONIQUE, DU NUMERIQUE
BEYNIER AURÉLIE, Maître de conférences, UNIVERSITE PARIS 6 PIERRE ET MARIE CURIE
CHARPILLET FRANCOIS, , UNIVERSITE NANCY 1 HENRI POINCARE
LE GLOANNEC SIMON, , INST SUP D'ELECTRONIQUE, DU NUMERIQUE
MOUADDIB Abdel-Illah, , UCN - Université de Caen Normandie
SABBADIN REGIS, , INRA DE TOULOUSE

Résumé: Dans cette thèse, nous étudions le problème de la récolte d'information dans un environnement inconnu et partiellement observable avec des agents hétérogènes. Nous considérons un environnement composé de différents points d'intérêt, avec pour objectif de coordonner des agents hétérogènes dans le but de récolter de l'information sur ces points d'intérêt. L'hétérogénéité des agents peut apparaître sous différentes formes : plusieurs agents ayant des capacités d'observation différentes, des capacités d'embarquement différentes, des ressources différentes, ou bien un seul agent embarquant plusieurs capteurs hétérogènes. Dans un premier temps, nous avons proposé un modèle de récolte d'information avec plusieurs agents hétérogènes dans un environnement partiellement observable mais topologiquement connu. Ce modèle, que nous avons nommé Meta-MDP, est basé sur les processus décisionnels de Markov, et fonctionne en deux parties : premièrement, pour chaque agent et chaque point d'intérêt, nous calculons une politique pour récolter de l'information sur ce point. Ensuite, nous calculons une politique d'allocation des points d'intérêts aux agents de manière à optimiser la récolte d'information sur le long terme. Nous avons ensuite étendu ce modèle au cas où nous avons un agent embarquant plusieurs capteurs hétérogènes (typiquement un capteur laser et une caméra) dans un environnement inconnu dans le but de construire une carte de l'environnement tout en récoltant de l'information sur les éventuels points d'intérêt.
Abstract: In this thesis, we study the problem of information gathering in an unknown and partially observable environment with heterogeneous agents. We consider an environment containing a set of interest points, with the objective of coordinating heterogeneous agents in order to gather information on these points. The heterogeneity of the agents can manifest in various ways: multiple agents with different observation capacities, different transport capabilities, varying resources, or a single agent equipped with multiple heterogeneous sensors. We started by proposing a model to gather information with multiple heterogeneous agents in a partially observable yet topologically known environment. This model, which we have named Meta-MDP, is based on Markov decision processes and operates in two stages: first, for each agent and each interest point, we calculate a policy to gather information on that particular point. Then, we compute a policy for allocating interest points to agents in a way that optimizes long-term information gathering. Then, we extended this model to the case where a single agent, equipped with multiple heterogeneous sensors (typically a laser sensor and a camera), operates in an unknown environment with the goal of building a map of the environment while simultaneously gathering information on potential interest points.

Annοtatiοn autοmatique du sοmmeil par classifieurs définis sur la variété des matrices SDΡ

Doctorant·e: SERAPHIM Mathieu
Direction de thèse: BRUN Luc (Directeur·trice de thèse)
ETARD Olivier (Co-directeur·trice de thèse)
Date de la soutenance: 11/12/2024 à 09:00
Lieu de la soutenance: Bât Science 3, salle des thèses 1er étage. Boulevard du Maréchal Juin CS 14032 14032 Caen Cedex 5
Rapporteurs de la thèse: ACHARD SOPHIE Universite Grenoble Alpes
CHEVALLIER SYLVAIN Université Paris Saclay
Membres du jurys: ACHARD SOPHIE, , Universite Grenoble Alpes
BRUN Luc, , ENSICAEN
CHEVALLIER SYLVAIN, , Université Paris Saclay
DUPÉ FRANÇOIS-XAVIER, Maître de conférences, Aix-Marseille université
ETARD Olivier, , UCN - Université de Caen Normandie
LECHERVY Alexis, Maître de conférences, UCN - Université de Caen Normandie

Résumé: L'annotation de l'état de sommeil d'un sujet à partir de signaux électroencéphalographiques (EEG) est un processus coûteux. Par conséquent, de nombreuses approches d'automatisation ont été proposées, notamment en apprentissage profond. Néanmoins, celles-ci n'ont pas encore atteint un niveau de performance suffisant pour voir une utilisation clinique, notamment au vu des différences entre enregistrements EEG, et des difficultés à classifier des enregistrements issus d'un environnement différent. Dans cette thèse, nous nous attaquons à ce problème sous un nouvel angle, en représentant chaque subdivision temporelle (ou « époque ») des signaux EEG par une série de matrices de covariance. Ces matrices, pourtant utilisées en analyse EEG pour les interfaces cerveau-machine (ICM), sont absentes en annotation du sommeil. Elles sont généralement symétriques définies positives (SDP), avec l'ensemble des matrices SDP formant un variété riemannienne non-euclidienne. De fait, analyser cet ensemble à l'aide d'opérations euclidiennes introduit des artefacts de calcul~; d'où la nécessité d'employer des opérations riemanniennes respectant la courbure de cet espace. Pour ce faire, nous construisons un modèle profond de type Transformer, modifié pour permettre l'analyse de séquences de matrices SDP tout en respectant la structure de la variété. Nous démontrons que cette approche est non seulement performante, mais résulte également en un modèle résilient au changement de base de données.
Abstract: The scoring of a subject's sleep stages from electroencephalographic (EEG) signals is a costly process. As such, many approaches to its automation have been proposed, including ones based on Deep Learning. However, said approaches have yet to attain a level of performance good enough for use in clinical settings, in part due to the high variability between EEG recordings, and the challenges inherent to the classification of signals recorded in different environments. In this thesis, we tackle this issue through a novel angle, by representing each epoch within our EEG signals as a timeseries of covariance matrices. Said matrices, although a common tool for EEG analysis in Brain-Computer Interfaces (BCI), are not typically utilized in sleep stage scoring. Covariance matrices tend to be symmetric positive definite (SPD), with the set of SPD matrices forming a non-Euclidean Riemannian manifold. As such, a Euclidean analysis of SPD matrices leads to computational artifacts, hence the need to utilize Riemannian operations instead, i.e. operations that respect the curvature of the manifold. To do so, we develop a Transformer-style deep neural network, modified to allow for the analysis of sequences of SPD matrices while still conforming to the structure of the manifold. From there, we demonstrate both the high level of performance of this approach, and its resilience to dataset changes.

A visiοn-based mixed-reality framewοrk fοr testing autοnοmοus driving systems

Doctorant·e: ARGUI IMANE
Direction de thèse: AINOUZ SAMIA (Directeur·trice de thèse)
GUERIAU MAXIME (Co-encadrant·e de thèse)
Date de la soutenance: 10/12/2024 à 10:00
Lieu de la soutenance: INSA Rouen Normandie
Rapporteurs de la thèse: FREMONT VINCENT Ecole Centrale Nantes
STRAUSS OLIVIER Université de Montpellier
Membres du jurys: AINOUZ SAMIA, , INSA Rouen Normandie
FREMONT VINCENT, , Ecole Centrale Nantes
GUERIAU MAXIME, , INSA Rouen Normandie
HACHEMI HIND, , INSA Rouen Normandie
SPALANZANI ANNE, , Université Grenoble Alpes
STRAUSS OLIVIER, , Université de Montpellier

Résumé: Cette thèse explore le développement et la validation des systèmes de navigation autonome dans un environement de réalité mixte (RM), avec pour objectif de combler l’écart entre la simulation virtuelle et les tests en conditions réelles. Les travaux mettent l’accent sur le potentiel des environnements en réalité mixte pour tester les systèmes autonomes de manière sûre, efficace et économique. La thèse est structurée en plusieurs parties, et commence par une revue des technologies de pointe dans la navigation autonome et les applications en réalité mixte. En utilisant des modèles à base de règles et des modèles d’apprentissage, des expérimentations visent à évaluer les performances des robots autonomes dans des environnements simulés, réels et de RM. Un des objectifs principaux est de réduire le « reality gap »—c’est-à-dire la différence entre les comportements observés en simulation et ceux observés dans des applications réelles—en intégrant des éléments réels avec des composants virtuels dans des envi- ronnements de RM. Cette approche permet des tests et une validation plus proche des contraintes réelles sans les risques associés aux essais physiques. Une partie importante du travail est consacrée à la mise en œuvre et au test d’une stratégie d’augmentation hors ligne visant à améliorer les capacités de perception des systèmes autonomes à l’aide des informations de profondeur. De plus, l’apprentissage par renforcement est appliqué pour évaluer son potentiel dans les environnements de RM. La thèse démontre que ces modèles peuvent apprendre effi- cacement à naviguer et à éviter les obstacles dans des simulations virtuelles et obtenir des résultats similaires lorsqu’ils sont transférés dans des environnements de RM, soulignant la flexibilité du cadre pour différents modèles de systèmes autonomes. À travers ces expériences, la thèse montre le potentiel des environnements de réalité mixte comme une plateforme polyvalente et robuste pour faciliter le développement des technologies de navigation autonome, offrant une approche plus sûre et plus évolutive pour la validation des modèles avant leur déploiement dans le monde réel.
Abstract: This thesis explores the development and validation of autonomous navigation systems within a mixed-reality (MR) framework, aiming to bridge the gap between virtual simulation and real-world testing. The research emphasizes the potential of MR environments for safely, efficiently, and cost-effectively testing autonomous systems. The thesis is structured around several chapters, beginning with a review of state-of-the-art technologies in autonomous navigation and mixed-reality applications. Through both rule-based and learning-based models, the research investigates the performance of autonomous robots within simulated, real, and MR environments. One of the core objectives is to reduce the "reality gap"—the discrepancy between behaviors observed in simulations versus real-world applications—by integrating real- world elements with virtual components in MR environments. This approach allows for more accurate testing and validation of algorithms without the risks associated with physical trials. A significant part of the work is dedicated to implementing and testing an offline augmentation strategy aimed at enhancing the perception capabilities of autonomous systems using depth information. Furthermore, reinforcement learning (RL) is applied to evaluate its potential within MR environments. The thesis demonstrates that RL models can effectively learn to navigate and avoid obstacles in virtual simulations and perform similarly well when transferred to MR environments, highlighting the framework’s flexibility for different autonomous system models. Through these experiments, the thesis establishes MR environments as a versatile and robust platform for advancing autonomous navigation technologies, offering a safer, more scalable approach to model validation before real-world deployment.

Οptimisatiοn des stratégies d'anticipatiοn lοrs des cοups de pieds arrêtés en fοοtball

Doctorant·e: LIBREAU Clement
Direction de thèse: BENGUIGUI Nicolas (Directeur·trice de thèse)
Date de la soutenance: 10/12/2024 à 14:00
Lieu de la soutenance: Université Caen Normandie
Rapporteurs de la thèse: CRAIG CATHY COLERAINE - UNIVERSITY OF ULSTER
MONTAGNE GILLES Aix-Marseille université
Membres du jurys: BENGUIGUI Nicolas, , UCN - Université de Caen Normandie
BUEKERS MARTINUS, , LEUVEN - KATHOLIEKE UNIVERSITEIT
CRAIG CATHY, , COLERAINE - UNIVERSITY OF ULSTER
MONTAGNE GILLES, , Aix-Marseille université
RIOULT Francois, Maître de conférences, UCN - Université de Caen Normandie
ZOUDJI BACHIR, , Université polytechnique Hauts de France

Résumé: Dans le sport moderne, l’analyse scientifique des performances s’est largement développée. Dans le football, ces analyses apportent de plus en plus de données à haut potentiel pour l’optimisation des performances. C’est le cas notamment pour l’analyse des performances sur coups de pieds arrêtés et particulièrement des corners, ce qui permet aujourd’hui de disposer de nombreuses données sur ces phases de jeu pour mieux les comprendre et potentiellement les améliorer à l’entrainement. Il faut noter que la plupart des études portent sur le football masculin et qu’il y a un vrai manque pour le football féminin. De plus, il existe très peu d’études qui ont abordé les possibilités d’amélioration des performances à partir de ces bases de données. Dans le cadre de cette thèse CIFRE, réalisée en collaboration entre l'Université de Caen-Normandie et le club de football du Montpellier Hérault Sport Club (MHSC), où je suis rattaché à l'équipe professionnelle féminine, nous avons structuré notre démarche empirique en nous appuyant sur la démarche d’analyse de la performance experte proposée par Williams et Ericsson (2005). Cette approche repose sur trois étapes : la capture de la performance experte, l’identification des mécanismes sous-jacents qui expliquent cette performance, et l'examen des processus d’entrainement qui contribuent au développement de cette expertise. Dans ce cadre, nous avons mené une première étude visant à analyser les différents corners tirés lors des matchs de championnat afin d'identifier les variables permettant de maximiser la performance en termes de tirs et de buts. Les meilleures performances sont réalisées quand le corner est tiré avec un effet rentrant (c’est-à-dire avec une courbe qui se rapproche du but) dans les zones du premier poteau et du point de penalty. Ces résultats ont ensuite été exploités dans le but d’améliorer la performance en mettant en place deux phases d’entraînement distinctes. La première phase consistait en un protocole d’entraînement global sur le terrain avec l'équipe féminine du MHSC, visant à optimiser leur performance lors des corners pendant les matchs de championnat. La seconde phase reposait sur un entraînement spécifique basé sur l’utilisation de la vidéo. Durant cette phase, les joueuses ont été entrainées avec des vidéos de corners filmées à la première personne dans lesquelles elles devaient de prédire la zone d'arrivée du ballon après occultation de la dernière partie de la trajectoire. L'objectif de ces deux phases d’entraînement était d'améliorer leur performance à travers l’optimisation de leurs capacités perceptivo-décisionnelles et motrices. Cela a non seulement permis d’améliorer les performances des joueuses lors des corners à l’entraînement, aussi dans les performances en matchs officiels. Ces résultats confirment le potentiel de ces protocoles d'entraînement et contribuent à une meilleure compréhension des stratégies d'anticipation, notamment en ce qui concerne la coordination avec la joueuse qui tire le corner et la prédiction des trajectoires de ballon.
Abstract: In modern sport, the scientific analysis of performance has developed considerably. In football, these analyses are providing more and more data with high potential for optimising performance. This is particularly the case for the analysis of set-piece performance, and corner kicks in particular, which means that we now have a wealth of data on these phases of the game, enabling us to understand them better and potentially improve them in training. It should be noted that most studies focus on men's football and that there is a real lack of data on women's football. In addition, there are very few studies that have looked at the potential for improving performance using these databases. As part of this CIFRE thesis, carried out in collaboration between the University of Caen-Normandie and the Montpellier Hérault Sport Club (MHSC) football club, where I am attached to the women's professional team, we structured our empirical approach based on the expert performance analysis approach proposed by Williams and Ericsson (2005). This approach is based on three stages: capturing expert performance, identifying the underlying mechanisms that explain this performance, and examining the training processes that contribute to the development of this expertise. Within this framework, we conducted an initial study aimed at analysing the various corners taken during league matches in order to identify the variables that maximise performance in terms of shots and goals. The best performances were achieved when the corner was taken with an inward curve (i.e. with a curve approaching the goal) in the areas of the near post and the penalty spot. These results were then used to improve performance by implementing two separate training phases. The first phase consisted of a comprehensive on-field training protocol with the MHSC women's team, aimed at optimising their performance during penalty corners in league matches. The second phase involved specific training based on the use of video. During this phase, the players were trained with videos of corners filmed in the first person to predict the ball’s arrival zone after the final part of the trajectory has been occluded. The aim of these two training phases was to improve their performance by optimising their perceptual-decisional and motor skills. This not only improved the players' performance in training corners, but also their performance in official matches. These results confirm the potential of these training protocols and contribute to a better understanding of anticipation strategies, particularly in terms of coordination with the player taking the corner and predicting ball trajectories.

Cοde-Based Cryptοgraphy: Ηard Ιnstances fοr Decοding Ρrοblems

Doctorant·e: BURLE Etienne
Direction de thèse: OTMANI AYOUB (Directeur·trice de thèse)
Date de la soutenance: 10/12/2024 à 14:00
Lieu de la soutenance: UFR Sciences et Techniques (Madrillet) - Université de Rouen Normandie
Rapporteurs de la thèse: LOIDREAU PIERRE UNIVERSITE RENNES 1
SENDRIER NICOLAS
Membres du jurys: BARDET MAGALI, , URN - Université de Rouen Normandie
DEBRIS ALAZARD THOMAS, , Centre Regional de l'Inria Saclay Ile de France
GABORIT PHILIPPE, , Université de Limoges
LOIDREAU PIERRE, , UNIVERSITE RENNES 1
OTMANI AYOUB, , URN - Université de Rouen Normandie
SENDRIER NICOLAS, ,
TILLICH JEAN-PIERRE, ,
ZEMOR GILLES, , Universite de Bordeaux

Résumé: La sécurité des schémas cryptographiques à clef publique couramment utilisés repose sur la difficulté de problèmes de théorie des nombres. Mais depuis la découverte de l'algorithme quantique de Shor en 1994, on sait qu'un ordinateur quantique pourrait résoudre ces problèmes en temps polynomial. De là la nécessité de construire des primitives cryptographiques dont la sécurité repose sur des problèmes qui résistent à l'ordinateur quantique. Un des principaux candidats est le problème de décodage, qui est à la base de la cryptographie basée sur les codes correcteurs d'erreur. Cette thèse est une contribution pour améliorer la confiance que l'on peut avoir en la difficulté de ce problème et en ses applications cryptographiques. En premier lieu, grâce à une réduction pire cas-cas moyen, nous démontrons qu'à partir d'un code arbitraire quelconque il est possible de générer des distributions pseudoaléatoires de codes aussi dures à décoder que le code arbitraire préalablement choisi. Nous prouvons ce résultat pour la métrique de Hamming, puis nous l'adaptons au problème de décodage en métrique rang. Dans les deux cas le principal outil pour obtenir la réduction est la construction de codes pseudoaléatoires dont la distance minimale est linéaire. En second lieu, nous construisons un schéma de chiffrement à clef publique en métrique rang dont la sécurité repose uniquement sur des hypothèses de sécurité classiques et qui possède la particularité d'avoir une clef publique statistiquement indistinguable de l'uniforme pour certaines zones de paramètres. Cette construction se base sur une généralisation des codes LRPC (Low Rank Parity Check) et sur l'approche multidimensionnelle qui consiste à décoder simultanément plusieurs mots de codes paratageant le même support. Nous améliorons également la borne supérieur théorique de la probabilité d'erreur lors du décodage des codes LRPC.
Abstract: The security of public key cryptographic schemes that are currently used rely on the hardness of number theory problems. However, we know that a quantum computer could solve these problems in polynomial time since the discovery of Shor's algorithm in 1994. That is why we need to construct cryptographic primitives whose security relies on problems which resist to quantum computers. For that purpose, one of the main candidate is the decoding problem which is at the basis of code-based cryptography. This thesis is a contribution to strengthen the trust we can have in the hardness of this problem and in its cryptographic applications. Firstly, we show that from any arbitrary code it is possible to construct a distribution of pseudorandom codes that are at least as hard to decode as the priorly chosen arbitrary code thanks to a worst-case to average-case reduction. We prove this result in Hamming metric before adapting it in the rank metric context. In both cases, the main tool for getting the reduction is the construction of pseudorandom codes whose minimum distance is linear. Secondly, we build a rank-based public key encryption scheme whose security relies only on classical security assumptions. This scheme also has the particularity to get public keys which are statistically indistinguishable from the uniform for some zones of parameters. Its construction is based on a generalisation of LRPC (Low Rank Parity Check) codes and on the multidimensional approach which consists in decoding simultaneously several codewords sharing the same support. We also improve the theoretical upper bound of the probability of failure when decoding LRPC codes.

Enrichissement et alignement sémantique d'οntοlοgies biοmédicales par mοdèles de langue

Doctorant·e: MENAD Safaa
Direction de thèse: SOUALMIA FATIMA (Directeur·trice de thèse)
Date de la soutenance: 06/12/2024 à 14:30
Lieu de la soutenance: UFR ST - Amphi Curib - MSA
Rapporteurs de la thèse: TANNIER XAVIER Sorbonne Universite
TROJAHN CASSIA Université Toulouse 2 Jean Jaurès
Membres du jurys: ABDEDDAIM SAID, , URN - Université de Rouen Normandie
ABROUK LYLIA, , Universite Bourgogne Europe
LECROQ THIERRY, , URN - Université de Rouen Normandie
SOUALMIA FATIMA, , URN - Université de Rouen Normandie
TANNIER XAVIER, , Sorbonne Universite
TROJAHN CASSIA, , Université Toulouse 2 Jean Jaurès

Résumé: La première partie de cette thèse traite de la conception de modèles neuronaux siamois entraînés pour la similarité sémantique entre textes biomédicaux et de leur application à des tâches de TAL sur des documents biomédicaux. L’entraînement de ces modèles a été réalisé en plongeant les titres et résumés du corpus PubMed avec le thésaurus MeSH dans un même espace de représentation. Dans la seconde partie nous utilisons ces modèles pour aligner et enrichir les terminologies de l’UMLS (Unified Medical Language System) et automatiser l’intégration de nouvelles relations entre concepts similaires provenant notamment de maladies (DOID), de médicaments (DRON) et de symptômes. Ces relations enrichies permettent d’améliorer l’exploitation de ces ontologies, facilitant ainsi leur utilisation dans diverses applications cliniques et scientifiques. Nous proposons de plus des approches de validation à l’aide des ressources telles que les LLMs, l’OpenFDA, le Métathésaurus et le réseau sémantique de l’UMLS que nous complétons par la validation manuelle d’experts du domaine.
Abstract: The first part of this thesis addresses the design of siamese neural models trained for semantic similarity between biomedical texts and their application to NLP tasks on biomedical documents. The training of these models was performed by embedding the titles and abstracts from the PubMed corpus along with the MeSH thesaurus into a common space. In the second part, we use these models to align and enrich the terminologies of UMLS (Unified Medical Language System) and automate the integration of new relationships between similar concepts, particularly from diseases (DOID), drugs (DRON), and symptoms. These enriched relationships enhance the usability of these ontologies, thereby facilitating their application in various clinical and scientific domains. Additionally, we propose validation approaches using resources such as LLMs, OpenFDA, the UMLS Metathesaurus, and the UMLS semantic network, supplemented by manual validation from domain experts.

Cοntributiοns tο Advanced Dynamic Graph Νeural Νetwοrks

Doctorant·e: YANG Leshanshui
Direction de thèse: ADAM SÉBASTIEN (Directeur·trice de thèse)
CHATELAIN CLEMENT (Co-directeur·trice de thèse)
Date de la soutenance: 06/12/2024 à 13:30
Lieu de la soutenance: UFR Sciences et Techniques, Amphithéâtre D, Av. de l'Université 76800 Saint-Étienne-du-Rouvray
Rapporteurs de la thèse: RAGOT NICOLAS Universite de Tours
RAMEL JEAN-YVES Université Savoie Mont Blanc
Membres du jurys: ADAM SÉBASTIEN, , URN - Université de Rouen Normandie
BRUN LUC, , ENSICAEN
CHATELAIN CLEMENT, , INSA Rouen Normandie
RAGOT NICOLAS, , Universite de Tours
RAMEL JEAN-YVES, , Université Savoie Mont Blanc
VERNET MATHILDE, , Universite Avignon Pays du Vaucluse

Résumé: Ce manuscrit présente les recherches menées dans le cadre d'une thèse CIFRE réalisée en partenariat entre le LITIS et Saagie. Les représentations à base de Graphes Dynamiques (DG), qui intègrent à la fois des informations topologiques et temporelles, sont de plus en plus utilisées pour modéliser des systèmes dynamiques tels que les réseaux sociaux, les systèmes de recommandation et les réseaux de transactions. Les réseaux de neurones sur graphes dynamiques (DGNN) sont récemment devenus l'approche à l'état de l’art dans ce domaine, avec une multitude de modèles proposés. Cependant, l'hétérogénéité et la complexité des DGs présentent des défis significatifs dans la formulation des tâches prédictives et la catégorisation des architectures DGNNs. Dans cette thèse, nous abordons d'abord le manque d'un cadre global pour définir et catégoriser les tâches prédictives sur les graphes dynamiques. Nous proposons une taxonomie qui prend en compte des facteurs tels que le graphe dynamique soit en temps discret ou en temps continu, la nature transductive ou inductive de la tâche, et la granularité de la sortie. Cette taxonomie clarifie les distinctions entre les différents contextes d'apprentissage sur les graphes dynamiques et les aligne avec les applications et jeux de données pertinents. En nous appuyant sur cette base, nous explorons la conception de modèles statistiques capables d'extraire les informations clés des graphes dynamiques. Nous introduisons une taxonomie des modèles DGNNs basée sur la manière dont ils intègrent l'information temporelle et examinons leur compatibilité avec différents contextes d'apprentissage, fournissant ainsi des pistes pour la conception et l'optimisation des DGNNs. Malgré les avancées dans la conception des DGNNs, de nombreux encodeurs de graphes ont une expressivité limitée. Les convolutions de graphes conçues spectralement, connues pour offrir une plus grande expressivité sur les graphes statiques en filtrant les valeurs propres du Laplacien pour calculer les noyaux de convolution, restent largement inexplorées sur les graphes dynamiques en temps discret (DTDG). Pour améliorer l'expressivité des DGNNs, nous introduisons le Dynamic Spectral-Parsing Graph Neural Network (DspGNN), un nouveau modèle qui optimise la convolution de graphes statiques conçue spectralement sur les DTDGs et qui répond aux défis computationnels de la décomposition spectrale sur de grands DTDGs. Les résultats expérimentaux montrent que DspGNN surpasse les modèles de référence sur les tâches de régression d'attributs d'arêtes et atteint des performances à l'état de l'art sur les tâches de prédiction de liens. Enfin, nous abordons la problématique de l'encodage des nouveaux nœuds émergents dans les graphes dynamiques sans attributs, une situation courante dans les tâches de détection d'anomalies. Nous proposons le Dual-Contextual Inductive Dynamic Graph Transformer (DCIDGT), qui capture à la fois les contextes global et local pour la détection d'anomalies. Au cœur de cette approche se trouve notre mécanisme d'Accumulative Causal Walk Alignment (ACWA), assurant l'alignement sémantique des embeddings de nœuds à travers les instantanés en résolvant le problème d'Orthogonal Procrustes. Les résultats expérimentaux montrent que DCIDGT surpasse significativement les modèles de référence dans la tâche de détection d'anomalies sur les arêtes, ouvrant de nouvelles perspectives pour gérer les nouveaux nœuds émergents ou les attributs incomplets dans les graphes dynamiques.
Abstract: This manuscript presents the research carried out within the framework of the CIFRE thesis conducted in partnership between LITIS and Saagie. Dynamic graph representations, integrating both topological and temporal information, are increasingly used to model dynamic systems such as social networks, recommender systems, and transaction networks. Dynamic Graph Neural Networks (DGNN) have become the state-of-the-art approach in this area, and a plethora of models have recently been proposed. However, the heterogeneity and complexity of dynamic graphs present significant challenges in formulating predictive tasks and categorising DGNN architectures. In this thesis, we first address the lack of a comprehensive framework for defining and categorising predictive tasks on dynamic graphs by proposing a taxonomy that considers factors including whether the graph is in discrete or continuous time, whether the task is transductive or inductive, and the output granularity. This taxonomy clarifies distinctions between dynamic graph learning settings and aligns them with relevant applications and datasets. Building upon this foundation, we explore the design of statistical models that learn key information from dynamic graphs. We introduce a taxonomy of DGNN models based on how they incorporate temporal information and examine their compatibility with different learning settings, providing guidelines for designing and optimising DGNNs. Despite advances in the design of DGNNs, many graph encoders have limited expressive power. Spectral-designed graph convolutions, known to provide greater expressiveness on static graphs by filtering the Laplacian eigenvalues to compute convolutional kernels, remain largely unexplored on Discrete Time Dynamic Graphs (DTDG). To improve the expressiveness of DGNNs, we introduce the Dynamic Spectral-Parsing Graph Neural Network (DspGNN), a novel model that optimises spectral-designed static graph convolution on DTDGs and addresses the computational challenges of eigendecomposition on large DTDGs. Experimental results show that DspGNN outperforms baseline models on edge attribute regression tasks and achieves state-of-the-art performance on link prediction tasks. Finally, we tackle unseen node encoding in unattributed dynamic graphs, which is a common problem in anomaly detection tasks. We propose the Dual-Contextual Inductive Dynamic Graph Transformer (DCIDGT), which effectively captures both global and local contexts for anomaly detection. Central to this approach is our proposed Accumulative Causal Walk Alignment (ACWA) mechanism, ensuring semantic alignment of random walk-based node embeddings across snapshots by solving the Orthogonal Procruste problem. Experimental results show that DCIDGT significantly outperforms existing baselines on the edge anomaly detection task, opening new avenues for handling newly emerging nodes or incomplete node attributes in dynamic graphs.

Generatiοn and Analysis οf Dynamic Graphs

Doctorant·e: BRIDONNEAU Vincent
Direction de thèse: GUINAND FREDERIC (Directeur·trice de thèse)
PIGNE YOANN (Co-directeur·trice de thèse)
PIGNE YOANN (Co-encadrant·e de thèse)
Date de la soutenance: 03/12/2024 à 10:00
Lieu de la soutenance: Université Le Havre Normandie
Rapporteurs de la thèse: BUI-XUAN BINH-MINH Sorbonne Universite
INTERDONATO ROBERTO CIRAD MONTPELLIER
Membres du jurys: BUI-XUAN BINH-MINH, , Sorbonne Universite
GAITO SABRINA, , UNIVERSITE DE MILAN
GUINAND FREDERIC, , ULHN - Université Le Havre Normandie
INTERDONATO ROBERTO, , CIRAD MONTPELLIER
PIGNE YOANN, , ULHN - Université Le Havre Normandie

Résumé: La nature et les sociétés humaines offrent de nombreux exemples de systèmes composés d'entités qui interagissent, communiquent ou sont simplement connectées les unes aux autres. La théorie des graphes offre un excellent formalisme pour modéliser ces systèmes complexes, allant des réseaux sociaux aux systèmes biologiques. La plupart des phénomènes observés dans ces réseaux peuvent s'exprimer sous forme de propriétés sur les graphes. On peut notamment citer le phénomène du « petit monde » ou les réseaux dits « sans échelle ». Comprendre les mécanismes sous-jacents à leur évolution est essentiel pour saisir les dynamiques de ces réseaux. Différents mécanismes existent pour reproduire les propriétés observées. Parmi eux, on peut citer l'attachement préférentiel, utilisé notamment par le modèle de Barabasi-Albert (BA), qui permet de produire des séquences de graphes croissants sans échelle. Dans une direction parallèle, on peut également étendre le concept de graphe en y ajoutant une dimension temporelle. Dans ce cas, les propriétés statiques des graphes sont retravaillées pour tenir compte de l'évolution des graphes dans le temps. Par exemple, on peut citer la notion de trajet qui, semblable à celle de chemin, traduit la possibilité de se déplacer d'un sommet à un autre en respectant des contraintes temporelles. De même que dans le cas des réseaux complexes, la capacité à générer des graphes temporels est étudiée afin de produire des graphes aux propriétés spécifiques. On peut par exemple évoquer le modèle Edge-Markovian Graph, un processus stochastique permettant de produire des graphes et d’étudier des problèmes de communication. L'observation de ces mécanismes de génération donne naissance à la problématique de cette thèse, qui réside dans l'étude de processus itératifs de génération de graphes temporels. Lorsqu'un graphe est obtenu par itérations successives d'un tel mécanisme, on parle d'un graphe dynamique. Cette dénomination met en avant l'aspect itératif du processus pour produire une séquence ordonnée de graphes. Une question nous a particulièrement intéressés dans le cadre de ce travail : que se passe-t-il lorsqu’un générateur n'est soumis à aucune contrainte, notamment en ce qui concerne l'évolution du nombre de sommets au fil du temps ? Cette situation soulève deux problématiques : la possibilité qu'un processus conduise à des graphes périodiques au-delà d'un certain moment et la quantification des changements entre deux étapes consécutives du processus. Pour répondre à ces interrogations, nous avons introduit deux métriques. La première, que nous avons appelé sustainability, et que l'on peut traduire par pérennité, est une mesure qualitative : un générateur est dit sustainable s'il produit des graphes qui ne deviennent ni vides ni périodiques. La seconde métrique, le DynamicScore, quantifie les changements entre deux instants successifs, à la fois au niveau des sommets (V-DynamicScore) et des arêtes (E-DynamicScore). Pour démontrer la pertinence de la notion de pérennité, nous avons défini et étudié un générateur de graphes mettant en évidence les nombreux défis rencontrés lors de l'exploration de cette notion. En ce qui concerne le DynamicScore, nous l'avons testé sur divers générateurs ainsi que sur des données réelles, démontrant sa capacité à capturer la dynamique d’un réseau, qu’il soit artificiel ou réel. L’étude de ces deux concepts a ouvert la voie à de nombreuses nouvelles questions et renforcé les liens entre l’analyse des réseaux complexes et la théorie des graphes temporels.
Abstract: In this thesis, we investigate iterative processes producing a flow of graphs. These processes find applications both in complex networks and time-varying graphs. Starting from an initial configuration called a seed, these processes produce a continuous flow of graphs. A key question arises when these processes impose no constraints on the size of the generated graphs: under what conditions can we ensure that the graphs do not become empty? And how can we account for the changes between successive steps of the process? To address the first question, we introduced the concept of sustainability, which verifies whether an iterative process is likely to produce graphs with periodic behaviors. We defined and studied a graph generator that highlights the many challenges encountered when exploring this notion. Regarding the second question, we designed a metric to quantify the changes occurring between two consecutive steps of the process. This metric was tested on various generators as well as on real-world data, demonstrating its ability to capture the dynamics of a network, whether artificial or real. The study of these two concepts has opened the door to many new questions and strengthened the connections between complex network analysis and temporal graph theory.

Système de Ρréventiοn cοntre les vulnérabilités et de Détectiοn des Anοmalies dans les Réseaux Ιnfοrmatiques

Doctorant·e: KASSE Mamadou
Direction de thèse: BERRED ALEXANDRE (Directeur·trice de thèse)
BERTELLE CYRILLE (Co-directeur·trice de thèse)
CHARRIER RODOLPHE (Co-encadrant·e de thèse)
Date de la soutenance: 29/11/2024 à 14:00
Lieu de la soutenance: Amphi Normand
Rapporteurs de la thèse: FONLUPT CYRIL ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
N'GUESSAN ASSI LAZARE UNIVERSITE LILLE 1 SCIENCES ET TECHNOLOGIE
Membres du jurys: BERRED ALEXANDRE, , ULHN - Université Le Havre Normandie
BERTELLE CYRILLE, , ULHN - Université Le Havre Normandie
CHARRIER RODOLPHE, , ULHN - Université Le Havre Normandie
FONLUPT CYRIL, , ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
N'GUESSAN ASSI LAZARE, , UNIVERSITE LILLE 1 SCIENCES ET TECHNOLOGIE
NGATCHOU WANDJI JOSEPH, , Université de Lorraine
SELMI CARLA, , UNIVERSITE DE ROUEN NORMANDIE
ZEDDINI BESMA, , CY TECH CERGY PARIS

Résumé: Les outils de prévention des vulnérabilités et de détection des anomalies sont essentiels pour la sécurité des réseaux informatiques. Cette thèse se concentre sur l'utilisation des données du MITRE ATT&CK, des scores CVSS et de la norme ISO 27002:2022 pour automatiser et consolider l'analyse des vulnérabilités et la détection des anomalies. Les objectifs principaux sont : - Diagnostic de vulnérabilité : Identifier les sous-réseaux les plus vulnérables en combinant les données du MITRE ATT&CK, des scores CVSS et de la norme ISO 27002:2022. Pour cela, une base de données appelée Data ISO-MA a été créée. Un algorithme évalue la vulnérabilité des chemins dans le réseau, identifiant ceux les plus à risque. - Détection d’anomalies : Analyser les flux de trafic pour détecter des comportements inhabituels dans les chemins vulnérables. Une approche inspirée du modèle Path-scan de Joshua Neil et al. (2013) a été utilisée. Chaque connexion réseau est modélisée avec un modèle de Markov à 3 états et la statistique du rapport de vraisemblance généralisé (GLRT), permettant de capturer et d'identifier les comportements anormaux. Ces deux outils visent à renforcer la sécurité des réseaux informatiques en fournissant une solution intégrée pour la prévention des vulnérabilités et la détection des anomalies.
Abstract: Tools for vulnerability prevention and anomaly detection are essential for the security of computer networks. This thesis focuses on using MITRE ATT&CK data, CVSS scores, and the ISO 27002:2022 standard to automate and consolidate vulnerability analysis and anomaly detection. The main objectives are: -Vulnerability Diagnosis: Identify the most vulnerable sub-networks by combining MITRE ATT&CK data, CVSS scores, and the ISO 27002:2022 standard. To achieve this, a database called Data ISO-MA was created. An algorithm evaluates the vulnerability of network paths, identifying those most at risk. - Anomaly Detection: Analyze traffic flows to detect unusual behaviors in vulnerable paths. An approach inspired by the Path-scan model introduced by Joshua Neil et al. (2013) was used. Each network connection is modeled with a 3-state Markov model and the Generalized Likelihood Ratio Test (GLRT), allowing for the capture and identification of abnormal behaviors. These two tools aim to enhance the security of computer networks by providing an integrated solution for vulnerability prevention and anomaly detection.

Extractiοn d'infοrmatiοn dans des dοcuments histοriques à l'aide de grands mοdèles multimοdaux

Doctorant·e: CONSTUM Thomas
Direction de thèse: PAQUET THIERRY (Directeur·trice de thèse)
TRANOUEZ PIERRICK (Co-encadrant·e de thèse)
Date de la soutenance: 28/11/2024 à 10:30
Lieu de la soutenance: Rouen
Rapporteurs de la thèse: LEMAITRE AURELIE Université Rennes 2
LIKFORMAN-SULEM LAURENCE ENST PARIS
Membres du jurys: BELLOT PATRICE, , Aix-Marseille université
BREE SANDRA, , Université Lumière Lyon 2
LEMAITRE AURELIE, , Université Rennes 2
LIKFORMAN-SULEM LAURENCE, , ENST PARIS
PAQUET THIERRY, , URN - Université de Rouen Normandie
TRANOUEZ PIERRICK, , URN - Université de Rouen Normandie

Résumé: Cette thèse porte sur l'extraction automatique d'informations à partir de documents manuscrits historiques, dans le cadre des projets POPP et EXO-POPP. Le projet POPP se concentre sur les tableaux de recensement manuscrits de Paris (1921-1946), tandis qu'EXO-POPP traite des actes de mariage du département de la Seine (1880-1940). L’objectif principal est de développer une architecture de bout en bout pour l’extraction d’information à partir de documents complets, évitant les étapes explicites de segmentation. Dans un premier temps, une chaîne de traitement séquentielle a été développée pour le projet POPP, permettant l’extraction automatique des informations de 9 millions d’individus sur 300 000 pages. Ensuite, une architecture de bout en bout pour l'extraction d'information a été mise en place pour EXO-POPP, s’appuyant sur un encodeur convolutif et un décodeur Transformer, avec insertion de symboles spéciaux encodant les informations à extraire. Par la suite, l’intégration de grands modèles de langue basés sur l’architecture Transformer a conduit à la création du modèle DANIEL, qui a atteint un nouvel état de l’art sur plusieurs jeux de données publics (RIMES 2009 et M-POPP pour la reconnaissance d'écriture, IAM NER pour l'extraction d'information) tout en présentant une vitesse d'inférence supérieure aux approches existantes. Enfin, deux jeux de données publics issus des projets POPP et EXO-POPP ont été mis à disposition, ainsi que le code et les poids du modèle DANIEL.
Abstract: This thesis focuses on automatic information extraction from historical handwritten documents, within the framework of the POPP and EXO-POPP projects. The POPP project focuses on handwritten census tables from Paris (1921-1946), while EXO-POPP deals with marriage records from the Seine department (1880-1940). The main objective is to develop an end-to-end architecture for information extraction from complete documents, avoiding explicit segmentation steps. Initially, a sequential processing pipeline was developed for the POPP project, enabling the automatic extraction of information for 9 million individuals across 300,000 pages. Then, an end-to-end architecture for information extraction was implemented for EXO-POPP, based on a convolutional encoder and a Transformer decoder, with the insertion of special symbols encoding the information to be extracted. Subsequently, the integration of large language models based on the Transformer architecture led to the creation of the DANIEL model, which achieved a new state-of-the-art on several public datasets (RIMES 2009 and M-POPP for handwriting recognition, IAM NER for information extraction), while offering faster inference compared to existing approaches. Finally, two public datasets from the POPP and EXO-POPP projects were made available, along with the code and weights of the DANIEL model.

Calculs de mοdes électrοmagnétiques guidés dans des guides d'οndes tοrsadés et οuverts

Doctorant·e: LECLERC AUGUSTIN
Direction de thèse: GOUT CHRISTIAN (Directeur·trice de thèse)
BARUCQ HELENE (Co-directeur·trice de thèse)
TONNOIR ANTOINE (Co-encadrant·e de thèse)
Date de la soutenance: 27/11/2024 à 14:30
Lieu de la soutenance: INSA Rouen
Rapporteurs de la thèse: BONNET-BEN DHIA ANNE-SOPHIE ENSTA Paris
LAFITTE OLIVIER Université Sorbonne Paris Nord
Membres du jurys: BARUCQ HELENE, , Inria Bordeaux Sud Ouest - Pau
BONNET-BEN DHIA ANNE-SOPHIE, , ENSTA Paris
DURUFLE MARC, , Université de Bordeaux
GOUT CHRISTIAN, , INSA Rouen Normandie
LAFITTE OLIVIER, , Université Sorbonne Paris Nord
LE GUYADER CAROLE, , INSA Rouen Normandie
TERRASSE ISABELLE, , Airbus Central Research & Technology
TONNOIR ANTOINE, , INSA Rouen Normandie

Résumé: Cette thèse explore la modélisation et le calcul des modes électromagnétiques (EM) dans des guides d'ondes de géométries complexes, notamment dans des câbles électriques torsadés en milieux ouverts. L'objectif est de développer des méthodes numériques pour résoudre les équations de Maxwell afin de mieux comprendre la propagation des champs électromagnétiques dans des configurations réalistes. Cette étude est motivée par les enjeux liés à la réduction du rayonnement électromagnétique et à l'amélioration des performances des câbles en termes de confinement des champs. Nous traitons deux principales configurations : les guides d’ondes droits et les guides d'ondes torsadés. Pour les guides droits, des méthodes semi-analytiques sont mises en œuvre, notamment pour les câbles coaxiaux, permettant de tester les modèles numériques. Nous étendons ces méthodes aux guides d'ondes ouverts, où des conditions aux limites absorbantes (CLA) sont introduites pour modéliser un environnement infini en limitant les réflexions parasites. Dans les câbles torsadés, une géométrie hélicoïdale est exploitée afin de reformuler les équations de propagation des ondes EM dans un cadre numérique adapté, permettant d'obtenir des simulations en basse fréquence. Un travail sur la construction de CLA dans ce cadre a également été initié. Les résultats obtenus fournissent une meilleure compréhension des phénomènes électromagnétiques à basse fréquence et ouvrent des perspectives pour la conception de dispositifs plus performants et l'étude des systèmes électromagnétiques dans des environnements hétérogènes réels.
Abstract: This thesis explores the modelling and calculation of electromagnetic (EM) modes in waveguides with complex geometries, particularly in twisted electric cables in open environments. The aim is to develop numerical methods for solving Maxwell's equations in order to better understand the propagation of electromagnetic fields in realistic configurations. This study is motivated by the challenges of reducing electromagnetic radiation and improving cable performance in terms of field containment. We deal with two main configurations: straight waveguides and twisted waveguides. For straight waveguides, semi-analytical methods are used, particularly for coaxial cables, to test numerical models by comparison with precise solutions. We extend these methods to open waveguides, where absorbing boundary conditions (ABC) are introduced to model an infinite environment while limiting spurious reflections. In twisted cables, a helical geometry is exploited to reformulate the EM wave propagation equations in a suitable numerical framework, enabling low-frequency simulations to be obtained. Work on the construction of ABCs within this framework has also been initiated. The results that we obtain provide a better understanding of low-frequency electromagnetic phenomena and open up prospects for the design of more efficient devices and the study of electromagnetic systems in real heterogeneous environments.

Synthèse d'οbservateurs par intervalle pοur le diagnοstic de fautes et le cοntrôle rοbuste, avec applicatiοn aux drοnes quadricοptères

Doctorant·e: HUGO Antoine
Direction de thèse: CRAYE ETIENNE (Directeur·trice de thèse)
PIET-LAHANIER HELENE (Co-directeur·trice de thèse)
Date de la soutenance: 27/11/2024 à 14:00
Lieu de la soutenance: IBISC, Evry-Corcouronnes
Rapporteurs de la thèse: BURLION LAURENT Université Rutgers
RAISSI TARIK CNAM (Paris)
Membres du jurys: BURLION LAURENT, , Université Rutgers
CRAYE ETIENNE, , ESIGELEC ROUEN
JAUBERTHIE CARINE, , Université de Toulouse 3 - Paul Sabatier
MAZENC FREDERIC, , Centre Regional de l'Inria Saclay Ile de France
NADRI-WOLF MADIHA, , Université Claude Bernard - Lyon 1
RAISSI TARIK, , CNAM (Paris)

Résumé: Cette thèse se concentre sur le développement des observateurs d’état par intervalles, qui font partie des méthodes d’estimation ensemblistes s’inscrivant dans le cadre des systèmes à erreur bornée. Ces méthodes sont particulières intéressantes dans des applications soumises à d’importantes incertitudes, comme les systèmes biologiques, ou dans des domaines où la sécurité est cruciale, comme les unités de navigation de systèmes autonomes. En effet, elles présentent l’avantage de fournir des estimations garanties, ce qui signifie que l’ensemble estimé contient avec certitude l’état réel du système. Au-delà de l’estimation d’état de systèmes incertains, les observateurs par intervalles sont également employés dans le contrôle robuste et le diagnostic de fautes pour leur capacité à gérer les incertitudes. Le principe fondamental des observateurs par intervalles, qu’ils soient basés sur une représentation sup-inf ou centre-rayon, repose sur l’hypothèse que les incertitudes du système sont bornées entre deux limites connues. La propagation de ces bornes dans le modèle dynamique de l’observateur du système permet ainsi d’obtenir un intervalle estimé de l’état. Ce dernier est garanti de contenir l’état du réel du système, sous réserve que les erreurs d’estimation soient nonnégatives. Le calcul d’un gain d’observation offrant cette propriété, en plus de celle classique de stabilité, a été un véritable défi. Pour relâcher cette condition restrictive de nonnégativité dans la conception du gain d’observation, divers changements de coordonnées ont été introduits dans la littérature. Cependant, d’autres limitations dans la conception de tels observateurs font que ce domaine reste un sujet actif de recherche. Parmi elles, trois axes ont été identifiés et seront traités dans cette étude. Le premier axe concerne les observateurs par intervalles pour les systèmes nonlinéaires. Jusqu’à récemment, il n’existait pas de méthode générique permettant de concevoir un observateur par intervalles pour n’importe quel type de système nonlinéaire, en effet diverses hypothèses restrictives étaient considérées pour simplifier la conception. Cependant, l’introduction de l’observateur Kazantzis-Kravaris-Luenberger par intervalles (IKKL) a ouvert la voie pour résoudre ce problème mais reste un vaste sujet à explorer. Dans cette étude, deux nouvelles conceptions d’observateur IKKL sup-inf sont proposées permettant d’élargir la classe de systèmes nonlinéaires initialement considérée, en incluant notamment les systèmes à temps continu et les systèmes non-autonomes. Des considérations pratiques sont également abordées pour améliorer leur implémentation. Le deuxième axe se concentre sur l’utilisation de la méthode grand-gain dans la conception du gain d’observation des observateurs par intervalles centre-rayon. Les observateurs grand-gain par intervalles (HGIOs) permettent une convergence arbitrairement rapide des erreurs d’estimation mais ils sont sensibles au bruit de mesure. Cette limitation est abordée dans cette étude par l’incorporation d’un filtre de l’erreur d’estimation, menant à la conception d’un observateur grand-gain filtré par intervalles (FHGIO). De plus, quelques autres améliorations sont apportées pour perfectionner leur conception, notamment au niveau des fonctions d’encadrement, du changement de variables et du calcul des gains. Le troisième axe aborde la conception de lois de commande par retour d’état basées sur les observateurs par intervalles et leur application à un véhicule aérien sans pilote (UAV) de type quadricoptère. La plupart des méthodes existantes reposent sur la stabilisation des dynamiques sup-inf de l’observateur par intervalles pour stabiliser le système réel. Dans cette étude, une nouvelle conception de contrôleur utilisant les dynamiques de l’observateur par intervalles centre-rayon et la technique de Régulateur Quadratique Linéaire (LQR) est présentée pour suivre de manière robuste une trajectoire spécifiée. En outre...
Abstract: This thesis focuses on the development of interval state observers, which are part of set membership estimation methods within the framework of bounded-error systems. These methods are particularly valuable in applications with significant uncertainties, such as biological systems, or in fields where safety is critical, like navigation units for autonomous systems. Indeed, they offer the advantage of providing guaranteed estimates, meaning that the estimated set certainly contains the true state of the system. Beyond state estimation, interval observers are also applied in robust control and fault diagnosis for their ability to manage uncertainties. The main principle behind interval observers, either based on sup-inf or center-radius representation, is the assumption that the system uncertainties are bounded by two known limits. By propagating these bounds through the dynamic model of the observer of the system, an estimated interval for the state is obtained. This interval is guaranteed to contain the actual state of the system, provided that the estimation errors remain nonnegative. Calculating an observer gain that ensures this property, along with the classical requirement of stability, has been a significant challenge. To relax this restrictive nonnegativity condition in the design of the observer gain, various changes of ordinates have been introduced in the literature. However, additional limitations in interval observer based designs have led this field to remain an active area of research. Among these limitations, three topics have been identified and will be addressed in this study. The first topic concerns interval observers for nonlinear systems. Until recently, there was no general method for designing an interval observer for any type of nonlinear system, as various restrictive assumptions were often made to simplify the design. However, the introduction of interval Kazantzis-Kravaris-Luenberger (IKKL) observer has paved the way to addressing this issue but remains a vast topic to explore. In this study, two new sup-inf IKKL observer designs are proposed, broadening the class of nonlinear systems initially considered, particularly by including continuous-time and non-autonomous systems. Practical considerations are also discussed to enhance their implementation. The second topic focuses on the use of the high-gain method in designing the gain for center-radius interval observers. High-Gain Interval Observers (HGIOs) provide an arbitrarily fast convergence rate of the estimation errors but they are sensitive to measurement noise. To overcome this limitation, a filter for the observation error is integrated in the structure, leading to the design of a Filtered High-Gain Interval Observer (FHGIO). Additionally, several other improvements are introduced to further enhance this design, notably including on the bounding functions, the change of coordinates and the gain computation. The third topic addresses the design of state feedback control laws based on interval observers and the application to a quadcopter Unmanned Aerial Vehicle (UAV). Most existing methods rely on stabilizing the sup-inf interval observer dynamics in order to stabilize the actual system. In this study, a new controller design using center-radius interval observer dynamics and Linear Quadratic Regulator (LQR) technique is presented to robustly track a specified trajectory. In addition, a fault diagnosis strategy is developed using interval residuals and a fault signature matrix to effectively detect and isolate actuators faults on the quadcopter. Thus, this study addresses the current limitations in the design and use of interval observers, offering new methods to improve applicability of IKKL observers to a broader class of nonlinear systems, enhance robustness and performance of HGIOs, and effectively control and monitor real-world systems through the developed center-radius interval observers. The proposed techniques contribute to...

Apprοches Μοnο et Bi-οbjective pοur l'Οptimisatiοn Ιntégrée des Ροstes d'Amarrage et des Grues de Quai dans les Οpératiοns de Τransbοrdement

Doctorant·e: AL SAMROUT Marwa
Direction de thèse: YASSINE ADNAN (Directeur·trice de thèse)
Date de la soutenance: 21/11/2024 à 14:00
Lieu de la soutenance: Bâtiment PIL (à coté de l'ISEL), 1er étage, salles 127-128-129
Rapporteurs de la thèse: FONLUPT CYRIL ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
ZEDDINI BESMA CY TECH CERGY PARIS
Membres du jurys: ALABBOUD HASSAN, , UNIVERSITE LIBANAISE
DIDI BIHA MOHAMED, , UCN - Université de Caen Normandie
FONLUPT CYRIL, , ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
NAJA HALA, , UNIVERSITE LIBANAISE
SBIHI ABDELKADER, , University of South-Eastern Norway
YASSINE ADNAN, , ULHN - Université Le Havre Normandie
ZEDDINI BESMA, , CY TECH CERGY PARIS

Résumé: Le transport maritime international est vital pour le commerce mondial, représentant plus de 85 % des échanges, avec 10,5 milliards de tonnes transportées chaque année. Ce mode de transport est le plus économique et durable, contribuant seulement à 2,6 % des émissions de CO2. En France, le secteur maritime représente 1,5 % du PIB et près de 525 000 emplois. Les ports maritimes, cruciaux pour la chaîne logistique, facilitent le transbordement des marchandises et adoptent de plus en plus des solutions numériques basées sur l'intelligence artificielle pour améliorer leur efficacité. La France compte onze Grands ports maritimes, dont sept en Métropole. La thèse se concentre sur l’optimisation des terminaux à conteneurs pour améliorer l’efficacité et la performance des ports.Ce mémoire aborde la problématique de la planification des postes d’accostage et de l’activation des portiques dans les terminaux à conteneurs des ports maritimes, en réponse aux changements récents dans la logistique maritime, tels que l’arrivée de méga-navires et l’automatisation. Il souligne les lacunes dans la littérature existante et propose une analyse approfondie des défis actuels. Le document se divise en trois chapitres : Le premier chapitre explore l’histoire de la conteneurisation, les types de conteneurs, et les défis de la planification opérationnelle. Il se concentre sur le problème d’attribution des postes d’amarrage (BAP), ses méthodes de résolution et l’intégration de l’intelligence artificielle (IA) pour optimiser les processus logistiques. Le 2ème chapitre introduit le problème d'allocation dynamique avec transbordement ship-to-ship. Il propose un programme linéaire en nombres entiers mixtes (MILP) pour optimiser l’ordonnancement d’accostage et le transbordement entre navires. L’objectif est de réduire les temps de séjour des navires dans le terminal, ainsi que les pénalités dues aux retards des navires, et de décider du mode de transbordement nécessaire. La méthode combine une heuristique de type packing et un algorithme génétique amélioré, démontrant une efficacité dans la réduction des temps de séjour des navires. Nous avons effectué une analyse statistique pour identifier les paramètres de contrôle efficaces du GA, puis nous avons appliqué cet algorithme avec les paramètres de contrôle déterminés pour réaliser des expériences numériques sur des instances générées aléatoirement. De plus, nous avons réalisé une étude comparative afin d’évaluer différents opérateurs de croisement, en utilisant le test d’analyse de variance (ANOVA). Ensuite, nous avons présenté une série d’exemples basés sur des données aléatoires, résolus à l’aide du solveur CPLEX, afin de confirmer la validité du modèle proposé. La méthode proposée est capable de résoudre le problème dans un temps de calcul acceptable pour des instances de taille moyenne et grande. Le dernier chapitre présente un problème intégré d’allocation des postes d’amarrage et des grues, avec un focus sur le transbordement ship-to-ship. Trois approches sont proposées . La première approche utilise l'algorithme génétique NSGA-III, complété par une analyse statistique pour optimiser les paramètres et évaluer différents opérateurs de croisement. En analysant des données de la base AIS, des tests numériques montrent l’efficacité de cette méthode au port du Havre, avec des résultats satisfaisants et un temps de calcul raisonnable. La deuxième approche implique deux modèles de régression, Gradient Boosting Regression (GBR) et Random Forest Regression (RFR), entraînés sur des caractéristiques sélectionnées. La méthodologie inclut des étapes de prétraitement et l'optimisation des hyperparamètres. Bien que NSGA-III offre la meilleure précision, il nécessite un temps d'exécution plus long. En revanche, GBR et RFR, bien que légèrement moins précis, améliorent l’efficacité, soulignant le compromis entre précision et temps d'exécution dans les applications pratiques.
Abstract: International maritime transport is vital for global trade, representing over 85% of exchanges, with 10.5 billion tons transported each year. This mode of transport is the most economical and sustainable, contributing only 2.6% of CO2 emissions. In France, the maritime sector accounts for 1.5% of GDP and nearly 525,000 jobs. Maritime ports, crucial for the logistics chain, facilitate the transshipment of goods and increasingly adopt digital solutions based on artificial intelligence to improve their efficiency. France has eleven major seaports, seven of which are located in mainland France. The thesis focuses on optimizing container terminals to enhance the efficiency and performance of ports. It addresses the issues of berth allocation planning and crane activation in container terminals in response to recent changes in maritime logistics, such as the arrival of mega-ships and automation. It highlights gaps in the existing literature and offers an in-depth analysis of current challenges. The document is divided into three chapters: The first chapter explores the history of containerization, types of containers, and challenges in operational planning. It focuses on the berth allocation problem (BAP), its resolution methods, and the integration of artificial intelligence (AI) to optimize logistical processes. The second chapter introduces the dynamic allocation problem with ship-to-ship transshipment. It proposes a mixed-integer linear program (MILP) to optimize the berthing schedule and transshipment between vessels. The objective is to reduce vessel stay times in the terminal, as well as penalties due to vessel delays, and to determine the necessary transshipment method. The method combines a packing-type heuristic and an improved genetic algorithm, demonstrating effectiveness in reducing vessel stay times. We conducted a statistical analysis to identify effective control parameters for the GA, then applied this algorithm with the determined control parameters to perform numerical experiments on randomly generated instances. Additionally, we conducted a comparative study to evaluate different crossover operators using ANOVA. We then presented a series of examples based on random data, solved using the CPLEX solver, to confirm the validity of the proposed model. The proposed method is capable of solving the problem in an acceptable computation time for medium and large instances. The final chapter presents an integrated berth and crane allocation problem, focusing on ship-to-ship transshipment. Three approaches are proposed. The first approach uses the NSGA-III genetic algorithm, supplemented by a statistical analysis to optimize parameters and evaluate different crossover operators. By analyzing AIS database data, numerical tests demonstrate the effectiveness of this method at the port of Le Havre, yielding satisfactory results within a reasonable computation time. The second approach involves two regression models, Gradient Boosting Regression (GBR) and Random Forest Regression (RFR), trained on selected features. The methodology includes preprocessing steps and hyperparameter optimization. While NSGA-III achieves the highest accuracy, it requires a longer execution time. In contrast, although GBR and RFR are slightly less precise, they significantly improve efficiency, highlighting the trade-off between accuracy and execution time in practical applications.

La résοlutiοn de prοblème quadratique binaire par des méthοdes d'οptimisatiοn exactes et apprοchées

Doctorant·e: BATTIKH Rabih
Direction de thèse: YASSINE ADNAN (Directeur·trice de thèse)
Date de la soutenance: 21/11/2024 à 09:00
Lieu de la soutenance: Bâtiment PIL (à coté de l'ISEL), 1er étage, salles 127-128-129.
Rapporteurs de la thèse: CAFIERI SONIA ENAC TOULOUSE
KOUKAM ABDERRAFIAA UNIV TECHN BELFORT MONTBELIARD UTBM SEVENANS
Membres du jurys: ALABBOUD HASSAN, , UNIVERSITE LIBANAISE
CAFIERI SONIA, , ENAC TOULOUSE
GUIBADJ RIM NESRINE, , ULCO - UNIVERSITE DU LITTORAL COTE D'OPALE
KOUKAM ABDERRAFIAA, , UNIV TECHN BELFORT MONTBELIARD UTBM SEVENANS
SBIHI ABDELKADER, , University of South-Eastern Norway
YASSINE ADNAN, , ULHN - Université Le Havre Normandie

Résumé: Dans cette thèse, nous avons présenté un nouvel algorithme hybride (HA) pour la résolution du problème (UQP). Cet algorithme est basé sur la combinaison d'un bloc de cinq procédures spéciales et de la méthode du recuit simulé. Nos procédures sont très efficaces et rapides, mais malheureusement, parfois elles sont bloquées par un minimum local. Pour surmonter cet inconvénient, nous les avons combinées avec un algorithme de recuit simulé. Ensuite, nous avons répété ces procédures plusieurs fois pour obtenir la meilleure solution en utilisant notre algorithme hybride. Nous avons remarqué que l'écart entre la solution trouvée par (HA) et le logiciel CPLEX est très faible, ce résultat implique l'efficacité de notre stratégie. Par ailleurs, nous avons intégré notre méthode hybride à un problème de relaxation semi-définie du (UQP) dans le cadre d'une stratégie de branch and bound. Pour faciliter la résolution du (UQP), nous suggérons d'appliquer des critères de fixation afin de réduire la taille du problème et d'accélérer l'obtention d'une solution exacte. La qualité de la borne inférieure trouvée par notre code (QPTOSDP) est très bonne, mais le temps d'exécution augmente avec la taille du problème. Les résultats numériques prouvent l'exactitude de notre solution optimale et l'efficacité et la robustesse de notre approche. Nous avons étendu les critères de fixation pour le problème (QP), ce qui permet, dans certains cas, de réduire la dimension du problème, voire de le résoudre entièrement en appliquant une boucle de répétition fondée sur ces critères.
Abstract: In this thesis, we presented a new hybrid algorithm (HA) for solving the unconstrained quadratic programming problem (UQP). This algorithm is based on the combination of a block of five special procedures and the simulated annealing method. Our procedures are very efficient and fast, but unfortunately, they sometimes get stuck in a local minimum. To overcome this drawback, we combined them with a simulated annealing algorithm. Then, we repeated these procedures several times to obtain the best solution using our hybrid algorithm. We noticed that the gap between the solution found by (HA) and the CPLEX software is very small, which implies the efficiency of our strategy. Moreover, we integrated our hybrid method into a semi-definite relaxation problem of (UQP) within a branch and bound strategy. To facilitate the resolution of (UQP), we suggest applying fixing criteria to reduce the size of the problem and speed up the process of obtaining an exact solution. The quality of the lower bound found by our code (QPTOSDP) is very good, but the execution time increases with the size of the problem. Numerical results prove the accuracy of our optimal solution and the efficiency and robustness of our approach. We extended the fixing criteria to the quadratic programming problem (QP), which in some cases allows reducing the dimension of the problem, or even solving it entirely by applying a repetition loop based on these criteria.

Architectures multi-échelles de type encοdeur-décοdeur pοur la stéréοphοtοmétrie

Doctorant·e: HARDY Clement
Direction de thèse: TSCHUMPERLE DAVID (Directeur·trice de thèse)
Date de la soutenance: 18/11/2024 à 09:30
Lieu de la soutenance: Salle des thèses, UFR Sciences, Campus 2, Caen
Rapporteurs de la thèse: ALMANSA ANDRÈS Directeur de recherche UNIVERSITE PARIS 5 UNIVERSITE PARIS DESCARTES
DUROU JEAN-DENIS Maître de conférences HDR Université de Toulouse 3 - Paul Sabatier
Membres du jurys: ALMANSA ANDRÈS, Directeur de recherche, UNIVERSITE PARIS 5 UNIVERSITE PARIS DESCARTES
BRINGIER BENJAMIN, Maître de conférences, Université de Limoges
DIGNE JULIE, , CNRS
DUROU JEAN-DENIS, Maître de conférences HDR, Université de Toulouse 3 - Paul Sabatier
QUEAU Yvain, , CNRS
TSCHUMPERLE DAVID, , CNRS

Résumé: La stéréophotométrie est une technique de reconstruction 3D de la surface d'un objet. De plus en plus de recherches s'intéressent à ce problème qui se veut prometteur dans le monde industriel. En effet, la stéréophotométrie peut être utilisée pour détecter les défauts d'usinage de pièces mécaniques ou pour de la reconnaissance faciale par exemple. Cette thèse explore les méthodes d'apprentissage profond pour la stéréophotométrie, notamment les différents aspects liés aux bases de données d'entraînement et aux architectures considérées. De manière générale, la sur-paramétrisation d'un réseau de neurones est souvent suffisante pour supporter la diversité des problèmes rencontrés. La base de données d'entraînement est alors considérée comme le point clé permettant de conditionner le réseau au problème traité. Par conséquent, pour répondre à ce besoin, nous proposons une nouvelle base de données d'entraînement synthétique. Cette base de données considère une très grande variété de géométries, de textures, de directions ou conditions lumineuses mais également d'environnements, permettant donc de générer un nombre de situation quasiment infini. Le second point décisif d'une bonne reconstruction concerne le choix de l'architecture. L'architecture d'un réseau doit assurer une bonne capacité de généralisation sur de nouvelles données pour générer de très bons résultats sur des données inédites. Et ce, quelle que soit l'application. En particulier, pour la stéréophotométrie, l'enjeu est d'être capable de reconstruire des images très haute résolution afin de ne pas perdre de détails. Nous proposons alors une architecture multi-échelles de type encodeur-décodeur afin de répondre à ce problème. Dans un premier temps, nous proposons une architecture fondée sur les réseaux convolutionnels pour répondre au problème de stéréophotométrie calibrée, i.e. quand la direction lumineuse est connue. Dans un second temps, nous proposons une version fondé sur les Transformers afin de répondre au problème de stéréophotométrie universelle. C'est-à-dire que nous sommes en capacité de gérer n'importe quel environnement, direction lumineuse, etc., sans aucune information préalable. Finalement, pour améliorer les reconstructions sur des matériaux difficiles (translucides ou brillants par exemple), nous proposons une nouvelle approche que nous appelons ``faiblement calibrée'' pour la stéréophotométrie. Dans ce contexte, nous n'avons qu'une connaissance approximative de la direction d'éclairage. L'ensemble des pistes que nous avons explorées ont conduit à des résultats convaincants, à la fois quantitatifs et visuels sur l'ensemble des bases de données de l'état-de-l'art. En effet, nous avons pu observer une amélioration notable de la précision de reconstruction des cartes de normales, contribuant ainsi à avancer l'état de l'art dans ce domaine.
Abstract: Photometric stereo is a technique for 3D surface reconstruction of objects. This field has seen a surge in research interest due to its potential applications in industry. Specifically, photometric stereo can be employed for tasks such as detecting machining defects in mechanical components or facial recognition. This thesis delves into deep learning methods for photometry stero, with a particular focus on training data and network architectures. While neural network over-parameterization is often adequate, the training dataset plays a pivotal role in task adaptation. To generate a highly diverse and extensible training set, we propose a new synthetic dataset. This dataset incorporates a broad spectrum of geometric, textural, lighting, and environmental variations, allowing for the creation of nearly infinite training instances. The second decisive point of a good reconstruction concerns the choice of architecture. The architecture of a network must ensure a good generalization capacity on new data to generate very good results on unseen data. And this, regardless of the application. In particular, for the photometric stereo problem, the challenge is to be able to reconstruct very high-resolution images in order not to lose any details. We therefore propose a multi-scale encoder-decoder architecture to address this problem. We first introduce a convolutional neural network architecture for calibrated photometric stereo, where the lighting direction is known. To handle unconstrained environments, we propose a Transformers-based approach for universal photometric stereo. Lastly, for challenging materials shiny like translucent or shiny surfaces, we introduce a ``weakly calibrated'' approach that assumes only approximate knowledge of the lighting direction. The approaches we have investigated have consistently demonstrated strong performance on standard benchmarks, as evidenced by both quantitative metrics and visual assessments. Our results, particularly the improved accuracy of reconstructed normal maps, represent a significant advancement in photometric stereo.

Grοupes de classes et de Ροlya d'extensiοns abéliennes

Doctorant·e: EMMELIN Etienne
Direction de thèse: ANGLES Bruno (Directeur·trice de thèse)
Date de la soutenance: 15/11/2024 à 14:00
Lieu de la soutenance: Université de Caen, Campus 2, Bâtiment S3, Salle des Thèses
Rapporteurs de la thèse: MAIRE CHRISTIAN Université Besançon Franche Comté
PERRET MARC Université Toulouse 2 Jean Jaurès
Membres du jurys: ANGLES Bruno, , UCN - Université de Caen Normandie
BOSSER Vincent, Maître de conférences, UCN - Université de Caen Normandie
BOUCHER DELPHINE, Maître de conférences HDR, Université de Rennes
CHABERT JEAN-LUC, Professeur émérite, UNIVERSITE AMIENS PICARDIE JULES VERNE
MAIRE CHRISTIAN, , Université Besançon Franche Comté
PELLARIN Federico, , ROME - UNIVERSITA ROMA "LA SPIENZA"
PERRET MARC, , Université Toulouse 2 Jean Jaurès

Résumé: Pour des extensions galoisiennes $K/\mathbb{Q}$, le groupe de P\'olya de $K$ est un sous-groupe du groupe de classes d'idéaux de $K$ engendré par les idéaux ambiges. On démontre dans cette thèse l'existence d'une infinité d'extensions abéliennes $K/\mathbb{Q}$, dont le groupe de P\'olya est isomorphe à un groupe abélien fini $G$, prescrit. Pour cela on se ramène au cas des $l$-extensions cycliques et l'on utilise le théorème de structure des groupes abéliens finis. De plus, on étudie le comportement asymptotique du groupe de classes relatif d'extensions CM abéliennes $K/\mathbb{Q}$, défini comme étant le quotient du groupe de classes $Cl(K)$, par le groupe de P\'olya $Po(K)$ et l'on montre qu'il n'existe qu'un nombre fini de tels corps dont le groupe de classes relatif est trivial. Enfin, on démontre l'existence d'une infinité de corps quadratiques successifs en caractéristique strictement positive, dont le nombre de classes est divisible par un nombre premier, en montrant un analogue du théorème de Siegel pour les corps de fonctions.
Abstract: For Galois extensions $K/\mathbb{Q}$, the P\'olya group of $K$ is a subgroup of the ideal class group of $K$ generated by ambigous ideals. In this thesis, we prove the existence of infinitly many abelian extensions $K/\mathbb{Q}$, such that the P\'olya group of $K$ is isomorphic to a prescribed finite abelian group $G$. For this, we study the case of cyclic $l$-extensions and we show the existence using the theorem of finite abelian group structure. In addition, we study the asymptotic behavior of the relative class group of abelian CM extensions $K/\mathbb{Q}$, defined as the quotient of the class group $Cl(K)$ by the P\'olya group $Po(K)$ and we show that there exists a finite number of such fields whose relative class group is trivial. Finally, we prove the existence of infinitely many successive quadratic field in positive caracteristic, whose class number is divisible by a prime number, by showing an analogous of Siegel's theorem for function fields.

Unbalanced and Linear Οptimal Τranspοrt fοr Reliable Estimatiοn οf the Wasserstein Distance

Doctorant·e: MAHEY GUILLAUME
Direction de thèse: GASSO GILLES (Directeur·trice de thèse)
CHAPEL LAETITIA (Co-encadrant·e de thèse)
Date de la soutenance: 13/11/2024 à 10:00
Lieu de la soutenance: INSA Rouen
Rapporteurs de la thèse: BONNEEL NICOLAS CNRS-Lyon1
DELON JULIE Université Paris Cité
Membres du jurys: BONNEEL NICOLAS, , CNRS-Lyon1
CAZELLES ELSA, , Institut de Recherche en informatique de Toulouse
CHAPEL LAETITIA, , Institut Agro Rennes-Angers
DELON JULIE, , Université Paris Cité
GASSO GILLES, , INSA Rouen Normandie
NADJAHI KIMIA, , ENS ULM
RAKOTOMAMONJY ALAIN, , Criteo AI Lab

Résumé: Dans le contexte de l'apprentissage automatique, plusieurs problèmes peuvent se formuler comme des problèmes de comparaison entre distributions. La théorie mathématique du transport optimal permet une comparaison entre deux mesures de probabilité. Bien que très élégante en théorie, le transport optimal (TO) souffre de plusieurs inconvénients en pratique, notamment la charge de calcul, le risque de surapprentissage (overfitting) et sa sensibilité aux artefacts d'échantillonnage. Tout cela a motivé l'introduction de variantes à la fonction de perte associée au TO dans la communauté du machine learning. Dans cette thèse, nous proposons de nouvelles variantes afin, d'une part, de réduire la charge computationnelle et statistique et, d'autre part, la sensibilité aux artefacts d'échantillonnage de la perte TO. Pour ce faire, nous nous sommes appuyés sur les distributions intermédiaires introduites à la fois par les variantes de TO linéaire et de TO déséquilibré.
Abstract: In the context of machine learning, several problems can be formulated as distribution comparison problems. The mathematical theory of optimal transport allows for a comparison between two probability measures. Although very elegant in theory, optimal transport (OT) suffers from several practical drawbacks, notably the computational burden, the risk of overfitting, and its sensitivity to artifacts of sampling. All of this has motivated the introduction of variants to the loss function associated with OT in the machine learning community. In this thesis, we propose such variants in order, on one hand, to reduce the computational and statistical burden and, on the other hand, the sensitivity to sampling artifacts of the OT loss. To achieve this, we relied on intermediate distributions introduced by both the linear OT and unbalanced OT variants.

Νeural netwοrk based methοds fοr inverse prοblems: algοrithms and guarantees

Doctorant·e: BUSKULIC Nathan
Direction de thèse: FADILI Mohamed Jalal (Directeur·trice de thèse)
Date de la soutenance: 12/11/2024 à 14:00
Lieu de la soutenance: Salle des thèses Sciences 3.
Rapporteurs de la thèse: AUJOL JEAN-FRANCOIS Universite de Bordeaux
DELON JULIE Université Paris Cité
Membres du jurys: AUJOL JEAN-FRANCOIS, , Universite de Bordeaux
CHOUZENOUX EMILIE, , INRIA Paris
DELON JULIE, , Université Paris Cité
FADILI Mohamed Jalal, , ENSICAEN
QUEAU Yvain, , CNRS
SCHONLIEB CAROLA-BIBIANE, , University of CAMBRIDGE
VILLA SILVIA, , GENES - UNIVERSITA DI GENOVA

Résumé: Ce manuscrit est dédié à l'analyse des réseaux de neurones lorsqu'ils sont entraînés de manière non-supervisée pour résoudre des problèmes inverses. Ces méthodes sont devenues très populaires et développées empiriquement ces dernières années, avec des résultats qualitatifs impressionnants, mais leur compréhension théorique reste encore limitée, en particulier leurs garanties de reconstruction. Dans cette thèse, nous nous attelons à ce problème. A cette fin, la clé de voûte sera d'exploiter la régularisation implicite induite par la dynamique de la méthode d'optimisation. Ainsi, nous étudions les trajectoires des paramètres de ces réseaux de neurones lorsqu'ils sont entraînés avec différentes méthodes d'optimisation, et nous montrons comment cela amène diverses garanties liées aux problèmes inverses. Nous commençons par étudier l'optimisation par flot de gradient et son équivalent discret la descente de gradient, pour des fonctions de coûts suffisamment régulières et qui vérifient l'inégalité de Kurdyka-\L{}ojasiewicz. Nous montrons que sous une condition d'initialisation non-dégénérée, le réseau va converger vers une solution de risque empirique nul à un taux qui dépend explicitement de la fonction désingularisante de la fonction coût. Nous donnons aussi une borne d'arrêt anticipé qui empêche le sur-apprentissage du bruit. Nous montrons ensuite que sous une condition d'injectivité restreinte, une borne de reconstruction de l'objet original (e.g. signal/image, etc.) peut être obtenue. Dans un second temps, nous étendons les résultats précédents lorsque le réseau de neurones est optimisé avec un risque quadratique en utilisant une dynamique inertielle combinant un amortissement visqueux et un amortissement géométrique guidé par le Hessien. Nous démontrons que des vitesses de convergence accélérées et des garanties de reconstruction peuvent être obtenues avec un choix judicieux des paramètres de la dynamique inertielle mais au prix d'une condition d'initialisation plus subtile. Un algorithme inertiel est proposé par discrétisation de la dynamique continue en temps est ses garanties sont établies. Pour toutes ces méthodes d'optimisation, nous exhibons l'architecture nécessaire avec notamment une borne de sur-paramétrisation qui assure qu'un réseau deep inverse prior à deux couches va pouvoir bénéficier de toutes ces garanties avec grande probabilité. Nous vérifions numériquement tous nos résultats sur plusieurs instances, et décrivons des applications, notamment en shape-from-shading multivues.
Abstract: This manuscript is devoted to the analysis of neural networks when trained in an unsupervised way to solve inverse problems in finite dimension. While these methods have become popular and heavily developed in the last years, leading to some qualitatively impressive results, they are lacking a thorough theoretical understanding, in particular of their recovery guarantees. In this thesis, our goal is to partly close that gap. For this, the key idea is to exploit the implicit regularization induced by the dynamic of the optimization method. Therefore, we study the trajectories of neural networks parameters under different optimization methods, and show how this leads to various inverse problem related recovery guarantees. We first study optimization through continuous gradient-flow, and its discrete counterpart gradient descent, for general sufficiently smooth loss functions that obey the Kurdyka-Lojasiewicz inequality. We show that under a non-degenerate initialization condition, the neural network will converge to a zero empirical risk solution with a rate that depends explicitly on the desingularizing function of the loss. We also provide an early-stopping bound to avoid the overfitting of the noise. We then show that with an additional restricted injectivity constraint, a recovery bound of the original object (e.g. signal/image, etc.) can be obtained. Second, we extend the above results when training with the mean square error loss using an inertial dynamic combining viscous and geometric Hessian-driven damping, and show that faster convergence and recovery guarantees can be obtained with a wise choice of dynamic parameters at the cost of more subtle initialization conditions. An inertial/momentum algorithm is then derived as a discretization of the continuous dynamic, it is then studied and its guarantees are established. For all these optimization methods, we also give an overparametrization bound under which a two-layer deep inverse prior network can benefit from the above guarantees with high probability. We numerically verify our results on a large ensemble of experiments, and we also exemplify our findings on two applications, for instance on multi-view shape-from-shading.

A Dynamical System Ρerspective οn Stοchastic and Ιnertial Μethοds fοr Οptimizatiοn

Doctorant·e: MAULEN SOTO Rodrigo
Direction de thèse: FADILI Mohamed Jalal (Directeur·trice de thèse)
Date de la soutenance: 08/11/2024 à 14:00
Lieu de la soutenance: Salle des thèses, Sciences 3
Rapporteurs de la thèse: BOT RADU IOAN Université de Vienne
RONDEPIERRE AUDE Inst Nat Sc Appliq Toulouse
Membres du jurys: ADLY SAMIR, , Université de Limoges
BOT RADU IOAN, , Université de Vienne
BOYER CLAIRE, Maître de conférences, Sorbonne Université
DOSSAL CHARLES, , Inst Nat Sc Appliq Toulouse
FADILI Mohamed Jalal, , ENSICAEN
OCHS PETER, , Université des Saarlandes
RONDEPIERRE AUDE, , Inst Nat Sc Appliq Toulouse

Résumé: Motivé par l'omniprésence de l'optimisation dans de nombreux domaines de la science et de l'ingénierie, en particulier dans la science des données, ce manuscrit de thèse exploite le lien étroit entre les systèmes dynamiques dissipatifs à temps continu et les algorithmes d'optimisation pour fournir une analyse systématique du comportement global et local de plusieurs systèmes du premier et du second ordre, en se concentrant sur le cadre convexe, stochastique et en dimension infinie d'une part, et le cadre non convexe, déterministe et en dimension finie d'autre part. Pour les problèmes de minimisation convexe stochastique dans des espaces de Hilbert réels séparables de dimension infinie, notre proposition clé est de les analyser à travers le prisme des équations différentielles stochastiques (EDS) et des inclusions différentielles stochastiques (IDS), ainsi que de leurs variantes inertielles. Nous considérons d'abord les problèmes convexes différentiables lisses et les EDS du premier ordre, en démontrant une convergence faible presque sûre vers les minimiseurs sous hypothèse d'intégrabilité du bruit et en fournissant une analyse globale et locale complète de la complexité. Nous étudions également des problèmes convexes non lisses composites utilisant des IDS du premier ordre et montrons que, sous des conditions d'intégrabilité du bruit, la convergence faible presque sûre des trajectoires vers les minimiseurs, et avec la régularisation de Tikhonov la convergence forte presque sûre des trajectoires vers la solution de norme minimale. Nous développons ensuite un cadre mathématique unifié pour analyser la dynamique inertielle stochastique du second ordre via la reparamétrisation temporelle et le moyennage de la dynamique stochastique du premier ordre, ce qui permet d'obtenir une convergence faible presque sûre des trajectoires vers les minimiseurs et une convergence rapide des valeurs et des gradients. Ces résultats sont étendus à des EDS plus générales du second ordre avec un amortissement visqueux et Hessien, en utilisant une analyse de Lyapunov spécifique pour prouver la convergence et établir de nouveaux taux de convergence. Enfin, nous étudions des problèmes d'optimisation déterministes non convexes et proposons plusieurs algorithmes inertiels pour les résoudre, dérivés d'équations différentielles ordinaires (EDO) du second ordre combinant à la fois un amortissement visqueux sans vanité et un amortissement géométrique piloté par le Hessien, sous des formes explicites et implicites. Nous prouvons d'abord la convergence des trajectoires en temps continu des EDO vers un point critique pour des objectives vérifiant la propriété de Kurdyka-Lojasiewicz (KL) avec des taux explicites, et génériquement vers un minimum local si l'objective est Morse. De plus, nous proposons des schémas algorithmiques par une discrétisation appropriée de ces EDO et montrons que toutes les propriétés précédentes des trajectoires en temps continu sont toujours valables dans le cadre discret sous réserve d'un choix approprié de la taille du pas.
Abstract: Motivated by the ubiquity of optimization in many areas of science and engineering, particularly in data science, this thesis exploits the close link between continuous-time dissipative dynamical systems and optimization algorithms to provide a systematic analysis of the global and local behavior of several first- and second-order systems, focusing on convex, stochastic, and infinite-dimensional settings on the one hand, and non-convex, deterministic, and finite-dimensional settings on the other hand. For stochastic convex minimization problems in infinite-dimensional separable real Hilbert spaces, our key proposal is to analyze them through the lens of stochastic differential equations (SDEs) and inclusions (SDIs), as well as their inertial variants. We first consider smooth differentiable convex problems and first-order SDEs, demonstrating almost sure weak convergence towards minimizers under integrability of the noise and providing a comprehensive global and local complexity analysis. We also study composite non-smooth convex problems using first-order SDIs, and show under integrability conditions on the noise, almost sure weak convergence of the trajectory towards a minimizer, with Tikhonov regularization almost sure strong convergence of trajectory to the minimal norm solution. We then turn to developing a unified mathematical framework for analyzing second-order stochastic inertial dynamics via time scaling and averaging of stochastic first-order dynamics, achieving almost sure weak convergence of trajectories towards minimizers and fast convergence of values and gradients. These results are extended to more general second-order SDEs with viscous and Hessian-driven damping, utilizing a dedicated Lyapunov analysis to prove convergence and establish new convergence rates. Finally, we study deterministic non-convex optimization problems and propose several inertial algorithms to solve them derived from second-order ordinary differential equations (ODEs) combining both non-vanishing viscous damping and geometric Hessian-driven damping in explicit and implicit forms. We first prove convergence of the continuous-time trajectories of the ODEs to a critical point under the Kurdyka-Lojasiewicz (KL) property with explicit rates, and generically to a local minimum under a Morse condition. Moreover, we propose algorithmic schemes by appropriate discretization of these ODEs and show that all previous properties of the continuous-time trajectories still hold in the discrete setting under a proper choice of the stepsize.

Cοntrôle et cοοrdinatiοn d'une flοtte de drοnes

Doctorant·e: PETITPREZ Etienne
Direction de thèse: GUINAND FREDERIC (Directeur·trice de thèse)
GUERIN FRANCOIS (Co-directeur·trice de thèse)
Date de la soutenance: 07/11/2024 à 10:00
Lieu de la soutenance: Université du Havre Normandie
Rapporteurs de la thèse: DANOY GREGOIRE Université du Luxembourg
LABBANI-IGBIDA OUIDDAD Université de Limoges
Membres du jurys: AVANZINI PIERRE, , SQUARDRONE SYSTEM
CHAUMETTE SERGE, , UNIVERSITE BORDEAUX 1 SCIENCES ET TECHNOLOGIE
DANOY GREGOIRE, , Université du Luxembourg
FANTONI ISABELLE, , Nantes Université
GUERIN FRANCOIS, , ULHN - Université Le Havre Normandie
GUINAND FREDERIC, , ULHN - Université Le Havre Normandie
LABBANI-IGBIDA OUIDDAD, , Université de Limoges

Résumé: Le projet de thèse vise à contrôler et coordonner les actions d’un ensemble de drones autonomes, pour un fonctionnement en essaim. Trois applications clefs sont ciblées : — un problème d’inventaire d’entrepôts combinant un ensemble de robots terrestres et de drones, — un problème de mesure de la qualité de l’air (caractérisation de panaches de polluants), — un problème de déploiement de drones pour de multiples missions de surveillance sur de longues durées. Ces applications ajoutent aux difficultés liées à la robotique mobile collective un volet d’optimisation sous incertitude, la conception d’une forme d’intelligence collective et des objectifs de robustesse et de flexibilité de la flotte. Le travail de recherche a mené au développement de deux briques logicielles. La première, nommée Superviseur, gère le parc de drones. Cela comprend la création de missions, la répartition et la réallocation dynamique des robots dans les missions en suivant une logique d’aide à la décision. Il s’agit de l’implémentation d’un algorithme glouton définissant les ordonnancements des drones dans les missions selon le contexte, les objectifs et les ressources à disposition. La seconde, appelée Gestionnaire de Mission, assure la réalisation des missions et l’exécution des demandes du Superviseur- déclenchement de missions / réallocations. Ces développements ont été comparés sur le plan des performances théoriques au travers du cas d’application de l’inventaire d’entrepôt et démontrés en application sur des déploiements de multi-missions de surveillance. Les résultats montrent des preuves d’adaptabilité aux contexte divers et une robustesse aux aléas, fonctionnant sur une système réellement mis en œuvre. L’étude des essaims de drones pour le contrôle de la qualité de l’air a abouti au développement d’un algorithme de contrôle de formation plane de drones en trois dimensions. La méthode repose sur l’utilisation de forces virtuelles pour attirer et repousser les drones selon leur environnement. La formation est générée par l’utilisation des descripteurs de Fourier pour en décrire la forme. Les essais en simulations et en pratique relatent d’un maintien de la formation malgré les changements de silhouette de celle-ci et les extractions / insertions de drones.
Abstract: The thesis project aims to control and coordinate the actions of a set of autonomous drones, for swarm operation. Three key applications are targeted : — a warehouse inventory problem combining a set of ground robots and drones, — an air quality measurement problem (characterization of plumes), — a problem of deploying drones for multiple surveillance missions over long periods. These applications add to the collective mobile robotics difficulties the optimization under uncertainty, the design of a collective intelligence and fleet robustness and flexibility objectives. The research work led to the development of two software bricks. The first, named Supervisor, manages the drone fleet. This includes the creation of missions, and the dynamic distribution and reallocation of robots within missions, following a decision-support logic. This involves the implementation of a greedy algorithm defining the scheduling of drones in missions according to context, objectives and available resources. The second, called the Mission Manager, is responsible for carrying out the missions and executing the Supervisor’s requests- triggering missions / reallocations. These developments have been compared in terms of theoretical performance through the warehouse inventory application case, and demonstrated in application on multi-mission surveillance deployments. The results show evidence of adaptability to various contexts and robustness to hazards, operating on a system that has actually been implemented. The study of drone swarms for air quality monitoring has led to the development of a three-dimensional drone formation control algorithm. The method is based on the use of virtual forces to attract and repel drones according to their environment. The formation is generated by using Fourier descriptors to describe its shape. Simulation and practical tests show that the formation is maintained despite shape shifting and drone extractions/insertions.

Ιmage segmentatiοn and data apprοximatiοn: applicatiοns tο medicine, geοsciences and renewable energies.

Doctorant·e: KHAYRETDINOVA GUZEL
Direction de thèse: GOUT CHRISTIAN (Directeur·trice de thèse)
KUKSENKO SERGEY (Co-directeur·trice de thèse)
Date de la soutenance: 02/11/2024 à 10:00
Lieu de la soutenance: LMI - FR CNRS 3335 - - M3 - 7600 St Etienne du Rouvray
Rapporteurs de la thèse: GUESSAB ALLAL Université de Pau et des Pays de l'Adour
RADA LAVDIE Bahcesehir University, Turquie
Membres du jurys: BARUCQ HELENE, , INRIA Bordeaux Sud Ouest
GOUT CHRISTIAN, , INSA Rouen Normandie
GUESSAB ALLAL, , Université de Pau et des Pays de l'Adour
KUKSENKO SERGEY, , TUSUR, Russie
RADA LAVDIE, , Bahcesehir University, Turquie

Résumé: Cette thèse contient deux parties principales. Dans la première partie, nous proposons un nouveau modèle de segmentation d'images sous contraintes géométriques : nous améliorons les travaux antérieurs développés par Gout et al. [2008] en définissant une nouvelle condition initiale à partir des contraintes géométriques données par l'utilisateur. Nous définissons également une nouvelle modélisation mathématique, nous donnons le problème de minimisation correspondant, conduisant à une formulation variationnelle. Ce nouveau modèle permet d'envisager de nombreuses applications différentes depuis la segmentation d'images jusqu'à l'approximation de données. Des exemples numériques sont donnés. Dans la deuxième partie de ce travail, nous proposons une approximation de champ de vecteurs (représentant le vent par exemple), nous donnons toutes les étapes depuis la modélisation et approximation par Dm splines jusqu'à la visualisation par Matplotlib (et Python). Des exemples numériques sont donnés.
Abstract: This thesis contains two main parts. In the first part, we propose a new model for image segmentation under geometric constraints: we improve previous works developed by Gout et al. [2008] defining a new initial condition from the geometric constraints given by the user. We also define a new mathematical modelling, we give its corresponding minimization problem leading to a variational formulation. This new model makes it possible to consider many different applications from image segmentation to data approximation. Numerical examples are given. In the second part of this work, we propose a vector field approximation approximation, we give all the steps from the modelling and approximation using Dm splines to the visualization using Matplotlib (and Python). Numerical examples are given.

Estimatiοn οf Depressiοn Level frοm Τext: Symptοm-Based Apprοach, External Κnοwledge, Dataset Validity

Doctorant·e: MILINTSEVICH Kirill
Direction de thèse: DIAS Gael (Directeur·trice de thèse)
SIRTS KAIRIT (Co-directeur·trice de thèse)
Date de la soutenance: 18/10/2024 à 09:30
Lieu de la soutenance: Salle des thèses, UFR Sciences 3, Campus 2, 6 boulevard Maréchal Juin, 14032 Caen
Rapporteurs de la thèse: GRABAR NATALIA Universite de Lille
KLINGER ROMAN Université Otto-Friedrich de Bamberg
Membres du jurys: BARBU EDUARD, Chercheur, Université de Tartu - Estonie
DAILLE BEATRICE, , Nantes Université
DIAS Gael, , UCN - Université de Caen Normandie
GRABAR NATALIA, , Universite de Lille
KLINGER ROMAN, , Université Otto-Friedrich de Bamberg
MAUREL FABRICE, Maître de conférences, UCN - Université de Caen Normandie
SIRTS KAIRIT, Maître de conférences, Université de Tartu - Estonie
TANNIER XAVIER, , Sorbonne Université

Résumé: Le trouble dépressif majeur (TDM) est l'un des troubles mentaux les plus répandus au monde, entraînant souvent une incapacité et un risque accru de suicide. La récente pandémie de coronavirus (COVID-19) a fait grimper le taux de dépression dans le monde entier. De plus, la stigmatisation et l'accès limité aux traitements entravent le diagnostic et les soins appropriés pour de nombreuses personnes. Des études préliminaires ont montré que les personnes déprimées et non déprimées utilisent un vocabulaire différent. Par exemple, les personnes déprimées ont tendance à utiliser davantage de mots négatifs ou émotionnels. Plus récemment, des modèles d'apprentissage profond ont été développés pour détecter la dépression à partir de textes. Cependant, la plupart des chercheurs ont traité la détection de la dépression comme une tâche de classification simple avec seulement deux étiquettes possibles : « déprimé » et « non déprimé ». Lorsqu'on considère deux personnes atteintes de dépression, il est important de noter qu'elles peuvent présenter des symptômes sous-jacents différents. Une personne peut souffrir d'insomnie et de difficultés de concentration, tandis qu'une autre peut présenter des changements d'appétit et une faible estime de soi. Ces personnes nécessitent des traitements différents, donc disposer d'informations sur les symptômes est essentiel. Dans cette thèse, nous avons développé une architecture de réseau neuronal qui prédit les symptômes de la dépression à partir de textes. Nous avons constaté que la prédiction des symptômes, plutôt qu'un simple diagnostic, était plus précise, tout en nous fournissant plus de détails. Nous avons encore amélioré le réseau de neurones en y introduisant des connaissances externes provenant de lexiques de sentiments et d'émotions. Nous avons utilisé une approche simple mais efficace qui consiste à marquer directement les mots des lexiques dans le texte. Enfin, en travaillant sur un jeu de données provenant des réseaux sociaux, nous avons constaté que le processus d’annotation était erroné. En conséquence, nous avons réannoté une partie de ce jeu de données avec l'aide d'un professionnel en santé mentale, démontrant ainsi l'importance de suivre les définitions médicales des symptômes et d'établir des directives claires pour l'annotation.
Abstract: Major Depressive Disorder (MDD) is one of the most prevalent mental disorders globally, often resulting in disability and an increased risk of suicide. The recent COVID-19 pandemic has made depression rates go up around the world. Moreover, stigma and limited treatment access hinder proper diagnosis and care for many. Early studies have found that depressed and non-depressed people use different vocabulary. For example, depressed people tend to use more negative or emotional words. More recently, deep learning models have been developed to detect depression from text. However, most researchers have treated depression detection as a simple classification task with only two possible labels: depressed and non-depressed. When considering two individuals with depression, it is important to note that they may exhibit different underlying symptoms. One person may experience insomnia and difficulty concentrating, while another may struggle with changes in appetite and low self-esteem. These people would require different treatments, so having information about the symptoms is essential. In this work, we developed a neural network that predicts depression symptoms from text. We found that predicting symptoms instead of a simple diagnosis was more accurate while giving us more details at the same time. We further improved the neural network by introducing external knowledge from existing sentiment and emotion lexicons. We used a simplistic yet effective approach of directly marking the words from the lexicons in the text. Finally, while working with a social media dataset, we discovered it was poorly annotated. As a result, we reannotated a part of this dataset with the help of a mental health professional, showing the importance of following medical symptom definitions and establishing clear annotation guidelines.

Géοstatistiques par apprentissage prοfοnd pοur la réductiοn des incertitudes: applicatiοn à la dépοllutiοn des sοls

Doctorant·e: RAKOTONIRINA Herbert
Direction de thèse: HONEINE PAUL (Directeur·trice de thèse)
ATTEIA OLIVIER (Co-directeur·trice de thèse)
Date de la soutenance: 16/10/2024 à 14:00
Lieu de la soutenance: UFR sciences et techniques, Saint Etienne du Rouvray
Rapporteurs de la thèse: BEREZIAT DOMINIQUE Sorbonne Universite
ROMARY THOMAS Université Paris Sciences Lettres
Membres du jurys: ATTEIA OLIVIER, , Universite de Bordeaux
BEREZIAT DOMINIQUE, , Sorbonne Universite
HONEINE PAUL, , URN - Université de Rouen Normandie
PEREZ SANDRA, , Universite Cote d'Azur
ROMARY THOMAS, , Université Paris Sciences Lettres
WALTER CHRISTIAN, , Cfr Rennes Agrocampus Ouest

Résumé: L'objectif de zéro artificialisation des sols d'ici 2030, énoncé par la loi Climat et Résilience en France en 2021 et aligné avec le Green Deal européen, souligne l'importance d'une meilleure gestion des sites et sols pollués (SSP). Cette thèse s'inscrit dans le cadre de la réhabilitation des sites industriels et la gestion des pollutions, domaines cruciaux pour atteindre ces objectifs environnementaux. Elle vise à développer des méthodes basées sur les progrès du Deep Learning en alternative aux méthodes géostatistiques, afin d'améliorer les prédictions et réduire les incertitudes liées à la répartition spatiale des contaminants. L'approche cherche à affiner les cartographies de contamination et à offrir des outils avancés pour la prise de décision environnementale. La thèse se divise en quatre parties principales. Premièrement, nous adaptons l'architecture Deep Image Prior (DIP), initialement conçue pour l'inpainting d'images, pour l'interpolation spatiale. Nous proposons l'utilisation d'une fonction de sur-échantillonnage bi-cubique et l'ajout de connexions résiduelles pour adapter cette architecture à notre situation où le nombre de données observées est très limité. L'utilisation de la méthode DIP présente l'avantage majeur de ne pas nécessiter de données labélisées pour l'entraînement. Cela est particulièrement pertinent pour les SSP où les cartes réelles n'existent pas car les cartographies existantes de la pollution sont le résultat de traitements géostatistiques ou d'autres méthodes. La capacité de la méthode proposée à réaliser une interpolation spatiale est enrichie par sa faculté à générer plusieurs cartographies représentant la distribution probable des polluants. Ce processus permet non seulement d'estimer la répartition des contaminants, mais aussi d'évaluer l'incertitude de ces estimations et de fournir la carte de probabilité de dépasser un seuil critique de pollution. Dans la deuxième partie, nous avons étendu la méthode basée sur le DIP, initialement adaptée pour les données bidimensionnelles, à des applications tridimensionnelles. Cette évolution permet de prendre en compte à la fois les informations verticales et horizontales des données observées, ce qui est crucial dans le contexte des SSP pour modéliser le volume de distribution de la pollution. Grâce à cette méthode, nous avons pu générer des cartographies 3D représentant la distribution probable de la pollution dans les sols et estimer le volume de terre contaminée selon différents seuils de pollution. Dans la 3ème partie, nous avons développé une nouvelle architecture de Deep Learning, toujours basée sur le concept de DIP, conçue pour effectuer une interpolation spatiale intégrant une variable auxiliaire, similairement à la méthode géostatistique de co-krigeage. Cette méthode vise à enrichir les données relatives à la variable d'intérêt pour obtenir une meilleure estimation. Cette approche est particulièrement pertinente pour les SSP, où le coût élevé d'acquisition des données géochimiques peut rendre avantageuse l'utilisation d'une seconde variable pour améliorer les performances des modèles. La méthode proposée obtient de meilleurs résultats que le co-krigeage à la fois en 2D et 3D. L'introduction d'une seconde variable a également permis de maîtriser le sur-apprentissage caractéristique des méthodes basées sur le DIP. La dernière partie de la thèse est consacrée à l'application pratique des méthodes développées sur des cas réels. Le premier cas traite de l'interpolation spatiale en 3D de la conductivité apparente ainsi que d'autres paramètres du sol. Le deuxième cas étudie une situation de co-contamination aux hydrocarbures et aux fluorures en France, mettant en œuvre les techniques élaborées précédemment pour évaluer et modéliser la distribution de la contamination.
Abstract: The goal of zero soil artificialization by 2030, as outlined by the Climate and Resilience law in France in 2021 and aligned with the European Green Deal, underscores the importance of improved management of contaminated sites and soils. This thesis is part of the rehabilitation of industrial sites and pollution management, crucial areas for achieving these environmental objectives. It aims to develop methods based on advancements in Deep Learning as an alternative to geostatistical methods to improve predictions and reduce uncertainties related to the spatial distribution of contaminants. The approach seeks to refine contamination maps and offer advanced tools for environmental decision-making. The thesis is divided into four main parts. First, we adapt the Deep Image Prior (DIP) architecture, initially designed for image inpainting, for spatial interpolation. We propose using a bicubic upsampling function and adding skip connections to adapt this architecture to our situation where the number of observed data is very limited. The use of the DIP method has the major advantage of not requiring labeled data for training. This is particularly relevant for contaminated sites soils, where actual maps do not exist as existing pollution maps result from geostatistical or other methods. The proposed method's ability to perform spatial interpolation is enriched by its capacity to generate multiple maps representing the probable distribution of pollutants. This process not only allows for estimating the distribution of contaminants but also for evaluating the uncertainty of these estimates and providing the probability map of exceeding a critical pollution threshold. In the second part, we extended the DIP-based method, initially adapted for two-dimensional data, to three-dimensional applications. This evolution allows for considering both vertical and horizontal information of observed data, which is crucial in the context of polluted soils to model the volume distribution of pollution. With this method, we generated 3D maps representing the probable distribution of pollution in soils and estimated the volume of contaminated soil according to different pollution thresholds. In the third part, we developed a new Deep Learning architecture, still based on the DIP concept, designed to perform spatial interpolation incorporating an auxiliary variable, similar to the geostatistical method of co-kriging. This method aims to enrich the data related to the variable of interest to obtain a better estimate. This approach is particularly relevant for contaminated sites and soils, where the high cost of acquiring geochemical data can make using a second variable advantageous to improve model performance. The proposed method achieves better results than co-kriging in both 2D and 3D. Introducing a second variable also helped control the overfitting characteristic of DIP-based methods. The last part of the thesis is devoted to the practical application of the methods developed in real cases. The first case deals with the 3D spatial interpolation of apparent conductivity and other soil parameters. The second case studies a situation of co-contamination with hydrocarbons and fluorides in France, implementing the previously developed techniques to assess and model the distribution of contamination.

Representatiοns οf structure grοup οf set-theοretical sοlutiοns tο the Υang-Baxter equatiοn

Doctorant·e: FEINGESICHT Edouard
Direction de thèse: GODELLE Eddy (Directeur·trice de thèse)
Date de la soutenance: 11/10/2024 à 14:00
Lieu de la soutenance: S3 102 (Salle des thèses)
Rapporteurs de la thèse: BALLESTER-BOLINCHES ADOLFO VALENCE - UNIVERSIDAD DE VALENCIA
POULAIN D'ANDECY LOÏC Maître de conférences HDR Université de Reims Champagne Ardenne
Membres du jurys: BALLESTER-BOLINCHES ADOLFO, , VALENCE - UNIVERSIDAD DE VALENCIA
GODELLE Eddy, , UCN - Université de Caen Normandie
LEBED Victoria, Maître de conférences, UCN - Université de Caen Normandie
MARIN IVAN, , UNIVERSITE AMIENS PICARDIE JULES VERNE
POULAIN D'ANDECY LOÏC, Maître de conférences HDR, Université de Reims Champagne Ardenne
VENDRAMIN LEANDRO, Maître de conférences, UNIVERSITE VRIJE BRUSSEL BELGIQUE

Résumé: Dans cette thèse nous nous intéressons à l'étude des solutions ensemblistes de l'équation de Yang-Baxter. Le point de départ de notre approche sont les travaux de Patrick Dehornoy, qui a établi des parallèles entre les groupes de structures des solutions et la théorie des groupes d'Artin-Tits. Nous étudions donc les groupes des structures d'un point de vue de la théorie de Garside, à travers des représentations monomiales, dans le but d'améliorer la compréhension des solutions pour amener à leur éventuelle classification. Dans ce sens, nous étudions les bornes et les valeurs d'une constante définie par Dehornoy pour chaque solution. Nous nous intéressons ensuite à l'irréductibilité des représentations monomiales de ces solutions. Enfin, nous construisons et étudions des algèbres de Hecke pour les solutions, en soulignant les points communs et les différences avec la théorie connue des algèbre de Hecke pour les groupes d'Artin-Tits.
Abstract: In this thesis we are interested in set-theoretical solutions to the Yang-Baxter equation. The starting point of our approach is the work of Patrick Dehornoy, who established parallels between the structure groups of solutions and the theory of Artin-Tits groups. We thus study the structure groups from a Garside theory perspective, through monomial representations, with the aim of improving our understanding of solutions and eventually classifying them. In this sense, we study the bounds and values of a constant defined by Dehornoy for each solution. We then focus on the irreducibility of the monomial representations of these solutions. Finally, we construct and study Hecke algebras for solutions, highlighting the similarities and differences with the known theory of Hecke algebra for Artin-Tits groups.

Cοntributiοn à l'estimatiοn et la prédictiοn de l'état de santé ( en temps différé) d'un LΡRE réutilisable pοur pilοter la maintenance

Doctorant·e: GALLI Federica
Direction de thèse: HOBLOS GHALEB (Directeur·trice de thèse)
WEBER PHILIPPE (Co-directeur·trice de thèse)
Date de la soutenance: 09/10/2024 à 09:30
Lieu de la soutenance: ESIGELEC
Rapporteurs de la thèse: MEDJAHER KAMAL EC NAT INGENIEURS TARBES
NEJJARI-AKHI-ELARAB FATIHA Univ. Polytechnique de Barcelone (ESP)
Membres du jurys: FIORE GIUSEPPE, , Centre National des Etudes Spatiales
HOBLOS GHALEB, , ESIGELEC ROUEN
KOBI ABDESSAMAD, , Université d'Angers
MEDJAHER KAMAL, , EC NAT INGENIEURS TARBES
NEJJARI-AKHI-ELARAB FATIHA, , Univ. Polytechnique de Barcelone (ESP)
SIRCOULOMB VINCENT, , ESIGELEC ROUEN
THEILLIOL DIDIER, , Université de Lorraine
WEBER PHILIPPE, , Université de Lorraine

Résumé: Cette thèse porte sur l’estimation de l’état de santé et la prévision de la durée de vie utile résiduelle en temps différé des moteurs de fusée à propergol liquide réutilisables, qui doivent être requalifiés après chaque mission. Dans ce contexte, la thèse propose une approche PHM (Prognosis and Health Monitoring) locale à base de données pour l’estimation du RUL (Remaining Useful Life) des roulements de la turbopompe du moteur. Deux activités principales ont été menées en parallèle : la génération de signaux vibratoires non stationnaires à l’aide d’un modèle dynamique du roulement, et le déploiement de l’algorithme prédictive pour le pronostic du roulement. L’approche PHM proposé concerne la construction de l’indicateur de santé, le diagnostic du roulement et l’estimation du RUL. Les signaux vibratoires ont été traités à l’aide de la décomposition en ondelettes et utilisés pour calculer un HI (Health Indicator) approprié. Un profil de dégradation a été défini et couplé à des modèles d’initiation et de propagation des fissures. Enfin, un MB-HMM (Multi Branch - Hidden Markov Model) à plusieurs niveaux a été entraîné pour capturer la dynamique de dégradation des roulements. Le modèle obtenu a été utilisé pour le diagnostic et l’estimation du RUL. La méthodologie proposée a été appliquée à des signaux vibratoires à la fois synthétiques et expérimentales (FEMTO, XJTU-SY). Les résultats montrent de bonnes capacités de prédiction du RUL. Plus spécifiquement, les modèles d’initiation et propagation de fatigue ont permis une réduction de la taille du modèle ML (Machine Learning), améliorant ainsi la phase d’entraînement des algorithmes.
Abstract: This thesis focuses on State of Health estimation and offline Remaining Useful Life (RUL) prediction for reusable liquid propellant (LPRE) rocket engines. Reusable LPREs must be requalified after each mission, so predictive maintenance actions must be planned. In this context, the thesis proposes a local data-driven PHM approach for the estimation of the turbopump bearings RUL. Two main activities were carried out in parallel: non-stationary vibration signals generation with a bearing dynamic model and bearing prognosis using a data-driven predictive algorithm. The proposed PHM approach includes: Health Indicator (HI) construction, bearing diagnosis and RUL estimation. Non-stationary vibration data were processed using the Maximum Overlap Discrete Wavelet Packet Transform (MODWPT) decomposition. Then, they were used to calculate an appropriate HI. A degradation profile was defined and linked to crack initiation and propagation fatigue models. Finally, a multi-level MB-HMM (Multi Branch - Hidden Markov Model) was trained to capture the bearing degradation dynamics. The resulting model was used to estimate the SoH as well as the RUL. The proposed methodology was applied to both synthetic and experimental signals. In particular, the FEMTO dataset and the XJTU-SY dataset were selected, which contain run-to-failure vibration signals. The obtained results show good RUL prediction capabilities. In particular, fatigue models allowed a reduction in the size of the ML (Machine Learning) model, thus improving the training phase of the algorithm.

Τοwards Explainable and Ιnterpretable Deep Νeural Νetwοrks

Doctorant·e: JEANNERET SANMIGUEL Guillaume
Direction de thèse: JURIE Frederic (Directeur·trice de thèse)
Date de la soutenance: 25/09/2024 à 14:00
Lieu de la soutenance: Salle des thèses in the Science 3 - Campus 2 - Universite de Caen
Rapporteurs de la thèse: CORD MATTHIEU Sorbonne Université
DANTCHEVA ANTITZA CNRS
Membres du jurys: CORD MATTHIEU, , Sorbonne Université
DANTCHEVA ANTITZA, , CNRS
JURIE Frederic, , UCN - Université de Caen Normandie
KIJAK EWA, Maître de conférences HDR, IRISA/INRIA Rennes
SCHMID CORDELIA, , INRIA Paris
SIMON LOIC, Maître de conférences, UCN - Université de Caen Normandie

Résumé: Les architectures neuronales profondes ont démontré des résultats remarquables dans diverses tâches de vision par ordinateur. Cependant, leur performance extraordinaire se fait au détriment de l'interprétabilité. En conséquence, le domaine de l'IA explicable a émergé pour comprendre réellement ce que ces modèles apprennent et pour découvrir leurs sources d'erreur. Cette thèse explore les algorithmes explicables afin de révéler les biais et les variables utilisés par ces modèles de boîte noire dans le contexte de la classification d'images. Par conséquent, nous divisons cette thèse en quatre parties. Dans les trois premiers chapitres, nous proposons plusieurs méthodes pour générer des explications contrefactuelles. Tout d'abord, nous incorporons des modèles de diffusion pour générer ces explications. Ensuite, nous lions les domaines de recherche des exemples adversariaux et des contrefactuels pour générer ces derniers. Le suivant chapitre propose une nouvelle méthode pour générer des contrefactuels en mode totalement boîte noire, c'est-à-dire en utilisant uniquement l'entrée et la prédiction sans accéder au modèle. La dernière partie de cette thèse concerne la création de méthodes interprétables par conception. Plus précisément, nous étudions comment étendre les transformeurs de vision en architectures interprétables. Nos méthodes proposées ont montré des résultats prometteurs et ont avancé la frontière des connaissances de la littérature actuelle sur l'IA explicable.
Abstract: Deep neural architectures have demonstrated outstanding results in a variety of computer vision tasks. However, their extraordinary performance comes at the cost of interpretability. As a result, the field of Explanable AI has emerged to understand what these models are learning as well as to uncover their sources of error. In this thesis, we explore the world of explainable algorithms to uncover the biases and variables used by these parametric models in the context of image classification. To this end, we divide this thesis into four parts. The first three chapters proposes several methods to generate counterfactual explanations. In the first chapter, we proposed to incorporate diffusion models to generate these explanations. Next, we link the research areas of adversarial attacks and counterfactuals. The next chapter proposes a new pipeline to generate counterfactuals in a fully black-box mode, \ie, using only the input and the prediction without accessing the model. The final part of this thesis is related to the creation of interpretable by-design methods. More specifically, we investigate how to extend vision transformers into interpretable architectures. Our proposed methods have shown promising results and have made a step forward in the knowledge frontier of current XAI literature.

Analyse de Dynamiques d'échanges Μicrοscοpiques et Μacrοscοpiques pοur l'écοlοgie et l'épidémiοlοgie.

Doctorant·e: TRETON Samuel
Direction de thèse: ALFARO MATTHIEU (Directeur·trice de thèse)
Date de la soutenance: 19/09/2024 à 14:00
Lieu de la soutenance: Laboratoire de Mathématiques Raphaël Salem, Université de Rouen, campus du Madrillet
Rapporteurs de la thèse: NADIN GRÉGOIRE Université d'Orléans
SOUPLET PHILIPPE UNIVERSITE PARIS 13 PARIS-NORD
Membres du jurys: ALFARO MATTHIEU, , URN - Université de Rouen Normandie
CALVEZ VINCENT, , UNIVERSITE BRETAGNE SUD UBS
LANDIM CLAUDIO, , URN - Université de Rouen Normandie
MIRRAHIMI SEPIDEH, , UNIVERSITE MONTPELLIER 2 SCIENCES ET TECH DU LANGUEDOC
NADIN GRÉGOIRE, , Université d'Orléans
RIBOT MAGALI, , Université d'Orléans
ROQUEJOFFRE JEAN-MICHEL, , Université de Toulouse 3 - Paul Sabatier
SOUPLET PHILIPPE, , UNIVERSITE PARIS 13 PARIS-NORD

Résumé: Cette thèse porte sur la dérivation et l'analyse de modèles de populations structurées en espace, de nature stochastique et déterministe. L'objectif principal de ce travail est d'améliorer notre compréhension des liens complexes entre les dynamiques individu-centrées et le comportement global des populations, ainsi que l'évolution en temps long de ces dernières. En mettant l'accent sur certains modèles présentant des dynamiques d'échanges entre milieux hétérogènes, on explore les relations entre certains systèmes de particules en interaction (processus d'exclusion simple) et les équations de réaction-diffusion. Une attention particulière est également porté à l'analyse du comportement en temps long des solutions de ces dernières, notamment aux critères de persistance ou d'extinction des populations. On commence par introduire dans le Chapitre 1 les principaux fondements théoriques des équations de réaction-diffusion et des processus d'exclusion simple. Cette partie établit les prérequis essentiels pour les chapitres qui suivent. Le Chapitre 2 est consacré à la dérivation microscopique, à partir d'un processus d'exclusion simple, d'un système de réaction-diffusion connu sous le nom de "champ-route", utilisé pour modéliser l'impact des lignes de diffusion rapide en écologie et épidémiologie. Dans le Chapitre 3, on rend explicite les solutions du système champ-route diffusif original et on en fournit un contrôle uniforme en temps long. Ce type de contrôle s'avère utile pour quantifier "l'intensité de dispersion" du processus diffusif et permet notamment de montrer des résultats de persistance et d'extinction lorsqu'une fonction de croissance avec effet Allee est introduite. Enfin, le Chapitre 4 concerne des résultats de type Fujita sur l'explosion en temps fini, par opposition à la possible existence globale des solutions, d'un système de réaction-diffusion sur-linéaire "échangeur de chaleur". Cette étude permet de caractériser la stabilité de l'équilibre nul lorsqu'on ajoute une réaction monostable dégénérée en 0, pénalisant la croissance des faibles densités. Ce point représente la clé de voûte de la caractérisation des phénomènes de persistance et d'extinction mentionnés plus haut.
Abstract: This thesis deals with the derivation and the analysis of spatially structured population models, including both stochastic and deterministic approaches. The main goal of this work is to deepen our understanding of the intricate connections between individual-based dynamics and the collective behavior of populations, as well as the long-term behavior of the latter. By focusing on models that illustrate exchanges between heterogeneous environments, we particularly investigate the relationships between certain interacting particle systems (simple exclusion processes) and reaction-diffusion equations. Special attention is also given to the long-term behavior of the solutions of these equations, especially the criteria for population persistence or extinction. Chapter 1 lays the theoretical background for reaction-diffusion equations and simple exclusion processes. This section provides the necessary foundation for the following chapters. Chapter 2 explores the microscopic derivation, via a simple exclusion process, of a reaction-diffusion system known as the "field-road model", which is used to model the impact of fast diffusion channels in ecology and epidemiology. In Chapter 3, we explicitly derive the solutions of the original field-road diffusion model and provide a uniform long-term control. Such control is useful to quantify the "dispersion intensity" of the diffusive process, enabling to demonstrate results related to persistence and extinction when a growth function with an Allee effect is introduced. Finally, Chapter 4 examines Fujita-type results concerning blow-up versus possible global existence of solutions to a superlinear reaction-diffusion "heat exchanger" system. This study characterizes the stability of the zero equilibrium when a monostable reaction degenerate at 0 (penalizing low-density growth) is included. This aspect is crucial for understanding the persistence and extinction phenomena mentioned above.

Adressing data Ιncest fοr Cοοperative Lοcalizatiοn in Μulti-sensοr Μulti-vehicle Systems

Doctorant·e: SHAN Xiaoyu
Direction de thèse: CHAFOUK HOUCINE (Directeur·trice de thèse)
CABANI ADNANE (Co-directeur·trice de thèse)
Date de la soutenance: 17/09/2024 à 14:00
Lieu de la soutenance: ESIGELEC Rouen
Rapporteurs de la thèse: M'SIRDI NACER Aix-Marseille université
RABHI ABDELHAMID UNIVERSITE AMIENS PICARDIE JULES VERNE
Membres du jurys: BENSRHAIR ABDELAZIZ, , INSA Rouen Normandie
CABANI ADNANE, , ESIGELEC ROUEN
CHAFOUK HOUCINE, , ESIGELEC ROUEN
M'SIRDI NACER, , Aix-Marseille université
RABHI ABDELHAMID, , UNIVERSITE AMIENS PICARDIE JULES VERNE
RANDRIAMASY MALALATIANA, ,

Résumé: Le problème de consanguinité des données ou data incest en anglais provoque une corrélation entre les estimations pendant le processus de fusion de données, ce qui donne des résultats de fusion de données incohérents. En particulier la localisation coopérative dans le système multi-capteurs multi-véhicules (MSMV) met en evidence le problème deconsanguinité des données qui est grave en raison de multiples estimations de positions relatives, qui ne conduit pas seulement à une estimation pessimiste, mais entraîne également une surcharge de calcul supplémentaire. Afin de résoudre le problème de consanguinité des données, nous proposons une nouvelle méthode de fusion de données appelée filtre d’intersection de covariance divisée par intervalles (ISCIF). La cohérence générale de l’ISCIF est prouvée, servant commepreuve supplémentaire pour le filtre d’intersection de covariance divisée (SCIF). De plus, un système de localisation MSMV décentralisé comprenant des étapes de positionnement absolu et relatif est conçu. Dans l’étape de positionnement absolu, chaque véhicule utilise l’algorithme ISCIF pour mettre à jour sa propre position sur la base de mesures absolues. Au cours de l’étape de position relative, la méthode de propagation par contrainte d’intervalle (ICP) est mise en œuvre pour prétraiter plusieurs estimations de position relative et préparer les données d’entrée pour l’ISCIF. Ensuite, l’algorithme ISCIF proposé est utilisé pour réaliser le positionnement relatif. De plus, pour augmenter la robustesse de la méthode de localisation proposée dans les systèmes MSMV, une méthode de détection et d’exclusion de défauts (FDE) basée sur la divergence Kullback-Leibler (KLD) est implémentée dans notre système. Des simulations comparatives démontrent que la méthode proposée peut obtenir des résultats précis, robustes et peu coûteux par rapport aux méthodes de l’état de l’art.
Abstract: Data incest problem causes inter-estimate correlation during data fusion process, which yields inconsistent data fusion result. Especially in the multi-sensor multi-vehicle (MSMV) cooperative localization system, the data incest problem is serious due to multiple relative position estimations, which not only leads to pessimistic estimation, but also causes additional computational overhead. In order to address the data incest problem, we propose a new data fusion method named interval split covariance intersection filter (ISCIF). The general consistency of the ISCIF is proven, serving as a supplementary proof for the split covariance intersection filter (SCIF). Moreover, a decentralized MSMV localization system including absolute and relative positioning stages is designed. In the absolute positioning stage, each vehicle uses the ISCIF algorithm to update its own position based on absolute measurements. In the relative position stage, the interval constraint propagation (ICP) method is implemented to preprocess multiple relative position estimates and prepare input data for ISCIF at first. Then, the proposed ISCIF algorithm is employed to realize relative positioning. Furthermore, in order to enhance the robustness of the proposed localization method in MSMV systems, a Kullback–Leibler divergence (KLD)-based fault detection and exclusion (FDE) method is implemented in our system. In addition, comparative simulations demonstrate that the proposed method can achieve accurate, robust and low-cost results compared with the state of the art methods.

Le feu ça brûle et l'infοrmatique ça bugge : cοmbustiοn et régressiοn dans les graphes

Doctorant·e: LECOQ Romain
Direction de thèse: DORBEC Paul (Directeur·trice de thèse)
OTACHI YOTA (Co-directeur·trice de thèse)
Date de la soutenance: 13/09/2024 à 14:30
Lieu de la soutenance: Greyc
Rapporteurs de la thèse: GENITRINI ANTOINE Sorbonne Université
LIEDLOFF MATHIEU Université d'Orléans
Membres du jurys: COURTIEL Julien, Maître de conférences, UCN - Université de Caen Normandie
DORBEC Paul, , UCN - Université de Caen Normandie
FALLERI JEAN-RÉMY, , MATMECA - BORDEAUX
GENITRINI ANTOINE, , Sorbonne Université
LIEDLOFF MATHIEU, , Université d'Orléans
MITSOU VALIA, Maître de conférences, Université Paris Cité
VALLEE BRIGITTE, , ENSICAEN

Résumé
Abstract

Classificatiοn des filtratiοns dynamiques et étude des systèmes d'entrοpie pοsitive

Doctorant·e: BENZONI Severin
Direction de thèse: DE LA RUE THIERRY (Directeur·trice de thèse)
ROY EMMANUEL (Co-directeur·trice de thèse)
Date de la soutenance: 10/09/2024 à 14:30
Lieu de la soutenance: LMRS, Université de Rouen Normandie
Rapporteurs de la thèse: LEURIDAN CHRISTOPHE Universite Grenoble Alpes
WEISS BENJAMIN Université Hébraïque de Jérusalem
Membres du jurys: AUSTIN TIM, , Université de Warwick
DE LA RUE THIERRY, , URN - Université de Rouen Normandie
JANVRESSE ELISE, , UNIVERSITE AMIENS PICARDIE JULES VERNE
LEURIDAN CHRISTOPHE, , Universite Grenoble Alpes
MARCOVICI IRENE, , URN - Université de Rouen Normandie
ROY EMMANUEL, , UNIVERSITE PARIS 13 PARIS-NORD
WEISS BENJAMIN, , Université Hébraïque de Jérusalem

Résumé: Dans cette thèse, nous explorons les structures possibles des systèmes dynamiques de la forme $\bfX :=(X, \A, \mu, T)$ et leurs tribus facteur $\B \subset \A$. Les deux premiers chapitres étudient les différentes façons dont une tribu facteur $\B$ peut s'inclure dans un système dynamique $\bfX :=(X, \A, \mu, T)$, c'est-à-dire que nous étudions certaines structures possibles de l'\emph{extension} $\A \arr \B$. Dans le premier chapitre, nous considérons les concepts de \emph{super-innovations} et de \emph{standardité} des extensions, inspirés de la théorie des filtrations. Un point important est l'introduction de la notion d'\emph{extensions confinées}, qui nous intéressent parce qu'elles n'ont pas de super-innovation. Nous donnons plusieurs exemples et étudions des propriétés supplémentaires de ces extensions, y compris des résultats de relèvement. Ensuite, nous montrons notre résultat principal : l'existence d'extensions non-standard. Enfin, ce résultat trouve une application dans l'étude des filtrations dynamiques, qui sont les filtrations de la forme $(\F_n)_{n \leq 0}$ telles que chaque $\F_n$ est une tribu facteur. Nous montrons qu'il existe des \emph{filtrations dynamiques I-confortables non standard}. Le deuxième chapitre approfondit l'étude des extensions confinées en trouvant un nouveau type de telles extensions, dans le cadre des suspensions de Poisson : nous prenons un système dynamique $(X, \mu, T)$ en mesure $\s$-finie infinie et une extension compacte $(X \times G, \mu \otimes m_G, T_\phi)$, puis nous considérons l'extension de Poisson correspondante $((X \times G)^*, (\mu \otimes m_G)^*, (T_\phi)_*) \to (X^*, \mu^*, T_*)$. Nous donnons des conditions sous lesquelles cette extension est confinée et construisons un exemple qui correspond à ces conditions. Enfin, le troisième chapitre se concentre sur une famille de filtrations dynamiques : les \emph{filtrations de Pinsker faible}. L'existence de ces filtrations sur tout système ergodique provient d'un résultat récent d'Austin \cite{austin}, et elles se présentent comme un outil potentiel pour décrire les systèmes à entropie positive. Nous explorons les liens entre la structure asymptotique des filtrations de Pinsker faible et les propriétés du système dynamique sous-jacent. Naturellement, nous demandons aussi si, sur un système donné, la structure des filtrations de Pinsker faible est unique à isomorphisme près. Nous donnons une réponse partielle, dans le cas où le système sous-jacent est un schéma de Bernoulli. Nous concluons notre travail en donnant deux exemples explicites de filtrations de Pinsker faible.
Abstract: In this thesis, we explore the possible structures of measure preserving dynamical systems of the form $\bfX :=(X, \A, \mu, T)$ and their factor $\s$-algebras $\B \subset \A$. The first two chapters investigate various ways in which a factor $\s$-algebra $\B$ can sit in a dynamical system $\bfX :=(X, \A, \mu, T)$, i.e. we study some possible structures of the \emph{extension} $\A \arr \B$. In the first chapter, we consider the concepts of \emph{super-innovations} and \emph{standardness} of extensions, which are inspired from the theory of filtrations. An important focus of our work is the introduction of the notion of \emph{confined extensions}, which first interested us because they have no super-innovation. We give several examples and study additional properties of confined extensions, including several lifting results. Then, we show our main result: the existence of non-standard extensions. Finally, this result finds an application to the study of dynamical filtrations, i.e. filtrations of the form $(\F_n)_{n \leq 0}$ such that each $\F_n$ is a factor $\s$-algebra. We show that there exist \emph{non-standard I-cosy dynamical filtrations}. The second chapter furthers the study of confined extensions by finding a new kind of such extensions, in the setup of Poisson suspensions: we take an infinite $\s$-finite measure-preserving dynamical system $(X, \mu, T)$ and a compact extension $(X \times G, \mu \otimes m_G, T_\phi)$, then we consider the corresponding Poisson extension $((X \times G)^*, (\mu \otimes m_G)^*, (T_\phi)_*) \to (X^*, \mu^*, T_*)$. We give conditions under which that extension is confined and build an example which fits those conditions. Lastly, the third chapter focuses on a family of dynamical filtrations: \emph{weak Pinsker filtrations}. The existence of those filtrations on any ergodic system comes from a recent result by Austin \cite{austin}, and they present themselves as a potential tool to describe positive entropy systems. We explore the links between the asymptotic structure of weak Pinsker filtrations and the properties of the underlying dynamical system. Naturally, we also ask whether, on a given system, the structure of weak Pinsker filtrations is unique up to isomorphism. We give a partial answer, in the case where the underlying system is Bernoulli. We conclude our work by giving two explicit examples of weak Pinsker filtrations.

D'un espace de mοtifs structurés à sοn explοratiοn : cοmment prendre en cοmpte l'intérêt d'une experte ?

Doctorant·e: LEHEMBRE Etienne
Direction de thèse: CREMILLEUX Bruno (Directeur·trice de thèse)
Date de la soutenance: 06/09/2024 à 09:00
Lieu de la soutenance: Campus 2, Sciences 3, s3-102
Rapporteurs de la thèse: ROBARDET CÉLINE INSA Lyon
SOULET ARNAUD Universite de Tours
Membres du jurys: BUREAU Ronan, , UCN - Université de Caen Normandie
CELLIER PEGGY, Maître de conférences HDR, INSA de Rennes
CREMILLEUX Bruno, , UCN - Université de Caen Normandie
IENCO DINO, Directeur de recherche, INRAE MONTPELLIER
ROBARDET CÉLINE, , INSA Lyon
SOULET ARNAUD, , Universite de Tours
ZIMMERMANN Albrecht, Maître de conférences, UCN - Université de Caen Normandie

Résumé: Cette thèse aborde des questions connexes à la fouille de motifs de données structurées dans le cadre de la chémoinformatique. Plus précisément, nous considérons le rôle d'une experte dans l'évaluation de l'intérêt des motifs structurés ainsi que la caractérisation d’éléments remarquables dans un ensemble de motifs. Ainsi, nous présentons dans ce manuscrit trois contributions majeures. La première contribution permet de fournir à une experte des motifs dont les caractéristiques sont jugées surprenantes vis-à-vis d’un ensemble de motifs étudiés et de leur jeu de données. Ainsi, les motifs obtenus constituent pour l'experte des points d'entrée pour le début d’une analyse comparative mettant en relief les motifs et leur qualité afin de faire ressortir leur pertinence locale. Cette contribution consiste en un sélecteur de motifs remarquables nommé OPS (Outstanding Pattern Selector). Nous définissons un motif comme remarquable si sa qualité diverge suffisamment de son voisinage, c'est-à-dire, si sa qualité diverge suffisamment des qualités des motifs qui lui ressemblent. En chémoinformatique, les motifs sélectionnés sont des PAD (Pharmacophores Activity Delta) et constituent un ensemble de motifs dont les fonctions biologiques et le comportement des molécules s'avèrent surprenants pour les expertes. La seconde contribution consiste en une méthode d'exploration interactive nommée WaveLSea (Wave top-k random-d Lineage Search). Une particularité de l’algorithme WaveLSea est qu'il ne nécessite pas la déclaration de descripteurs sur les données explorées. Pour un ensemble de motifs donné, cette méthode a pour but d’orienter une experte dans son exploration de manière itérative. À ces fins, l'algorithme permet à l'experte d'interagir avec les motifs tout en lui proposant des échantillons pertinents. Ces interactions sont converties en étiquettes positives ou négatives permettant d'orienter l'experte dans son parcours de l'ensemble des motifs à travers les futurs échantillons. La troisième contribution consiste en une amélioration des méthodes d'évaluation des algorithmes de fouille interactive. Cette amélioration se fait à travers l'introduction d'erreurs contrôlées permettant d'évaluer la robustesse de ces algorithmes. Ainsi, les algorithmes de fouille interactive ne sont plus évalués avec des oracles ne commettant jamais d'erreurs, mais avec des devins dont le comportement se rapproche de celui d'un humain. En résumé, nous abordons dans cette thèse l'évaluation de l'intérêt des motifs structurés. Cette évaluation se fait de manière statique à travers le caractère remarquable des motifs et de manière dynamique grâce à un algorithme interactif. Enfin, nous abordons les problématiques liées à l'évaluation des algorithmes de fouille interactive. Ces résultats généraux sont abordés sous le regard de la chémoinformatique et du jeu de données BCR-ABL1 portant sur la leucémie myéloïde chronique afin de les illustrer dans un contexte concret.
Abstract: This thesis addresses issues related to pattern mining of structured data in the context of chemoinformatics. More specifically, we consider the role of an expert in evaluating the interest of structured patterns and in characterising remarkable elements in a set of patterns. In this manuscript, we present three major contributions. The first contribution makes it possible to give to an expert patterns whose characteristics are judged to be surprising in relation to a studied set of patterns and its dataset. The patterns thus obtained provide the expert with entry points for the start of a comparative analysis contrasting patterns and their quality in order to highlight their local relevance. This contribution consists of an Outstanding Pattern Selector nammed OPS. We define a pattern as remarkable if its quality diverges sufficiently from its neighbourhood, i.e. if its quality diverges sufficiently from the qualities of patterns that resemble it. In chemoinformatics, the patterns selected are PADs (Pharmacophores Activity Delta) and constitute a set of patterns whose biological functions and molecular behaviour are surprising for experts. The second contribution consists of an interactive exploration method called WaveLSea (Wave top-k random-d Lineage Search). A particular feature of the WaveLSea algorithm is that it does not require the declaration of descriptors on the data being explored. For a given set of patterns, the aim of this method is to iteratively guide an expert in her exploration. To this end, the algorithm allows the expert to interact with the patterns while suggesting relevant samples. These interactions are converted into positive or negative labels to guide the expert through the set of patterns and future samples. The third contribution consists of improving the methods used for evaluating interactive mining algorithms. This improvement is achieved by introducing controlled errors to evaluate the robustness of these algorithms. Thus, interactive mining algorithms are no longer evaluated with oracles that never make mistakes, but with soothsayers whose behaviour is closer to that of a human. To summarize, this thesis deals with the evaluation of the interest of structured patterns. This evaluation is carried out statically through the remarkable character of the patterns and dynamically through an interactive algorithm. Finally, we address the problems associated with the evaluation of interactive mining algorithms. These general results are discussed using chemoinformatics and the BCR-ABL1 dataset on chronic myeloid leukaemia to illustrate them in a concrete context.

Κnοwledge Graph-based System fοr Τechnical Dοcument Retrieval A deductive reasοning-fοcused explοratiοn

Doctorant·e: SESBOUE MATTHIAS
Direction de thèse: ZANNI-MERK CECILIA (Directeur·trice de thèse)
DELESTRE Nicolas (Co-encadrant·e de thèse)
KOTOWICZ JEAN-PHILIPPE (Co-encadrant·e de thèse)
Date de la soutenance: 05/09/2024 à 13:15
Lieu de la soutenance: INSA de Rouen Normandie
Rapporteurs de la thèse: TROJAHN CASSIA Université Toulouse II
VAKAJ EDLIRA Birmingham City University, Royaume-Uni
Membres du jurys: DELESTRE Nicolas, , INSA Rouen Normandie
KOTOWICZ JEAN-PHILIPPE, , INSA Rouen Normandie
SETCHI ROSSI, , University of Cardiff, Royaume-Uni
SOUALMIA FATIMA, , URN - Université de Rouen Normandie
TROJAHN CASSIA, , Université Toulouse II
VAKAJ EDLIRA, , Birmingham City University, Royaume-Uni
ZACHAREWICZ GRÉGORY, , Ecole de Mines d'Ales
ZANNI-MERK CECILIA, , INSA Rouen Normandie

Résumé: Ces travaux de recherche industrielle explorent les systèmes fondés sur les graphes de connaissances (KGBS) pour la Recherche d'Informations (RI). Ils ont été menés en partenariat avec l'entreprise TraceParts. Notre cas d'utilisation considère un corpus de documents techniques composé de modèles CAO et de leurs descriptions. Plutôt que d'exploiter les modèles CAO directement, nous nous concentrons sur leurs textes descriptifs. Aujourd'hui, les graphes de connaissances (KG) deviennent omniprésents dans les systèmes d'information et les applications des entreprises. De nombreux domaines de recherche, tels que la RI, ont adopté les KG. Ces artefacts numériques agrègent des données hétérogènes et représentent les connaissances dans un format interprétable par nos ordinateurs. Ce sont des graphes destinés à accumuler et à transmettre les connaissances du monde réel, dont les nœuds représentent des entités d'intérêt et les arêtes les relations entre ces entités. Les projets d'ingénierie et de construction produisent une multitude de documents techniques. Les systèmes de RI sont essentiels pour les industries de ces domaines afin de retrouver efficacement leurs documents. Ces derniers sont complexes, hétérogènes et spécialisés. Bien que ces industries manipulent des documents avec un contenu textuel, ces textes et leurs métadonnées contiennent des concepts et du vocabulaire spécifiques à chaque domaine. Les KG ouverts et les ontologies existantes décrivent des concepts généraux et manquent des connaissances plus fines requises par les applications de RI. Par conséquent, les outils de RI et de gestion des connaissances nécessitent des KG spécifiques à chaque domaine, construits à partir de documents ou étendant des KG existants. Nous explorons tout d'abord les KG, les ontologies et leur relation. Cette revue de littérature nous amène à proposer notre propre définition de KG. Nous considérons les ontologies comme une composante d'un KG et adoptons une perspective fondée sur le Web Sémantique en proposant des technologies issues des normes du Consortium World Wide Web. Nous explorons également la signification théorique et pratique du terme "sémantique" avant de poursuivre notre revue de la littérature avec la RI, en mettant l'accent sur la RI fondée sur les KG. Nous mettons en avant des similitudes et distinctions dans les utilisations des KG. Nos contributions introduisent d'abord une architecture pour les KGBS. Cette architecture organise l'acquisition, la modélisation et la consommation des connaissances autour du KG. Nous démontrons que les standards du Web Sémantique fournissent une approche pour chaque composante de notre architecture. Nous utilisons cette dernière pour organiser la présentation de la suite de notre travail. Chacune de nos contributions aborde respectivement l'acquisition, la modélisation et la consommation des connaissances. Pour nos travaux, nous n'avons pas de KG préconstruit ou d'accès à des experts du domaine pour le construire. Par conséquent, nous abordons l'acquisition de connaissances en concevant notre approche d'apprentissage automatique d'ontologies (OLAF). Nous utilisons OLAF pour construire des chaînes de traitements et apprendre automatiquement des ontologies à partir de texte. Nous implémentons notre approche sous forme d'une bibliothèque Python open-source et construisons deux ontologies pour évaluer la pertinence, la facilité d'utilisation et la modularité de notre outil. Nous nous concentrons ensuite sur la modélisation des connaissances, en présentant notre ontologie de RI dont nous démontrons l'utilisation avec un système de RI fondé sur du raisonnement déductif OWL en temps réel. La démonstration de notre ontologie de RI illustre par une implémentation fondée sur le Web Sémantique de notre définition de KG. Enfin, nous mettons en oeuvre à échelle industrielle une approche fondée sur les KG avec des données provenant de la plateforme de contenue CAO www.traceparts.com.
Abstract: These industrial research works explore Knowledge Graph-Based Systems (KGBS) for Information Retrieval (IR). They have been conducted in partnership with the company TraceParts. TraceParts is one of the world's leading Computer-Aided Design (CAD)-content platforms for Engineering, Industrial Equipment, and Machine Design. Hence, our use case considers a technical document corpus composed of Computer-Aided Design (CAD) models and their descriptions. Rather than leveraging the CAD models, we focus on their descriptive texts. Knowledge Graphs (KG) are ubiquitous in today's enterprise information systems and applications. Many academic research fields, such as Information Retrieval (IR), have adopted KGs. These digital knowledge artefacts aggregate heterogeneous data and represent knowledge in a machine-readable format. They are graphs intended to accumulate and convey knowledge of the real world, whose nodes represent entities of interest and whose edges represent relations between these entities. The Architecture Engineering and Construction projects produce a wealth of technical documents. IR systems are critical to these industries to retrieve their complex, heterogeneous, specialised documents quickly. Healthcare is another similar domain with such a need. Though these industries manage documents with some textual content, such text and the metadata contain domain-specific concepts and vocabularies. Open KGs and the existing ontologies often describe concepts that are too high-level and need more fine-grained knowledge required by IR applications. Hence, companies' IR and knowledge management tools require domain-specific KGs built from scratch or extending existing ones. Throughout our literature review, we first explore Knowledge Graphs (KG), ontologies, and how they relate to and derive our unifying KG definition. We consider ontologies one component of a KG and take a Semantic Web perspective, proposing illustrative candidate technologies from the World Wide Web Consortium Semantic Web standards. We also explore the theoretical and practical meaning of the term "semantics". We then explore the literature on IR, focusing on KG-based IR. We break down this review section, first exploring the literature on IR using the term "knowledge graph" and then the one using the term "ontology". We thereby point out some similarities and distinctions in the KG usages. Our contributions first introduce a KGBS architecture relating knowledge acquisition, modelling, and consumption arranged around the KG. We demonstrate that Semantic Web standards provide an approach for each KGBS component. To organise our work, we follow this system architecture; hence, each of our contributions addresses knowledge acquisition, modelling, and consumption, respectively. For our work, we do not have a pre-built KG or access to domain experts to construct it. Hence, we address knowledge acquisition by designing our Ontology Learning Applied Framework (OLAF) collaboratively with some of our research group members. We use OLAF to build pipelines to automatically learn an ontology from text. We implement our framework as an open-source Python library and build two ontologies to assess the OLAF's pertinence, usability, and modularity. We then focus on knowledge modelling, presenting our IR ontology and demonstrating its usage with an OWL reasoning-powered IR system. While most IR systems leverage reasoning in an offline process, our approach explores OWL reasoning at runtime. While demonstrating our IR ontology, we illustrate a Semantic Web-based implementation of our KG definition by pointing out each KG component in our IR ontology demonstration. Finally, we tackle the CAD model retrieval challenge our industrial partner TraceParts faces by implementing a KG-based approach at scale and using real-world data. We illustrate moving from an existing text-based technical document retrieval system to a KG-based one. We leverage real-world TraceParts

Soutenances autorisées pour l'ED « École Doctorale Mathématiques, Information, Ingénierie des Systèmes » (ED 590 MIIS)

Liste des soutenances actuelles 57

Sécurité d'un système d'authentificatiοn biοmétrique basé sur les cοdes cοrrecteurs d'erreurs

Cοmbinatοrics οf cactus grοups, interesting subgrοups and generalisatiοns

Unsupervised Learning-based Ιnfοrmatiοn Retrieval Applied tο Spοt Ρatterns in Ηistοrical Dοcument Ιmages

Décimatiοn hiérarchique pοur l'apprentissage sur graphes

Sοficity οf multidimensiοnal subshifts

Equatiοns de Ηamiltοn-Jacοbi sur des graphes

Οptimal cοntrοl prοblems and Ηamiltοn-Jacοbi-Bellman equatiοns in sοme curved metric spaces

Οn zeta and multizeta values in pοsitive characteristic

Aspects οf the p-adic Κudla prοgram fοr the unitary grοup GU(2, 1)

Améliοratiοn de la Détectiοn d'Οbjets 3D Μοnοculaire basée sur l'ΙA: Applicatiοn au Τrain Autοnοme Μοnοrail par Stabilisatiοn Gyrοscοpique

ΡreDiViD Τοwards the Ρredictiοn οf the Disseminatiοn οf Viral Disease cοntagiοn in a pandemic setting

Τοwards efficient Κnοwledge Graph-based Retrieval Augmented Generatiοn fοr cοnversatiοnal agents

Μulti-dοmain translatiοn in a semi-supervised setting

Μοdèles affines généralisées et symétries d'équatiοns aux dérivés partielles

Οptimizatiοn οf Synchrοmοdal Cοntainer Τranspοrtatiοn

Synthèse d'algοrithmes d'estimatiοn intelligents en vue du cοntrοle de trajectοire d'une flοtte de véhicules autοnοmes en platοοning (cοnvοi)

Ιntelligent apprοach fοr trafic cοngestiοn predictiοn

Ιndécidabilité des invariants géοmétriques dans les pavages

Τraitement d'image pοur la valοrisatiοn et l'accessibilité des οeuvres muséales

Smart Rοad Signs based trust management mοdels fοr cοοperative Ιntelligent Τranspοrtatiοn Systems

Dévelοppement de détecteurs de rayοnnement ΤΗz nοn refrοidis à base de La0.7Sr0.3ΜnΟ3

Ρarametric estimatiοn fοr a class οf multidimensiοnal affine prοcesses

Οbservatοire de la tactique en (e-)spοrt cοllectif

Ηybrid mοdels cοmbining deep neural representatiοns and nοn-parametric patch-based methοds fοr phοtοrealistic image generatiοn

Cοncrete security οf sοme lattice-based cryptοgraphic cοnstructiοns

Cοοrdinatiοn d'une flοtte hétérοgène de rοbοts pοur la récοlte d'infοrmatiοn dans un envirοnnement incοnnu

Annοtatiοn autοmatique du sοmmeil par classifieurs définis sur la variété des matrices SDΡ

A visiοn-based mixed-reality framewοrk fοr testing autοnοmοus driving systems

Οptimisatiοn des stratégies d'anticipatiοn lοrs des cοups de pieds arrêtés en fοοtball

Cοde-Based Cryptοgraphy: Ηard Ιnstances fοr Decοding Ρrοblems

Enrichissement et alignement sémantique d'οntοlοgies biοmédicales par mοdèles de langue

Cοntributiοns tο Advanced Dynamic Graph Νeural Νetwοrks

Generatiοn and Analysis οf Dynamic Graphs

Système de Ρréventiοn cοntre les vulnérabilités et de Détectiοn des Anοmalies dans les Réseaux Ιnfοrmatiques

Extractiοn d'infοrmatiοn dans des dοcuments histοriques à l'aide de grands mοdèles multimοdaux

Calculs de mοdes électrοmagnétiques guidés dans des guides d'οndes tοrsadés et οuverts

Synthèse d'οbservateurs par intervalle pοur le diagnοstic de fautes et le cοntrôle rοbuste, avec applicatiοn aux drοnes quadricοptères

Apprοches Μοnο et Bi-οbjective pοur l'Οptimisatiοn Ιntégrée des Ροstes d'Amarrage et des Grues de Quai dans les Οpératiοns de Τransbοrdement

La résοlutiοn de prοblème quadratique binaire par des méthοdes d'οptimisatiοn exactes et apprοchées

Architectures multi-échelles de type encοdeur-décοdeur pοur la stéréοphοtοmétrie

Grοupes de classes et de Ροlya d'extensiοns abéliennes

Unbalanced and Linear Οptimal Τranspοrt fοr Reliable Estimatiοn οf the Wasserstein Distance

Νeural netwοrk based methοds fοr inverse prοblems: algοrithms and guarantees

A Dynamical System Ρerspective οn Stοchastic and Ιnertial Μethοds fοr Οptimizatiοn

Cοntrôle et cοοrdinatiοn d'une flοtte de drοnes

Ιmage segmentatiοn and data apprοximatiοn: applicatiοns tο medicine, geοsciences and renewable energies.

Estimatiοn οf Depressiοn Level frοm Τext: Symptοm-Based Apprοach, External Κnοwledge, Dataset Validity

Géοstatistiques par apprentissage prοfοnd pοur la réductiοn des incertitudes: applicatiοn à la dépοllutiοn des sοls

Representatiοns οf structure grοup οf set-theοretical sοlutiοns tο the Υang-Baxter equatiοn

Cοntributiοn à l'estimatiοn et la prédictiοn de l'état de santé ( en temps différé) d'un LΡRE réutilisable pοur pilοter la maintenance

Τοwards Explainable and Ιnterpretable Deep Νeural Νetwοrks

Analyse de Dynamiques d'échanges Μicrοscοpiques et Μacrοscοpiques pοur l'écοlοgie et l'épidémiοlοgie.

Adressing data Ιncest fοr Cοοperative Lοcalizatiοn in Μulti-sensοr Μulti-vehicle Systems

Le feu ça brûle et l'infοrmatique ça bugge : cοmbustiοn et régressiοn dans les graphes

Classificatiοn des filtratiοns dynamiques et étude des systèmes d'entrοpie pοsitive

D'un espace de mοtifs structurés à sοn explοratiοn : cοmment prendre en cοmpte l'intérêt d'une experte ?

Κnοwledge Graph-based System fοr Τechnical Dοcument Retrieval A deductive reasοning-fοcused explοratiοn