Contribuer au développement et à l’amélioration d’un prototype existant pour la détection d’anomalies dans les marchés publics;
Développer des algorithmes spécifiques de Machine Learning pour identifier les anomalies liées aux prix dans les données d’attribution des marchés publics ;
Continuer l'intégrer des techniques de traitement du langage naturel (NLP, LLMs : llama3:70b, gemma2:27b, gemma2:latest, mistral-large:123b-instruct-2407-q2_K) pour extraire et analyser des informations textuelles pertinentes à partir de documents liés aux marchés publics ;
Déployer les modèles et visualisations sur Streamlit puis créer et configurer un Dockerfile pour assurer la containérisation ;
Documenter le processus de développement, les résultats, et proposer des améliorations.
Développement d'outils de diffusion des données et d'aides à la décision par datavisualisation, de publications reproductibles avec R, Python et Apache Superset ;
Traitement des données avec des requêtes SQL depuis PostgreSQL ;
Création de tableaux de bord et d'interfaces web avec Flask (Python), CSS, Javascript et HTML5 pour le transfert de fichiers (.csv, .xls, .xlsx et .ods) vers une base de données PostgreSQL sous forme de table, et pour l'auto-complétion des tables ;
Gestion des dépendances de packages et déploiement de projet.
Gestion, modélisation économétrique des données et création de visualisations interactives via ggplot2 et Plotly ;
Développement de 5 applications Web et dashboards en R Shiny pour la recherche pharmaceutique.
Majeur de Promotion Licence 3 et Magistère 1
Python, R, SQL, Spark, PHP, JAVASCRIPT, HTML, CSS, et DAX.
MySQL, PostgreSQL, SQLite, NoSQL, et Microsoft SQL Server.
VS Code, R Studio, SAS, Power BI, Tableau, Stata, Eviews, GIT et Pack Office.
Docker, Hugging Face, Anaconda, IBM Watson Studio, Dataiku DSS, Kaggle, WampServer, Xampp, et Apache Superset.
Langue Maternelle
Intermédiaire