Publié le 12 mars 2018 Mis à jour le 27 mars 2018

Riwan Mouster (2017)

J’ai réalisé mon stage au sein de l’équipe de recherche en fertilité humaine, à l’hôpital Paule de Viguier du CHU de Purpan à Toulouse. L’hôpital Paule de Viguier a ouvert en mars 2003, il regroupe toutes les spécialités de gynécologie obstétrique, médecine de la reproduction, ménopause, maladies osseuses et métaboliques. L’objectif de mon stage était d’étudier l’évolution des paramètres spermatiques entre 1992 et 2011. Lors de mon stage, j’ai pu montrer une baisse significative des paramètres séculaires (concentration, mobilité, morphologie) chez les hommes fertiles entre 1992 et 2011. Néanmoins, la baisse de la mobilité et de la concentration semble moins importante après les années 2000. La morphologie est le paramètre spermatique qui baisse le plus, entre 1992 et 2011. On observe une baisse de 20 % des spermatozoïdes ayant une forme normale.
Ce stage a été enrichissant car il m’a permis de réaliser l’intégralité d’une étude statistique de phase de recherche bibliographique, à la phase de rédaction d’un rapport. Ce stage m’a permis de mettre en oeuvre, sous R, des nouvelles méthodes statistiques prenant en compte les spécificités de ces données réelles.
Cela m’a permis aussi d’appréhender le milieu professionnel. En effet, le travail en équipe, le respect des délais mais aussi la prise d’initiative seront des aspects importants pour mon futur métier.

Julien Gressier (2013)

J’ai effectué mon stage à Statistique Canada, l’institut statistique gouvernementale fédérale du Canada situé à Ottawa, au sein de la Division des méthodes d’enquêtes auprès des entreprises. Statistique Canada produit des statistiques qui aident les Canadiens à mieux comprendre leur pays, sa population, ses ressources, son économie, sa société et sa culture.
L’objectif de mon stage était de développer un modèle d’estimation pour la strate à tirage nul (strate qui n’est pas enquêtée) de l’Enquête financière trimestrielle(EFT). L’EFT permet d’évaluer la santé de l’économie du Canada, porte en général sur les principaux indices économiques relatifs aux entreprises (revenu annuel, taxes, montant des ventes, bénéfice, capital…). Pour réaliser ma mission j’ai utilisé le logiciel « SAS », ainsi que les méthodes statistiques de régression linéaire et d’auto-régression. Après les analyses j’ai pu établir un tableau qui regroupe les différents modèles par industries de la strate à tirage nul.
Ce stage m’a permis d’approfondir mes connaissances statistiques, particulièrement sur les processus autorégressifs. De plus j’ai découvert une nouvelle culture de travail et l’environnement d’un grand institut statistique. 

 Delphine Réau et Laure Leblanc (2013)

Nos stages se sont déroulés à l’Université de Montréal (Canada) au sein  du Département Informatique et de Recherche (DIRO). Depuis plusieurs années, Pierre L’Ecuyer (notre maître de stage) et son équipe se sont intéressés aux problématiques de fonctionnement des centres d’appels. Leur objectif est de réaliser pour leur client Hydro-Québec un logiciel permettant de simuler différents aspects des centres d’appels, tels que les temps de service des agents ou les processus d’arrivée. C’est dans le cadre de ce vaste projet que nos stages se sont inscrits.

Delphine : Mon stage a porté sur les processus d’arrivées, c’est-à-dire le nombre d’appels reçus par les centres d’appels. Pouvoir modéliser ces processus est crucial : si l’on peut prédire la quantité d’appels reçus à un moment de la journée, il est alors possible d’organiser les équipes de travail de façon à répondre au mieux à la demande des clients tout en limitant les coûts salariaux. J’ai travaillé en collaboration avec Boris Oreshkin, un post-doctorant qui a créé de nouveaux modèles pour les processus d’arrivée dans les centres d’appel. Je lui ai apporté mon aide dans l’évaluation de la qualité d’ajustement et de la capacité prédictive de ses modèles en comparaison avec ceux qui existaient déjà. Je me suis également focalisée sur les pics d’appels dans un centre d’appels d’urgence. J'ai utilisé les logiciels R et Matlab. Ce stage m’a permis de découvrir le monde de la recherche et de travailler sur une publication scientifique (Oreshkin, Regnard, L’Ecuyer. Rate-based daily arrival process models with application to call centers.). J’ai également pu améliorer mes compétences en statistiques, notamment au niveau de la modélisation.

Laure
 : Mon principal objectif a été de réaliser des statistiques descriptives sur les données du temps de service des agents des centres d’appels d’Hydro-Québec. J’ai également réalisé des estimations de modèles à grande échelle à partir du manuscrit « Modeling and Prediction of Service Times in Call Centers » de Rouba Ibrahim et al. Cela a permis d’affiner ses modèles et de les comparer entre eux, le but étant de trouver le modèle qui s'ajuste le mieux aux données.  Pour cela, j’ai utilisé les logiciels « R » et « SAS ». Les résultats obtenus ont permis de confirmer les modèles sélectionnés et servent de point de base pour de futures recherches. Ce stage a été pour moi très enrichissant. J’ai beaucoup appris tant sur le point de la modélisation statistique que sur les publications scientifiques.

Soraya Popic (2013)

Mon stage de M1 s’est déroulé à l’AUAT, l’Agence d’Urbanisme et d’Aménagement de Toulouse qui a pour mission d’accompagner le développement de l’aire urbaine de Toulouse en menant notamment des observatoires dans différents domaines : habitat, commerce, transports, économie & emploi, immobilier d’entreprise, environnement, etc. 
Ma mission principale a consisté à centraliser les données de l’AUAT sur le thème de l’environnement et d’en permettre l’accès sous forme de tableaux de bord (ensemble de graphiques ou tableaux statistiques dynamiques, se mettant automatiquement à jour via la base de données). J’ai utilisé la base de données PostGreSQL ainsi que le module CDE intégré à la suite Business Intelligence Pentaho pour créer les tableaux de bord. Dans un second temps, j’ai dû expertiser la librairie Leaflet, un outil codé en JavaScript qui permet de réaliser des cartes statistiques dynamiques, indispensables pour une agence d’urbanisme. J’ai également eu l’occasion lors de ce stage, de manipuler des données géographiques et de réaliser des traitements sur ces dernières notamment à l’aide d’outils de SIG (Système d’Information Géographique) tels que QGiss ou GrassGIS. Je me suis également familiarisée avec le monde de l’open data (ou données libres) puisque certaines de mes données en sont issues. 
Ce qui m’a particulièrement plû dans ce stage est le fait de réaliser un projet de A à Z, allant de la collecte des données à leur publication sous forme de tableaux de bord. 

 

Maïté Banks (2013)

 J'ai effectué mon stage au sein de la Direction Déléguée TER Midi-Pyrénées qui est issue de la branche SNCF Proximités. Durant 5 mois j'ai été accueillie dans le pôle marketing et commercial en charge, entre autre, des analyses des résultats du trafic et des recettes. Durant la période de mon stage, il m’a été confié deux missions. 
La première consistait à la reconstitution d’une donnée devenue inexploitable. Il s’agissait d’un rigoureux travail de recherche et d’analyse de données, afin d’exploiter l’existant dans le but de recréer l’information.
La seconde consistait à organiser et structurer les données existantes, afin de rendre leur exploitation plus facile et plus efficiente pour le pôle marketing. Pour répondre à ce besoin, il a fallu dans un premier temps réaliser un diagnostic de l’existant pour recenser les différentes données accessibles, puis mettre en place une solution décisionnelle permettant de retraiter automatiquement ces données pour les rendre directement lisibles en fonction des besoins récurrents en analyses.
J'ai donc eu l'occasion durant ce stage de mettre en avant les compétences d'analyses et de traitements de données acquises durant ma formation.

Thomas Palmer (2013)

 J'ai effectué mon stage de Master 1 au sein du Laboratoire IRIT (Institut de Recherche en Informatique de Toulouse). Le thème général du stage a concerné l'analyse statistique de requêtes biomédicales dans le domaine de la recherche d'informations. Ce stage s'est articulé autour de deux questions de recherche. La première s'interrogeait sur les facteurs pouvant caractériser les requêtes biomédicales, alors que la deuxième cherchait à déterminer les facteurs de réussite ou au contraire d'échec de ces requêtes.
Pour y parvenir, nous avons découpé ce travail en trois parties. Tout d'abord il a fallu programmer, en langage Java, les différentes variables utiles pour la suite. Après cela, les analyses ont pu débuter par l'étude des facteurs, ou plutôt les facettes de ces facteurs, caractérisant les requêtes. Ensuite la seconde question de recherche est abordée, sur l'impact que peuvent avoir ces facteurs sur la difficulté des requêtes biomédicales. Ces analyses comprennent toutes deux des études descriptives, de corrélations, de normalité et des analyses de variance. La dernière sera complétée par l'ajout de nouvelles données concernant les performances des résultats, puis par la création de modèles de prédiction de la difficulté des requêtes , au moyen de régressions logistiques et linéaires. Pour finir, nous avons mi en place la validation de ces modèles par diverses techniques comme la cross-validation ou le bootstrap.
Ce stage a su mettre en valeur tous les apsects de ma formation SID, de la programmation aux statistiques en passant par la recherche d'information. De plus, j'ai pu non seulement réutiliser mes connaissances mais les compléter ou les approfondir, notamment en statistique et validation de modèles de prédiction.