Collecte de données

Différentes sources de données

Méthode

L'une des premières étapes de toute recherche statistique correspond à trouver des bases de données qui existent déjà. Par conséquent, dans une entreprise, il peut déjà y avoir une base de données d'employés, mais il existe également une base de données de clients sur les produits.

Nous ne devons pas non plus ignorer l'existence de bases de données statistiques publiques, qui peuvent fournir des informations intéressantes au niveau national ou international. Par ailleurs, si vous ne pouvez pas utiliser les données existantes pour la recherche, vous devez collecter les données vous-même.

Figure 6 - le cycle de vie de la donnée

Définition

Les données d'entreprise

Les entreprises ont généralement beaucoup de données sur leurs clients, produits, employés, etc. Ces données se stockent dans un Système d'Information (SI). Bien qu'il existe de nombreuses règles (anonymat, confidentialité, etc.) à respecter pour avoir accès à ces données, il est très intéressant de les étudier.

Comment l'utiliser ?

Le Système d'Information des Employés (SIE) contient des informations sur tous les employés de l'entreprise.

Premièrement, pour des raisons juridiques (telles que les rapports sociaux), ils peuvent être encouragés à créer et à maintenir ces bases de données.

Deuxièmement, à mesure que la quantité de données augmente, la numérisation de l'entreprise a exacerbé cette tendance.

Méthode

  1. Définissez le thème et la population à étudier.

  2. Essayez de déterminer s'il existe au sein de l'entreprise une base de données permettant de résoudre ce sujet : systèmes d'information, enquêtes menées, réseaux sociaux internes.

  3. Respecter les règles de sécurité et les accords relatifs à l'utilisation de ces données.

Les données externes

Un accès gratuit à la base de données s'ajoute aux données d'entreprise et des enquêtes par questionnaire. Les données d'enquête peuvent être obtenues auprès de l'INSEE, World Value Survey, World Management Survey, Statista, etc.

Elles contribuent à l'étude des sujets au niveau national ou international, à obtenir des résultats de manière générale, qui peuvent être comparés aux résultats de l’entreprise mais aussi à clarifier certains aspects de l'organisation.

Source : https://experts.mc2i.fr/

Figure 7 - les ressources externes

Si les données ne sont pas accessibles depuis l'intérieur de l'organisation et qu'il n'est pas possible de gérer des questionnaires, ou si le but de l'analyse est de fournir des résultats généraux au-delà du périmètre de l'organisation, les données provenant de sources externes seront particulièrement utiles. La diffusion des données d'enquêtes devient de plus en plus courante et se développera certainement dans le mouvement des « données ouvertes ». Ces données peuvent être très bonnes en termes de qualité.

Ils peuvent donner accès à des informations interdépartementales ou internationales. Les données du questionnaire sont fournies avec le questionnaire et la méthode d'enquête. Ces deux dernier point sont très importants car ils permettent d'évaluer la rigueur de de l'enquête et le potentiel de généralisation des résultats.

Remarque

L'inconvénient de ce type de données est que l'analyste ne peut pas choisir la question à poser, la population à enquêter, etc.

Exemple

  1. Essayez de trouver des sources de données externes différentes (périmètre, sujets d'enquête, etc.) qui sont les plus proches de vos objectifs.

    Par exemple, si votre enquête concerne le travail et la gestion, une enquête WMS peut être la plus adéquate, surtout si vous comptez effectuer des comparaisons internationales. Dans le cas échéant, la base de données Statista peut être la base de données la plus convenable pour votre étude.

  2. Gagnez l'accès aux données selon les règles et les protocoles mis en place. De nos jours, certaines organisations d'études statistiques publics ont instauré des protocoles d'accès restrictifs et coûteux (par exemple, via un serveur sécurisé avec fonction de reconnaissance d'empreintes digitales), ce qui est essentiel pour assurer la sécurité des données

  3. Trouvez facilement les données de recherche qui vous intéressent dans plusieurs bases de données différentes. Si un individu dispose d'un identifiant personnel (adresse e-mail, numéro de téléphone, numéro d'employé, numéro de produit, etc.) partagé par les 2 bases de données, les différentes bases de données peuvent être mises en correspondance.

Cette opération doit être réalisée dans le cadre du respect des règles de confidentialité des données.

Figure 8 - la combinaison des ressources externes

Remarque

Il n'est pas recommandé de « copier et coller » les 2 bases de données et de les placer l'une à côté de l'autre. D'ailleurs, les personnes peuvent être classées dans un ordre aléatoire, ou simplement changer la disposition entre les 2 bases de données, ce qui peut entraîner des erreurs.

Par conséquent, il est impératif d'appairer les bases de données, ce qui y garantira la correspondance des identifiants. De toute façon, l'individu doit être identifié au moyen de variables publiques.