8.7 Requêtes pour le projet "jumeaux"

Chez Analytikerna and Lentus (NDT : société de l'auteur), nous avons pris en charge l'étude du système et l'architecture des données pour un grand projet de recherche. Ce projet est une collaboration entre l' Institut de médecine environnementale à Karolinska Institutet, Stockholm et la Section Recherche Clinique sur l'age et la psychologie, de l'université de Californie du Sud.

Ce projet avait une grosse partie d'enquête, où tous les jumeaux suédois de plus de 65 ans étaient interviewés par téléphone. Les jumeaux qui remplissaient certains critères étaient admis dans la phase suivante de l'enquête. Dans cette deuxième phase, les jumeaux qui souhaitaient participer, recevaient la visite d'un docteur et d'une infirmière. Une partie des questionnaires étaient des examens physiques et neuropsychologiques, des tests de laboratoire, des scanners du cerveau, des analyses psychologique, et des études généalogiques. De plus, des informations étaient rassemblées sur les risques médicaux et environnementaux.

Pour plus d'information a propos de ce projet, suivez le lien suivant (en anglais) :

http://www.imm.ki.se/TWIN/TWINUKW.HTM

La deuxième partie du projet est accessible par une interface web, écrite en Perl et MySQL.

Chaque nuit, les informations des réunions étaient inséréees dans les base MySQL.

8.7.1 Trouver tous les jumeaux non distribués

8.7.1 Trouver tous les jumeaux non distribués

Les requêtes suivantes sont utilisées pour sélectionner les couples de jumeaux qui accèderont à la deuxième phase :

select
        concat(p1.id, p1.tvab) + 0 as tvid,
        concat(p1.christian_nom, " ", p1.surnom) as Nom,
        p1.postal_code as Code,
        p1.city as City,
        pg.abrev as Area,
        if(td.participation = "Aborted", "A", " ") as A,
        p1.dead as dead1,
        l.event as event1,
        td.suspect as tsuspect1,
        id.suspect as isuspect1,
        td.severe as tsevere1,
        id.severe as isevere1,
        p2.dead as dead2,
        l2.event as event2,
        h2.nurse as nurse2,
        h2.doctor as doctor2,
        td2.suspect as tsuspect2,
        id2.suspect as isuspect2,
        td2.severe as tsevere2,
        id2.severe as isevere2,
        l.finish_date
from
        twin_project as tp
        /* For Twin 1 */
        left join twin_data as td on tp.id = td.id and tp.tvab = td.tvab
        left join informant_data as id on tp.id = id.id and tp.tvab = id.tvab
        left join harmony as h on tp.id = h.id and tp.tvab = h.tvab
        left join lentus as l on tp.id = l.id and tp.tvab = l.tvab
       /* For Twin 2 */
        left join twin_data as td2 on p2.id = td2.id and p2.tvab = td2.tvab
        left join informant_data as id2 on p2.id = id2.id and p2.tvab = id2.tvab
        left join harmony as h2 on p2.id = h2.id and p2.tvab = h2.tvab
        left join lentus as l2 on p2.id = l2.id and p2.tvab = l2.tvab,
        person_data as p1,
        person_data as p2,
        postal_groups as pg
where
        /* p1 gets main twin and p2 gets his/her twin. */
        /* ptvab is a field inverted from tvab */
        p1.id = tp.id and p1.tvab = tp.tvab and
        p2.id = p1.id and p2.ptvab = p1.tvab and
        /* Just the sceening survey */
        tp.survey_no = 5 and
        /* Skip if partner died before 65 but allow emigration (dead=9) */
        (p2.dead = 0 or p2.dead = 9 or
         (p2.dead = 1 and
          (p2.mort_date = 0 or
           (((to_days(p2.mort_date) - to_days(p2.naissanceday)) / 365)
            >= 65))))
        and
        (
        /* Twin is suspect */
        (td.future_contact = 'Yes' and td.suspect = 2) or
        /* Twin is suspect - Informant is Blessed */
        (td.future_contact = 'Yes' and td.suspect = 1 and id.suspect = 1) or
        /* No twin - Informant is Blessed */
        (ISNULL(td.suspect) and id.suspect = 1 and id.future_contact = 'Yes') or
        /* Twin broken off - Informant is Blessed */
        (td.participation = 'Aborted'
         and id.suspect = 1 and id.future_contact = 'Yes') or
        /* Twin broken off - No inform - Have partner */
        (td.participation = 'Aborted' and ISNULL(id.suspect) and p2.dead = 0))
        and
        l.event = 'Finished'
        /* Get at area code */
        and substring(p1.postal_code, 1, 2) = pg.code
        /* Not already distributed */
        and (h.nurse is NULL or h.nurse=00 or h.doctor=00)
        /* Has not refused or been aborted */
        and not (h.status = 'Refused' or h.status = 'Aborted'
        or h.status = 'Died' or h.status = 'Other')
order by
        tvid;

Quelques explications s'imposent :

  • concat(p1.id, p1.tvab) + 0 as tvid

    On veut trier les valeurs avec la concaténation de id et tvab dans un ordre numérique. Ajouter 0 au nombre force MySQL à traiter le résultat comme un nombre

    column id

    Ceci identifiera un couple de jumeaux. C'est une clé commune à toutes les tables.

    column tvab

    Cette colonne identifie un des jumeaux dans un couple. Il prend la valeur de 1 ou 2.

    column ptvab

    C'est le complémentaire de la colonne précédente. Quand tvab vaut 1 celle-ci vaut 2, et vice versa. Elle sert à éviter des saisie, et permet à MySQL d'optimiser la requête.

    Cette requête démontre, entre autres choses, comment faire des recherches dans une table à partir de la même table, grce à un regroupement ( (p1 et p2). Dans l'exemple ci-dessus, on s'en sert pour vérifier si le deuxième jumeau n'est pas mort avant l'age de 65 ans. Dans ce cas, la ligne n'est pas renvoyée.

    Toutes les informations ci-dessus existent dans les tables sur les jumeaux. Il y a toujours une clé sur id,tvab (toutes tables) et id,ptvab (person_data) pour rendre les requêtes plus rapides.

    Sur notre serveur de production (une station Sun UltraSPARC 200MHz), cettre requête retourne entre 150 et 200 lignes, et prend moins d'une seconde.

    Le nombre courant de ligne dans les tables sont les suivants :

    8.7.2 Afficher une table par pair de jumeau

    Chaque interview est conclu par un status appelé event. La requête ci-dessous est utilisée pour créer une table avec toutes les paires de jumeaux. Elle indique aussi le nombre de couples qui ont terminé les entretiens, les couples où un seul jumeau a été interrogé, les couples qui ont refusé, etc…

    select
            t1.event,
            t2.event,
            count(*)
    from
            lentus as t1,
            lentus as t2,
            twin_project as tp
    where
            /* We are looking at one pair at a time */
            t1.id = tp.id
            and t1.tvab=tp.tvab
            and t1.id = t2.id
            /* Just the sceening survey */
            and tp.survey_no = 5
            /* This makes each pair only appear once */
            and t1.tvab='1' and t2.tvab='2'
    group by
            t1.event, t2.event;