Skip to main content

Survival Analysis Tool Icon Outil Analyse de survie

L’outil Analyse de survie met en œuvre les méthodes courantes d’analyse de survie. Les modèles de survie modélisent le temps jusqu’à l’occurrence d’un événement (p. ex. expiration d’une police d’assurance vie). Les modèles de survie sont uniques dans la mesure où ils intègrent une censure ; un test ou un essai peut s’achever avant l’occurrence d’un événement donné (p. ex. le titulaire d’une police d’assurance peut décéder avant l’expiration de la police d’assurance).

Important

Cet outil n'est pas automatiquement installé avec Alteryx Designer ou les outils R. Pour l’utiliser, téléchargez-le depuis Alteryx Analytics Gallery.

Cet outil peut être utilisé à deux fins (déterminées par les paramètres de configuration) :

  1. Obtenir des informations sur la « fonction de survie » d’un jeu de données (c.-à-d. pour estimer la distribution des temps de survie au sein d’une population) ;

  2. Déterminer si des facteurs particuliers ont une influence sur la fonction de survie d’une population (p. ex. pour comparer les fonctions de survie entre des groupes).

Configuration de l'outil

Dans l'onglet Options des graphiques, définissez les contrôles du tracé de sortie.

  • Nom de modèle : vous devez attribuer un nom à chaque modèle afin de pouvoir les identifier ultérieurement. Les noms de modèles doivent commencer par une lettre et peuvent contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point ( . ) et trait de soulignement ( _ ). Aucun autre caractère spécial n'est autorisé et R est sensible à la casse.

  • Sélectionnez une des valeurs suivantes (selon le contenu du flux de données).

    • Les données contiennent des durées : les données comprennent un champ représentant les durées.

      • Sélectionner une variable de durée : sélectionnez le champ représentant les durées.

    • Les données contiennent les heures de début et de fin : les données comprennent un champ représentant les heures de début et un champ représentant les heures de fin.

      • Sélectionner l'heure de début / variable censeur gauche : sélectionnez le champ représentant les heures de début.

      • Sélectionner l'heure de fin / variable de censure droite : sélectionnez le champ représentant les heures de fin.

  • Censure :

    • Les données comprennent un champ représentant une censure 0/1 du début de la vie de l’enregistrement.

      • Sélectionnez une variable 0/1, 0 représentant la censure et 1 indiquant que la vie d’un enregistrement a commencé à l’heure de début ou à 0 (si l’option « Les données contiennent des durées » a été sélectionnée précédemment).

    • Les données comprennent un champ représentant une chaîne tronquée 0/1 de la fin de la vie de l’enregistrement.

      • Sélectionnez une variable 0/1, 0 représentant la censure et 1 indiquant que la vie d’un enregistrement s’est achevée à l’heure de fin ou à l’expiration de la durée (si l’option « Les données contiennent des durées » a été sélectionnée précédemment).

Utilisez l' onglet Options d'analyse pour mieux définir le mode de calcul de l'analyse.

  • Cette option recherchera la courbe de survie d’un jeu de données avec la possibilité de regrouper les données selon une variable.

    • Cette option permet de comparer les courbes de survie de différents groupes.

      • Sélectionnez le champ correspondant à la variable de regroupement.

    • Cette option affiche les limites supérieure et inférieure pour le tracé de l’estimation de KM, ainsi que dans la table correspondante.

      • Entrez le niveau de confiance auquel calculer les limites supérieure et inférieure pour l’estimation de KM.

    • Cette option permet de déterminer l’impact et l’importance des covariables qui affectent la courbe de survie.

      • Sélectionner des variables prédictives : au moins une doit être sélectionnée.

      • Méthode pour la gestion des cravates : la méthode par laquelle traiter les temps liés.**

      • Cette option permet de sélectionner un champ contenant des pondérations pour chaque enregistrement.

        • Sélectionner un champ spécification des poids : sélectionnez le champ contenant les poids des caisses.

Dans l'onglet « Options des graphiques », définissez les contrôles de la sortie graphique (facultatif).

  • Taille du tracé : sélectionnez « pouces » ou « centimètres » pour indiquer la taille du graphique.

  • Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi) ; 2x (192 dpi) ; ou 3x (288 dpi). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.

Visualisation de la sortie

Connectez un outil Explorateur à chaque ancrage de sortie pour afficher les résultats.

Sortie O : constituée d’une table du modèle sérialisé avec le nom du modèle et la taille de l’objet. La disponibilité de différents modèles dépend de la sélection de l’option « Type d’analyse » sous « Options d’analyse ».

  • Analyse récapitulative - Objet Surv, objet Estimation de Kaplan-Meier

  • Analyse de regroupement - Objet Surv, objet Estimation de Kaplan-Meier, objet Risques proportionnels de Cox

  • Analyse factorielle - Objet Surv, objet Risques proportionnels de Cox

Le modèle Risques proportionnels de Cox est directement accessible à partir du deuxième élément de la sortie de la sortie O. Si ce modèle est 'model', les objets Surv et KMest sont accessibles à 'model$surv' et 'model$KMest', respectivement.

Snippets de rapport générés par l’outil Analyse de survie, selon la sélection de l’option « Type d’analyse » sous « Options d’analyse ».

  • Analyse récapitulative - Statistiques récapitulatives et graphique de la fonction de survie.

  • Analyse de regroupement - Statistiques récapitulatives ; résultats observés vs résultats attendus pour chaque groupe ; résultats des tests de comparaison de groupes pour déterminer la similarité des groupes pour les tests Logrank, Rapport de vraisemblance et Wald ; graphique comparant les courbes de survie de différents groupes ; et courbes de survie distinctes et courbes de risques cumulatifs pour chaque groupe.

  • Analyse factorielle - Statistiques récapitulatives ; résultats des tests d’analyse factorielle des variables prédictives pour les tests Logrank, Rapport de vraisemblance et Wald ; et récapitulatif du modèles Risques proportionnels de Cox détaillant l’impact des prédicteurs.

Pour l’analyse récapitulative et l’analyse de regroupement (dans laquelle un champ supplémentaire est ajouté pour spécifier le groupe), cette option construit l’estimation de Kaplan-Meier pour les courbes de survie. Pour l’analyse factorielle, cette option n’est pas fournie.

**https://stat.ethz.ch/R-manual/R-devel/library/survival/html/coxph.html