Outil Analyse de survie

L’outil Analyse de survie met en œuvre les méthodes courantes d’analyse de survie. Les modèles de survie modélisent le temps jusqu’à l’occurrence d’un événement (p. ex. expiration d’une police d’assurance vie). Les modèles de survie sont uniques dans la mesure où ils intègrent une censure ; un test ou un essai peut s’achever avant l’occurrence d’un événement donné (p. ex. le titulaire d’une police d’assurance peut décéder avant l’expiration de la police d’assurance).

Outil Gallery

Cet outil n'est pas installé automatiquement avec Alteryx Designer ou les outils R. Pour utiliser cet outil, téléchargez-le à partir de la Gallery Alteryx Analytics.

Cet outil peut être utilisé à deux fins (déterminées par les paramètres de configuration) :

  1. Obtenir des informations sur la « fonction de survie » d’un jeu de données (c.-à-d. pour estimer la distribution des temps de survie au sein d’une population) ;
  2. Déterminer si des facteurs particuliers ont une influence sur la fonction de survie d’une population (p. ex. pour comparer les fonctions de survie entre des groupes).

Configurer l’outil

Utilisez l' onglet Paramètres requis pour définir les contrôles pour la génération du modèle.

  • Nomdu modèle: chaque modèle doit être donné un nom afin qu'il puisse être identifié ultérieurement. Les noms de modèles doivent commencer par une lettre et peuvent contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »). Aucun autre caractère spécial n’est autorisé et R est sensible à la casse.

  • Type d'entrée: sélectionnez l'un des éléments suivants (selon les données du flux de données).
    • Les données contiennent des durées: les données incluent un champ représentant des durées.
      • Sélectionner la variablede durée: sélectionnez le champ représentant les durées.
    • Les données contiennent des heures de début et d'arrêt: les données comprennent un champ représentant les heures de début et un champ représentant les heures d'arrêt.
      • Sélectionnez l'heure de début/la variable de censure gauche: sélectionnez le champ représentant les heures de début.
      • Sélectionner l'heure de fin/la variable de censure droite: sélectionnez le champ représentant les heures de fin.
  • Censure :
    • Les données sont censurées à gauche: les données comprennent un champ représentant 0/1 censure du début de la vie de l'enregistrement.
      • Sélectionnez gauche-censure variable: sélectionnez une variable 0/1, où 0 représente la censure, et 1 indique que la vie d'un enregistrement a commencé à l'heure de début ou à 0 (si "Data contient des durées" a été spécifié précédemment).
    • Les données sont censurées à droite: les données incluent un champ représentant 0/1 troncature de la fin de la vie de l'enregistrement.
      • Sélectionnez la variable de droite-censure: sélectionnez une variable 0/1, où 0 représente la censure et 1 indique que la durée de vie d'un enregistrement s'est terminée à l'heure de fin ou à la durée (si «les données contiennent des durées» a été spécifié précédemment).

Utilisez l' onglet options d'analyse pour mieux définir la façon dont l'analyse est calculée.

  • Estimation de Kaplan-Meier: cette option trouvera la courbe de survie d'un DataSet avec une option à regrouper par une variable.

    • Choisissez champ à regrouper par: cette option permet de comparer les courbes de survie de différents groupes.
      • Sélectionnerla variable de regroupement: sélectionnez le champ correspondant à la variable de regroupement.
    • Utiliser l'intervallede confiance: cette option affichera les limites supérieure et inférieure pour le traçage de l'estimation de km ainsi que dans son tableau.
      • Niveau de confiance d'entrée: entrez le niveau de confiance pour calculer les limites supérieures et inférieures pour l'estimation de km.
  • Risques proportionnels de Cox: utiliser pour voir l'impact et l'importance des covariables affectant la courbe de survie.
    • Sélectionner les variables prédictives: au moins un doit être sélectionné.
    • Méthode de manipulation dela cravate: méthode permettant de traiter les temps liés. * *
    • Inclure les poids de cas: cette option permet de sélectionner un champ contenant des poids pour chaque enregistrement.
      • Sélectionner un champ indiquantles poids: sélectionnez le champ contenant les pondérations de cas.

Utilisez l' onglet options graphiques pour définir les commandes de la sortie graphique.

  • Tailledu tracé: sélectionnez pouces ou centimètres pour la taille du graphique.
  • Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 ppp) ; 2x (192 PPP) ; ou 3x (288 PPP). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.

Afficher la sortie

Connectez un outil Explorateur à chaque ancrage de sortie pour afficher les résultats.

O ancre: se compose d'une table du modèle sérialisé avec le nom du modèle et la taille de l'objet. La disponibilité de différents modèles dépend de la sélection de l’option « Type d’analyse » sous « Options d’analyse ».

  • Analyse récapitulative - Objet Surv, objet Estimation de Kaplan-Meier
  • Analyse de regroupement - Objet Surv, objet Estimation de Kaplan-Meier, objet Risques proportionnels de Cox
  • Analyse factorielle - Objet Surv, objet Risques proportionnels de Cox

Le modèle Risques proportionnels de Cox est directement accessible à partir du deuxième élément de la sortie de la sortie O. Si ce modèle est 'model', les objets Surv et KMest sont accessibles à 'model$surv' et 'model$KMest', respectivement.

R ancre: se compose des extraits de rapport générés par l'outil d'analyse de survie, en fonction du choix de "type d'analyse" sous "options d'analyse".

  • Analyse récapitulative - Statistiques récapitulatives et graphique de la fonction de survie.
  • Analyse de regroupement - Statistiques récapitulatives ; résultats observés vs résultats attendus pour chaque groupe ; résultats des tests de comparaison de groupes pour déterminer la similarité des groupes pour les tests Logrank, Rapport de vraisemblance et Wald ; graphique comparant les courbes de survie de différents groupes ; et courbes de survie distinctes et courbes de risques cumulatifs pour chaque groupe.
  • Analyse factorielle - Statistiques récapitulatives ; résultats des tests d’analyse factorielle des variables prédictives pour les tests Logrank, Rapport de vraisemblance et Wald ; et récapitulatif du modèles Risques proportionnels de Cox détaillant l’impact des prédicteurs.

D ancre: pour l'analyse sommaire et l'analyse de regroupement (auquel cas un champ supplémentaire est ajouté en spécifiant le groupe), cela construit l'estimation de Kaplan-Meier pour les courbes de survie. Pour l’analyse factorielle, cette option n’est pas fournie.

*https://en.wikipedia.org/wiki/Survival_analysis

* *https://stat.ethz.ch/R-Manual/R-devel/Library/Survival/html/coxph.html