Méthode de vecteur support pour l’analyse de survie comparaison entre classement et régression approchée

Méthode de vecteur support pour l’analyse de survie comparaison entre classement et
régression approchée

Modèle tm 

Les tms (mesurent la capacité discriminante) consistent en une séquence :  D’assemblage d’un index pronostique basé sur les Covariables, et  D’associer ce pronostique à index aux temps d’événement observés. En général, on ne cherche qu’à trouver une représentation explicite de la 1ére étape. Le modèle cox standard par exemple évite cette seconde étape en supposant que le risque (le risque instantanée) d’observer l’évènement sachant qu’il ne s’est produit au paravent. D’autres modèles supposent une forme fixe pour la fonction de transformation h ; le modèle de temps de défaillance accéléré est un exemple qui suppose que la fonction de transformation h(y), avec y le résultat à l’étude, équivaut à la fonction logarithmique et à la probabilité proportionnelle au modèle prend h(y)= logy

L’approche que nous adoptons dans les modèles de survie basés sur le vecteur de support machine (svm) diffère des approches adoptées dans les modèles statistiques. Bien qu’il puisse bien être classé en tant que tm, les modèles basés sur svm n’assument pas les fonctions sous adjacentes pour lesquelles les paramètres doivent être estimés. Le risque empirique est classé sur deux cas de façon erronée en ce qui concerne leur temps d’échec, est minimisé. Le problème de la survie a donc été reformulé en un problème de classement. Pour réduire la charge de calcul, un système simplifié de la version comparant chaque observation uniquement avec son plus proche voisin au lieu de toutes les autres observations a été proposée en (10). Un cadre plus théorique était fourni dans (8). Nous ferons référence au modèle de survie proposé dans ce travail comme modèle 1.  

Modèles de transformations

Les tms d’écrivent le type de modèle dans lesquelles une transformation de la variable de résultat (au lieu de la variable de résultats elle-même) est estimée en fonction de la Covariante. Initialement, les variables ont été introduites dans les problèmes de régression où l’hypothèse de la normalité sur la distribution des erreurs et la variance constante n’étaient pas satisfaites.

Un modèle de régression standard, par exemple qui tente de modéliser le résultat est une combinaison linéaire des Covariante : (1) Où est un vecteur de coefficient et est la variable d’erreur. Dans le cas où est normalement pas distribuée, la régression peut être améliorée en transformant la variable dépendante. L’idée générale des modèles de transformation peut être résumée comme suit : Méthode de vecteur support pour l’analyse de survie : comparaison entre classement et régression approchée Louis Mamadou Soropogui /201205FTB/option : STAT/DMA/FST/UCAD 2019 10 Considérons un modèle ( ) , (2) où représente les paramètres de régression et représente la variable avec la densité ( ). Notons bien : Un tm spécifie qu’une fonction monotone de la réponse variable est liée linéairement à la regression de variable.

Les modèles de survie basés sur le noyau

Cette section commence par une discussion brève des modèles de survie existants basées sur la svms. Dans une deuxième sous-section, deux nouvelles méthodes sont proposées. De plus le résultat de ce type de modèle de survie ne peut généralement pas être interprété comme un échec temps ; nous désignerons le résultat du modèle par l’indice de pronostic ( ) aulieu de la prédiction du modèle. Pour le modèle cox, cela correspond à ( ) . a) Modèles de survies existants basés sur svm Les excellentes performances des machines à vecteurs de support pour la classification et la régression ont conduit à se demander si ce type de modèle pouvait être étendu à un autre problème statistique.

Lors de l’analyse des données de survie, on s’intéresse au temps entre un certain point de départ et la survenu d’un évènement prédéfini. Une première approche à laquelle on pourrait penser est d’utilisé des modèles de régression pour modéliser le temps de récurrence. Cependant, les données de survie contiennent généralement des points de données avec des informations incomplètes (information appelées données censurées).

Bien qu’il existe différents type de censures ; nous limiterons notre attention à la censure de droite dans ce travail. Les véritables informations censurées sont les informations pour lesquelles l’heure exacte de l’évènement n’est pas connue, mais, où une limite inférieure de ce type est connue. Seulement l’incorporation des informations pour lesquelles le temps exact d’échec connu conduirait à une sous-estimation du temps de survie. 

Formation et coursTélécharger le document complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *