Régression (LAD); différentes approches: iteratively re-weighted least squares. basic iterative . weselowsky’s direct descent method

COEFFICIENT DE PARTAGE (OCTANOL/EAU) LOGP

Le coefficient de partage appelé aussi Log Kow, est une mesure de la solubilité différentielle de composés chimiques dans deux solvants (coefficient de partage Octanol/Eau), logP est égal au logarithme du rapport des concentrations de la substance étudiée dans l’octanol et dans l’eau, logP Log(Coct /Ceau), Cette valeur permet d’appréhender le caractère hydrophile ou hydrophobe (lipophile) d’une molécule. En effet, si logP est positif et très élevé,cela exprime le fait que la molécule considérée est bien plus soluble dans l’octanol que dans l’eau,ce qui reflète son caractère lipophile,et inversement. Une valeur de logP=0 signifie que la molécule se répartit de manière égale entre les deux phases et Coct =Ceau.

ALCOOLS 

En chimie organique, un alcool est un composé organique dont l’un des carbones (celui-ci étant tétragonal) est lié à un groupement hydroxyle (-OH). L’éthanol (ou alcool éthylique) entrant dans la composition des boissons alcoolisées est un cas particulier d’alcool, mais tous les alcools ne sont pas propres à la consommation. En particulier, le méthanol est toxique et mortel à haute dose. Nous distinguons trois types, l’alcool primaire, secondaire ou tertiaire selon que l’on a un, deux ou trois hydrogènes substitués.
L’éthanol est une substance psychotrope toxique voire mortelle en grande quantité, même en quantité modérée en cas de consommation régulière, les autres alcools sont généralement beaucoup plus toxiques.

HISTORIQUE DE L’ESTIMATION LAD 

Parmi les estimateurs robustes, les estimateurs LAD ont probablement l’histoire la plus ancienne. En effet, Ronchetti (1987) mentionne qu’on en retrouve des traces dans l’oeuvre de Galilée (1632), intitulée « Dialogo dei massimi sistemi », Le problème était alors de déterminer la distance de la terre à une étoile récemment découverte à cette époque. C’est cependant à Boscovich (1757) que l’on reconnaît généralement l’introduction du critère d’estimation LAD (Harter,1974 ; Ronchetti, 1987, Dielman,1992). L’un des problèmes qui excita le plus, la curiosité des hommes de science du XVIIIème siècle fut celui de la détermination de l’ellipticité de la terre. C’est dans ce contexte, près d’un demi-siècle avant l’annonce par (Legendre,1805) du principe des moindres carrés et vingt ans avant la naissance de Gauss en 1777, que Roger Joseph Boscovich (1757) proposa une procédure pour déterminer les paramètres du modèle de régression linéaire simple.

DECOUVERTE DE L’ESTIMATION LS 

La découverte de l’estimation LS (méthode des moindres carrés) mérite d’être rappelée ici puisqu’elle fut à l’origine de l’une des plus grandes disputes dans l’histoire de la statistique. Adrien Marie Legendre (1805) publia le premier la méthode des moindres carrés. Il donna une explication claire de la méthode en donnant les équations normales et en fournissant un exemple numérique. Selon Stigler (1981), Robert Adrain, un américain, publia la méthode vers la fin de l’année 1808 ou au début de l’année 1809. Selon Stigler (1977, 1978), il se pourrait que Robert Adrain ait « découvert » cette méthode dans l’ouvrage de Legendre (1805). Cependant, quatre ans après la publication de Legendre, Gauss (1809) a le courage de réclamer la paternité de la méthode des moindres carrés, en prétendant l’avoir utilisée depuis 1795. La revendication de Gauss déclencha l’une des plus grandes disputes scientifiques dont les détails sont présentés et résumés dans un article de Plackett (1972). Bien que le doute subsiste, plusieurs faits troublants semblent indiquer que Gauss a effectivement utilisé la méthode des moindres carrés avant 1805. En particulier, Gauss prétend qu’il a parlé de cette méthode à certains astronomes (Olbers, Lindenau et von Zach) avant 1805. De plus, dans une lettre de Gauss datant de 1799, il est fait mention de « ma méthode », sans qu’un nom y soit donné. Il semble difficile de ne pas le croire, vu l’extraordinaire compétence reconnue à Gauss comme mathématicien.
Il reste cependant une question très importante : quelle importance attachait Gauss à cette découverte ? La réponse pourrait être que Gauss, bien que jugeant cette méthode utile, n’a pas réussi à communiquer son importance à ses contemporains avant 1809. En effet, dans sa publication de 1809, Gauss est allé bien plus loin que Legendre dans ses développements autant conceptuels que techniques. C’est dans cet article qu’il lie la méthode des moindres carrés à la loi normale (Gaussienne) des erreurs. Il propose également un algorithme pour le calcul des estimateurs. Son travail a d’ailleurs été discuté par plusieurs auteurs comme Seal (1967), Eisenhart (1968), Goldstine (1977), Sprott (1978) et Sheynin (1979).
Gauss a certainement été le plus grand mathématicien de cette époque, mais c’est Legendre qui a cristallisé l’idée de la méthode des moindres carrés sous une forme compréhensible par ses contemporains.

Table des matières

CHAPITRE I : INTRODUCTION
I.1- Définition
I.2- Problématique
I.3- Solution proposée
I.4- Esquisse de la solution
I.5- Plan du mémoire
CHAPITRE II : ETAT DE L’ART
II.1- Toxicité
II.2-Collecte des données
II.3- Coefficient de partage (Octanol/Eau), logP
II.4- Amines
II.5- Alcools
II.6- Modélisation des données
II.7- Trois approches LAD exploitées
II.7.1- Méthode des moindres carrés re-pondérés itérativement .
II.7.2- Approche itérative de base
II.7.3- Méthode de la descente directe
CHAPITRE III : DECOUVERTE DES ESTIMATEURS LS ET LAD
III.1- Historique de l’estimation LAD
III.2- Découverte de l’estimation LS
CHAPITRE IV : STATISTIQUE DE LA LS ET DE LA LAD
IV.1- Introduction
IV.2- Méthodes d’estimations
IV.2.1- L’estimation LAD
IV.2.1.1- Le modèle de régression linéaire simple
IV.2.1.2- Test d’hypothèse sur la pente 1β
IV.2.2- L’estimation LS
IV.2.2.1- Le modèle de régression linéaire simple
IV.2.2.2- Estimation de la variance des erreurs
IV.2.2.3- Test sur la pente
IV.2.2.4- Intervalle de confiance
IV.2.2.5- Coefficient de corrélation
IV.2.2.6- Lien entre le coefficient de corrélation et le coefficient de détermination
IV.3- Comparaison de deux droites de régression
IV.4- Comparaison des ordonnées de deux droites au point moyen
IV.5- Comparaison des pentes de deux droites
IV.6- Comparaison des variances résiduelles
CHAPITRE V : RESULTATS ET DISCUSSION
V.1.1- Droites de régression LS et LAD1
V.1.2- Tests statistiques
V.1.2.1- Test sur la pente LAD1
V.1.2.2- Comparaison des deux pentes obtenues par LS et LAD1
V.1.2.3- Comparaison des deux ordonnées obtenues par LS et LAD1
V.1.2.4- Comparaison des deux variances LS et LAD1
V.1.3- Interprétation des résultats
V.2.1- Droites de régression LS et LAD2
V.2.2- Tests statistiques
V.2.2.1- Test sur la pente LAD2
V.2.2.2- Comparaison des deux pentes obtenues par LS et LAD2
V.2.2.3- Comparaison des deux ordonnées obtenues par LS et LAD2
V.2.2.4- Comparaison des deux variances LS et LAD2
V.2.3- Interprétation des résultats
V.3.1- Droites de régression LS et LAD3
V.3.2- Tests statistiques
V.3.2.1- Test sur la pente LAD3
V.3.2.2- Comparaison des deux pentes obtenues par LS et LAD3
V.3.2.3- Comparaison des deux ordonnées obtenues par LS et LAD3
V.3.2.4- Comparaison des deux variances LS et LAD3
V.3.3- Interprétation des résultats
V.3.4- Conclusion
CHAPITRE VI : CONCLUSION GENERALE
BIBLIOGRAPHIE
ANNEXE : PROGRAMMES EN LANGAGE PASCAL

Télécharger le rapport complet

Télécharger aussi :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *