Analyse factorielle multiple avec R , livre ebook

icon

269

pages

icon

Français

icon

Ebooks

2013

Écrit par

Publié par

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

Découvre YouScribe et accède à tout notre catalogue !

Je m'inscris

Découvre YouScribe et accède à tout notre catalogue !

Je m'inscris
icon

269

pages

icon

Français

icon

Ebooks

2013

Lire un extrait
Lire un extrait

Obtenez un accès à la bibliothèque pour le consulter en ligne En savoir plus

L’analyse factorielle multiple (AFM ) est la méthode de référence pour analyser des tableaux de données dans lesquels un ensemble d’individus est décrit par plusieurs groupes de variables, ces dernières pouvant être quantitatives et/ou qualitatives. Ce type de tableau multiple se rencontre dans de nombreux domaines comme les enquêtes (les questionnaires comportent toujours plusieurs thèmes : des opinions, des comportements, etc.) ou les sciences expérimentales (dans l’industrie agro-alimentaire, par exemple, on caractérise les produits à la fois par des données physico-chimiques et des données issues de dégustations).

Ce livre est destiné aux utilisateurs confrontés à des tableaux multiples. Une large place est accordée aux applications et à la mise en oeuvre via R. L’objectif est de rendre l’utilisateur autonome dans l’application de l’AFM sur ses données. Dans cet esprit, ce livre :
– introduit une à une les principales caractéristiques de la méthode intuitivement à partir d’exemples ;
– donne les éléments théoriques nécessaires pour une compréhension en profondeur avec un recours au raisonnement géométrique systématique ;
– illustre les résultats à partir des exemples introductifs ;
– détaille la marche à suivre pour appliquer l’AFM avec le package FactoMineR ou via des codes R. Ces codes sont disponibles sur le site du LMA 2 (Agrocampus).

Cet exposé est complété par une présentation des méthodes classiques, ACP et ACM , elle aussi fondée sur des exemples. L’ensemble constitue l’état de l’art aujourd’hui en analyse factorielle.


Voir icon arrow

Publié par

Date de parution

01 septembre 2013

EAN13

9782759810857

Langue

Français

Poids de l'ouvrage

8 Mo

AnalysefactoriellemultipleavecR Jérôme Pagès
Analyse factorielle multiple avec R
7KLV SDJH LQWHQWLRQDOO\ OHIW EODQN
Jérôme Pagès
Analyse factorielle multiple avec R
ISBN: 9782759809639
c2013, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc d’activités de Courtabœuf, 91944 Les Ulis Cedex A
Imprimé en France
Tous droits de traduction, d’adaptation et de reproduction par tous procédés réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utili sation collective, et d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 1224, L. 1225 et L. 3352 du Code de la propriété intellectuelle). Des photocopies payantes peuvent être réalisées avec l’accord de l’éditeur. S’adresser au : Centre français d’exploitation du droit de copie, 3, rue Hautefeuille, 75006 Paris. Tél. : 01 43 26 95 35.
Collection Pratique R dirigée par PierreAndré Cornillon et Eric MatznerLøber Département MASS Université Rennes2HauteBretagne France
Comité éditorial
Eva Cantoni Institut de recherche en statistique & Département d’économétrie Université de Genève Suisse
François Husson Département Sciences de l’ingénieur Agrocampus Ouest France
Pierre Lafaye de Micheaux Département de Mathématiques et Statistique Université de Montréal Canada
Sébastien Marque Directeur Département Biométrie Danone Research, Palaiseau France
Déjà paru dans la même collection : Psychologie statistique avec R Yvonnick Noël, 2013 ISBN: 9782817804255 – Springer
Séries temporelles avec R Yves Aragon, 2011 ISBN: 9782817802084 – Springer
Régression avec R PierreAndré Cornillon, Eric MatznerLøber, 2011 ISBN: 9782817801841 – Springer
Méthodes de MonteCarlo avec R Christian P. Robert, George Casella, 2011 ISBN: 9782817801810 – Springer
7KLV SDJH LQWHQWLRQDOO\ OHIW EODQN
AVANTPROPOS
Du fait de son large domaine d’application, l’analyse factorielle multiple (AFM) est maintenant largement utilisée. Le présent livre est un exposé complet de la méthode : il rassemble les aspects théoriques et méthodologiques, des exemples d’application et la mise en uvre logicielleviaun package R (FactoMineR). De même que l’analyse en composantes principales (ACP) ou l’analyse des correspondances multiples (ACM), l’AFM s’applique à des tableaux structurés ainsi : pour un ensemble d’individus (un individu = une ligne), on dispose des valeurs de chacun pour un ensemble de variables (une variable = une colonne). La spécificité de l’AFM tient à la prise en compte, au sein des variables actives, d’une structure en groupes définie par l’utilisateur. De telles données sont désignées par « tableau individus×variables structurées en groupes ». Ce format de données est fréquent. En premier lieu parce qu’il correspond bien à la démarche de l’utilisateur lorsqu’il conçoit un recueil de données. Ainsi, le rédacteur d’un questionnaire d’opinion procède par thèmes, qu’il décline chacun selon plusieurs questions (les questions seront les variables et les thèmes les groupes de variables). Cette structure du questionnaire doit bien sûr être présente lors de l’analyse des résultats. En second lieu, parce que l’utilisateur souhaite souvent rap procher des données recueillies sur les mêmes individus statistiques mais dans des contextes (par exemple géographiques et/ou temporels) différents. Ainsi, dans l’in dustrie agroalimentaire, on dispose souvent, pour un même ensemble de produits, de profils sensoriels issus de dégustations réalisées dans plusieurs pays et/ou par des (types de) dégustateurs différents. Il est nécessaire d’analyser simultanément ces ensembles de données tout en préservant leur individualité, lors de l’analyse statistique d’abord et lors de l’interprétation ensuite. L’expérience, issue de nombreux contacts avec des utilisateurs variés, montre que les tableaux multiples constituent en fait le format standard des données aux quelles on est confronté aujourd’hui lorsque l’on applique des méthodes factorielles. A cette complexité de structure (en groupes de variables), s’ajoute une complexité de nature, les variables pouvant être quantitatives et/ou qualitatives. Il est donc nécessaire de disposer d’une méthodologie d’analyse de tableaux individus×va riables dans lesquels les variables sont structurées en groupes quantitatifs, quali tatifs ou mixtes. Tel est précisément le champ d’application de l’AFM. L’AFM est le résultat d’un travail conjoint de Brigitte Escofier et de Jérôme Pagès au début des années 1980. Cette méthode est maintenant bien établie si l’on en juge par sa disponibilité logicielle croissante. Citons, sans prétendre à l’ex haustivité, quelques logiciels incluant une procédure d’AFM : SPAD,FactoMiner (PackageR),ade4(PackageR), Uniwin (Statgraphics), XLStat. La disponibilité de la méthode étant acquise, la fréquence du format des don nées justifiant sa mise en uvre s’imposant d’ellemême, il reste encore à aider l’utilisateur à appréhender ses données dans leur complexité. Pour cela, une ques tion est centrale : que signifie précisément « prendre en compte la structure en groupes de variables dans une analyse d’ensemble » ? Autrement dit, pourquoi ne
pas mettre en uvre une analyse factorielle usuelle, par exemple une analyse en composantes principales, et tenir compte de la structure en groupes de variables uniquement dans l’interprétation. En étant un peu réducteur, on pourrait dire que ce livre ne répond qu’à cette seule question. Les deux premiers chapitres reprennent les méthodes de base de l’analyse fac torielle d’un tableau individus×variables, ACP et ACM. Le chapitre 3 traite de l’analyse factorielle simultanée de variables quantita tives et qualitatives, sans distinction de groupes. La méthode décrite, dite AFDM (analyse factorielle de données mixtes), est peu connue ; elle est l’occasion d’intro duire les éléments techniques permettant de prendre en compte les deux types de variables au sein d’une analyse unique. Les chapitres suivants, numérotés de 4 à 10, décrivent l’analyse factorielle mul tiple. Les quatre premiers abordent successivement les points clés de l’AFM dans le cadre de variables quantitatives. Un chapitre est dédié aux données qualitatives et mixtes. Enfin, deux chapitres comparent chacun l’AFM à une méthode de référence pour des questions spécifiques : la méthode Statis et l’analyse procustéenne. Le chapitre 11 présente une extension naturelle de l’AFM : l’AFM hiérarchique (AFMH). Dans cette méthode, les variables ne sont pas structurées par une simple partition, mais par une hiérarchie ou, si l’on préfère, une suite de partitions em boîtées. Un exemple typique de ces données est fourni par les enquêtes dont le questionnaire est structuré en thèmes et sousthèmes. Enfin, le chapitre 12 présente, sous la forme de deux fiches, quelques éléments de calcul matriciel et d’espaces métriques utilisés dans ce livre.
***
Au terme de cet ouvrage, il m’est agréable de remercier Sophie Puyo, ingénieure statisticienne, qui a assuré l’essentiel de la mise en forme de ce livre. Première lectrice de ce travail, elle a été aussi à l’origine de bon nombre d’améliorations. Ces remerciements s’adressent aussi à Magalie HouéeBigot, ingénieure statisticienne, qui a pris le relais de Sophie après l’intervention des relecteurs. Je remercie aussi tout particulièrement Eric MatznerLøber pour l’accueil qu’il a su réserver à ce livre et les échanges que cela a occasionnés. Il est juste enfin de remercier Annie, mon épouse, qui éclaire ma vie et donc, indirectement, ce livre.
***
Les données utilisées dans ce livre sont disponibles sur le site du laboratoire de mathématiques appliquées d’Agrocampus Ouest. Les chapitres 3, 8, 9 et 10 reprennent, en les adaptant au format d’un livre, des travaux initialement publiés dans la Revue de statistique appliquée (dont la publication s’est arrêtée en 2006). C’est là une excellente occasion de remercier Pierre Cazes, directeur de cette revue, d’abord pour l’excellent accueil qu’il fit à ces travaux et ensuite pour son encouragement à les reprendre dans un livre. Les calligraphies sont dues au talent de Richard Delécolle.
Table
1
2
des
matières
Analyse en composantes principales 1.1 Données, notations . . . . . . . . . . . . . . . . . . . . . . . 1.2 Pourquoi analyser un tableau par ACP ? . . . . . . . . . . . 1.3 Nuages des individus et des variables . . . . . . . . . . . . . 1.4 Centrage et réduction . . . . . . . . . . . . . . . . . . . . . 1.5 Ajustement des nuagesNIetNK. . . . . . . . . . . . . . 1.5.1 Principe général et formalisation des critères . . . . 1.5.2 Interprétation des critères . . . . . . . . . . . . . . . 1.5.3 Solution . . . . . . . . . . . . . . . . . . . . . . . . . 1.5.4 Relations entre les analyses des deux nuages . . . . . 1.5.5 Représentation des variables . . . . . . . . . . . . . . 1.5.6 Nombre d’axes . . . . . . . . . . . . . . . . . . . . . 1.6 Aides à l’interprétation . . . . . . . . . . . . . . . . . . . . . 1.6.1 Pourcentage d’inertie associé à un axe . . . . . . . . 1.6.2 Contribution d’un point à l’inertie d’un axe . . . . . 1.6.3 Qualité de représentation d’un point par un axe . . 1.7 Premier exemple : 909 candidats au bac . . . . . . . . . . . 1.7.1 Inerties projetées . . . . . . . . . . . . . . . . . . . . 1.7.2 Interprétation des axes . . . . . . . . . . . . . . . . . 1.7.3 Remarques méthodologiques . . . . . . . . . . . . . . 1.8 Eléments supplémentaires . . . . . . . . . . . . . . . . . . . 1.9 Variables qualitatives en ACP . . . . . . . . . . . . . . . . . 1.10 Second exemple : six jus d’orange . . . . . . . . . . . . . . . 1.11 ACP dans FactoMineR . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
Analyse des correspondances multiples 2.1 Données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Tableau disjonctif complet . . . . . . . . . . . . . . . . . . . . . . . 2.3 Questionnement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4 Nuages des individus et des variables . . . . . . . . . . . . . . . . . 2.4.1 Nuage des individus . . . . . . . . . . . . . . . . . . . . . . 2.4.2 Nuage des modalités . . . . . . . . . . . . . . . . . . . . . .
1 1 2 3 6 7 8 9 10 12 14 15 15 15 16 16 17 17 18 20 22 24 27 29
37 37 38 39 40 41 43
Voir icon more
Réseaux bayésiens avec R
Category

Ebooks

Réseaux bayésiens avec R

Jean-Baptiste Denis, Marco Scutari

Réseaux bayésiens avec R Alternate Text
Category

Ebooks

Sciences formelles

Réseaux bayésiens avec R

Jean-Baptiste Denis, Marco Scutari

Book

261 pages

Flag

Français

Séries temporelles avec R
Category

Ebooks

Séries temporelles avec R

Yves Aragon

Séries temporelles avec R Alternate Text
Category

Ebooks

Informatique

Séries temporelles avec R

Yves Aragon

Book

286 pages

Flag

Français

Régression avec R
Category

Ebooks

Régression avec R

Pierre-André Cornillon, Nicolas Hengartner, Matzner-Løber Éric, Laurent Rouvière

Régression avec R Alternate Text
Category

Ebooks

Sciences formelles

Régression avec R

Pierre-André Cornillon, Nicolas Hengartner, Matzner-Løber Éric, Laurent Rouvière

Book

451 pages

Flag

Français

Analyse factorielle multiple avec R
Category

Ebooks

Analyse factorielle multiple avec R

Jérôme Pagès

Analyse factorielle multiple avec R Alternate Text
Category

Ebooks

Sciences formelles

Analyse factorielle multiple avec R

Jérôme Pagès

Book

269 pages

Flag

Français

Calcul parallèle avec R
Category

Ebooks

Calcul parallèle avec R

Vincent Miele, Violaine Louvet

Calcul parallèle avec R Alternate Text
Category

Ebooks

Informatique

Calcul parallèle avec R

Vincent Miele, Violaine Louvet

Book

130 pages

Flag

Français

Régression avec R - 2e édition
Category

Ebooks

Régression avec R - 2e édition

Pierre-André Cornillon, Nicolas Hengartner, Matzner-Løber Éric, Laurent Rouvière

Régression avec R - 2e édition Alternate Text
Category

Ebooks

Sciences formelles

Régression avec R - 2e édition

Pierre-André Cornillon, Nicolas Hengartner, Matzner-Løber Éric, Laurent Rouvière

Book

402 pages

Flag

Français

Psychologie statistique avec R
Category

Ebooks

Psychologie statistique avec R

Yvonnick Noël

Psychologie statistique avec R Alternate Text
Category

Ebooks

Sciences humaines et sociales

Psychologie statistique avec R

Yvonnick Noël

Book

344 pages

Flag

Français

Alternate Text