C'est la première fois que l'ACP me paraît simple à comprendre et surtout à interpréter, malgré tout ce que j'ai pu parcourir jusqu'ici. Merci infiniment!
merci beaucoup pour ce tuto,vraiment il m'a beaucoup aidé a comprendre le phénomene...je te jure je le vois comme un cour chinois avec notre enseignante;lool
un très GRAND merci , je suis en M2 et c'est la première fois ou j'étudie l'analyse des données, en plus les chiffres c'est vraiment pas mon truc, mais grâce à votre vidéo j'ai commencé à saisir un peu .
merci beaucoup, vos explications sont très claires et précises. Ces vidéos sont un excellent complément au livre sur R dont vous avez dirigé la rédaction.
J'ai pas compris comment mettre en pratique cette méthode, c-a-d comment trouver les composantes principales par calcul manuel et comment représenter les variables sur les nouveaux axes
A part quelques points de détails, la vidéo est plutôt claire. Surtout, je n'ai pas compris où vous voulez en venir quand vous parlez des valeurs extrêmes. Par ailleurs, je me permets d'ajouter un petit complément d'info. Pour une dimension donnée, si des variables lui sont corrélées positivement et d'autres négativement, la corrélation positive ne signifie pas toujours des valeurs plus importante (ça dépend du paramétrage). Par contre, la corrélation négative d'une part et positive d'autre part signifie que les variables sont corrélées de manière opposée (discussion avec mon maître de stage)
Excellente présentation superbement expliquée. Seul bémol, le rythme du commentaire est trop élevé, ce qui m'oblige à interrompre la vidéo pour "digérer" l'info...
Bonjour, Les méthodes de standardisation des variables le 12:10 et le 26:10 sont-elles différentes ? Sinon, pourquoi les variables centrées et réduites sont dans une hypersphère de rayon 1 (26:10) ? Merci pour les renseignements !!
Merci beaucoup Monsieur Husson! Votre explication de l'ACP c'était pour la plupart claire. Cependant il avait un chose que j'ai pas compris. Comment est-ce que vous avez calculé les coordonnées des individus sur les axes?, minute 20:05 de cette vidéo. Je vous merci par avance la réponse à ma question. Salutations depuis le Pérou!
Bonjour, Les coordonnées sur les axes sont calculés par une décomposition en valeurs singulières (en cherchant les valeurs propres et les vecteurs propres du tableau de données centré-réduit). C'est un peu compliqué, et je suis passé sur cette explication.
Merci pour la video :-). Je voudrais savoir comment centrer et réduire et transformer son jeu de données ou les transformer en log(x+1) ? Peut on le faire avec Xlstat ? Merci de votre réponse.
Il faut faire ce que l'on appelle une décomposition en valeurs singulières de la matrice de données centrée-réduites. Ou une diagnalisation de la matrice de variance-covariance. C'est donc du calcul matriciel qui permet de trouver les dimensions.
Bonjour j'ai 6 variables de WGI que je veux transformer a une seule variable. Pour l'utiliser dans un modèle. C'est possible de faire un video comment le rialise et avec quel logiciel. Merci
La CPA serait elle différente de la PCA?? Il serait plus intéressant de dire que la PCA (anglais) ou CPA (en français) permet de réduire la dimensionalité des data et donc de travailler sur des espaces plus réduits que les échantillons originaux. A partir de là, la CPA augmente la vitesse de traitement de l'information par les techniques de machine learning. C'est le but de la "component principal analysis". Ce n'est pas une technique d'analyse.
Bonjour, Merci beaucoup pour cette excellente vidéo. Je souhaiterais savoir si on peut faire une ACP sur des données de panel. En gros, on a des variables en colonne, et en ligne on a individu, chacun suivi sur une période de 10 ans. Donc chaque ligne est un individu-année. Merci cordialement
Bonjour, Vous mentionnez brievement un technique de bootstraping pour evaluer la significativite des dimension ( vous parlez de 10000 PCA )... Comment avez vous obtenu ces valuer, y a til une fonction dans FactoMineR ? Merci d'avance et merci pour toutes ces videos tres informatives!
+Albert James Bonjour, Des jeux de données ayant le même nombre d'individus et le même nombre de variables ont été générés au hasard (selon une loi multinormale). Sur chacun de ces jeux de données, une ACP est construite et l'inertie des 2 premiers axes est récupérée. On réalise cela sur 10000 jeux de données et on calcule ensuite le quantile 95% de ces inerties. C'est ce quantile qui apparaît dans le tableau. FH
Les univesités et écoles devraient vraiment s'inspirer de ce genre de cours avec plateforme numérique plutôt qu de faire des heures et des hheures interminables de cours marginaux....
+Corentin Calvet Tout à fait d'accord, c'est carrément honteux de faire déplacer des élèves pour des cours magistraux à notre époque ! Mais que vont devenir tous les mauvais profs ? On va l'attendre longtemps l'université 100% numérique ! En tout cas bravo à vous Mr Husson !
Vous pouvez m'aider pour corriger cet exercice, S'il vous plaît Une analyse en composantes principales est effectuée sur un tableau de données. Les résultats sont les suivants: - Valeurs propres de la matrice variance-covariance: λ1=8, λ2=2, λ3=12 - les deux premières composantes principales: C1 C2 A 2√6 √6 B _√6 √6 C _√6 _2√6 D √6 2√6 E √6 _√6 F _2√6 _√6 On désire présenter 50% de l'information globale. * présenter les individus dans l'espace réduit.
Merci pour l'explication. Je fait du traitement d'images avec des moments de chebychev Tpq le résultat est un vecteur de caractéristiques. Puis-je utiliser l'APC afin de réduire la taille de ce vecteur? pour faire en sorte d'avoir les valeurs les plus représentatives de mon images.
Si vos données sont dans un seul vecteur, l'ACP ne vous sera pas utilie. Si maintenant vos données sont dans une matrice, alors oui, l'ACP peut vous permettre d'avoir réduire la taille de vos données en extrayant qq composantes principales.
Cela n'aura pas d'intérêt car l'ACP cherche à faire resortir les liens entre les variables (et les ressemblances entre individus du point de vue de l'ensemble de variables). Il y a un codage spécifique pour les images. Je pense que les individus correspondent à une ligne de pixels, et les variables à une colonne de pixels. Ainsi, pour une image 256x256, vous aurez 256 lignes et 256 colonnes. Vous pouvez faire l'ACP et ensuite reconstruire l'image avec la formule de reconstitution (fonction reconst de FactoMineR).
Bonjour, Merci pour cette excellente présentation. Si les coordonnées factorielles des individus (matériaux d'un même lot mais ayant subi des traitements différents) sont proches selon l'axe 1 mais pas selon l'axe 2, est-ce que je peux dire que ce deux individus sont semblables selon l'axe 1 portant le plus d'information (donc selon les variables très liées à l'axe 1?) Merci d'avance
D''ailleurs, en faisant le parallèle avec votre présentation, est-ce qu'on peut dire que Rennes et Grenoble peuvent être semblable selon l'axe même si elles sont éloignées selon l'axe 2 ?
oui. Les valeurs de ces individus seront proches pour les variables liées à l'axe 1, mais pas pour les variables liées à l'axe 2. Le mieux est de faire une petite vérification dans le tableau de données.