les méthodes
présentation
analyse des correspondances
analyse dichotomique
analyse des distances
analyse des proximités
applications et exemples
objets et propriétés
choix de produits
sélection de candidats
plan et distances
plan et proximités
personnages de romans
enquête et segmentation
traitement d'enquêtes
mise en oeuvre
recueil des informations
exploitation
code (6 lettres et 6 chiffres)
vos études et analyses
mthstat - les méthodes
Les bases de l'analyse des données
Statistique n'est pas probabilité, en effet les bases de l'analyse des données sont plutôt géométriques que probabilistes.
Il est plus fait référence à la moyenne et aux axes d'inertie qu'à l'espérance mathématique; cependant les lois probabilistes peuvent guider lors de l'élaboration d'une méthode d'analyse.
>
les méthodes
>
présentation
Une analyse sans modèle préconçu
Le schéma classique, à savoir : construction à priori d'un modèle, ajustement des paramètres aux données, test de validité n'est pas employé en analyse des données.
En effet cette démarche manque parfois de cohérence
Si trop de paramètres sont utilisés, l'ajustement aux données conduira toujours à d'excellents résultats pour toute forme de modèle.
L'utilisation de tests reposant sur des hypothèses non vérifiées (par exemple une hypothèse de normalité dans le cas d'un test de Khi2) peut conduire à rejeter des résultats qui parfois sont moins sujets à caution que ces mêmes hypothéses.
A l'inverse de ce schéma, une méthode d'analyse des données ne bâtit pas de modèle à priori et n'emploie qu'un très petit nombre d'hypothèses qui sont fort peu restrictives.
>
les méthodes
>
présentation
Le test de validité
Le test de validité est remplacé par la valeur que l'on peut accorder à l'interprétation des résultats.
Par exemple, en analyse des correspondances, nous pouvons dire que l'interprétation des premiers facteurs est généralement évidente; lorsque l'interprétation des facteurs suivants s'avère impossible, cela signifie que toute l'information utile a été extraite de l'ensemble des données.
>
les méthodes
>
présentation
Analyse factorielle des correspondances (AFC)
Les applications liées à l'analyse factorielle des correspondances sont extrêmement variées.
Cette analyse traite un tableau de données et le transforme en un nuage de points sur un plan, un point par ligne et un point par colonne.
Ce graphique résultant contient tout ou grande partie de l'information du tableau initial.
Les applications décrites dans ce site montrent
l'efficacité et le bien-fondé de cette méthode.
>
les méthodes
>
analyse des correspondances
Analyse dichotomique
L'analyse dichotomique fournit une explication sur une variable en fonction d'un ensemble d'autres variables.
Un échantillon d'au moins une centaine d'observations est nécessaire.
Les observations doivent comprendre la variable à expliquer et un ensemble de variables explicatives (au moins une variable explicative).
La variable à expliquer peut être de type binaire (OUI/NON) ou bien numérique.
Les variables explicatives peuvent être binaires, numériques ou figurer dans un ensemble de modalités ordonné ou non.
Principe de l'analyse
Le processus de traitement est itératif.
L'ensemble des observations forme un groupe.
Ce groupe va être divisé en deux sous-groupes.
Cette division est effectuée de façon à ce que les deux sous-groupes soient le plus différents possibles quant à la variable à expliquer.
Par exemple, si la variable à expliquer est de type OUI/NON le sous-groupe 1 comprendra 80% de OUI et le
sous-groupe 2 aura 75% de NON.
La séparation est faite par rapport à une variable explicative: si cette variable a telle valeur, alors l'observation sera en groupe 1 sinon en groupe 2.
Le processus est repris pour chacun des deux sous-groupes et ainsi de suite jusqu'à ce que les groupes aaient un nombre insuffisant d'observations.
>
les méthodes
>
analyse dichotomique
Analyse des distances
Cette méthode permet de représenter dans un espace de dimension réduite, un plan dans le meilleur des cas, des objets dont sont connues leur distance deux à deux.
La métrique utilisée peut être une distance euclidienne obtenue par exemple en relevant les distances entre un ensemble de points tracés sur une feuille.
Peuvent également être utilisées des distances estimées en temps de parcours.
Informations initiales
Les distances sont fournies sous forme d'un tableau comportant autant de lignes que de colonnes.
La distance
d(i,j)
entre les objets
i
et
j
figure au croisement de la ligne
i
et de la colonne
j
.
Le tableau n'est pas obligatoirement symétrique; la distance
d(i,j)
peut différer de la distance
d(j,i)
.
>
les méthodes
>
analyse des distances
Analyse des proximités
Cette méthode permet de représenter dans un espace de dimension réduite des objets dont sont connues leur proximité deux à deux.
A la différence de l'analyse des distances où une métrique stricte est souhaitée, l'analyse des proximités peut faire appel à des définitions mois précises.
Ainsi, la proximité peut être définie par une notion floue : proche, assez proche, assez loin, loin.
Informations initiales
Les proximité sont fournies sous forme d'un tableau comportant autant de lignes que de colonnes.
La proximité
p(i,j)
entre les objets
i
et
j
figure au croisement de la ligne
i
et de la colonne
j
.
Le tableau n'est pas obligatoirement symétrique; la proximité
p(i,j)
peut différer de la proximité
p(j,i)
.
La convention de sens est : si
k
et
m
sont plus proches que ne le sont
i
et
j
, alors
p(k,m)
>
p(i,j)
.
>
les méthodes
>
analyse des proximités
© mthstat - ( 2010 - 2019 )
(site intraday.news)
Notifications - semaine
Notifications - Intraday
Indications - Intraday
Notifications - semaine
Notifications - temps réel
Indications - temps réel
activité et âge
activité et âge
activité et âge
activité et âge
zodiac et âge
zodiac et activité
IDF - primaire droite 2016
IDF - primaire gauche 2017
primaire droite 2016
primaire gauche 2017
site marchand
métro parisien
élections régionales 2004
nom de cigarette
proximité entre villes
personnages de l'Argent
distances entre points
villes françaises
chef de projet
produit de nettoyage
qualités et défauts
entreprise et cigarette
yeux et cheveux
Analyse des correspondances
Analyse des correspondances
qualités seules
Analyse des correspondances
qualités et défauts
Analyse des distances
Analyse des proximités
Analyse des proximités
analyse sémantique
Analyse des distances
similitudes et propriétés
Auteurs et documents
Professions de foi 2017
Présidentielle 2017 - sondage
Tournages de Films à Paris
Présid. Paris 2017/2012
Follow @mthstatNews