Sériation

Nicolas Prudhomme 15 mai 2017 Commentaires fermés sur Sériation
Sériation

Sous l’appellation sériation, on désigne les méthodes qui ont pour finalité de classer chronologiquement des ensembles de vestiges matériels (clos ou non), uniquement à partir des informations intrinsèques de description du matériel sérié.

CONTENU

Matrice non diagonalisée. En abscisse, les critères; en ordonnée, les numéros des faits archéologiques

La matrice diagonalisée sous forme parfaite. On obtient l’enchaînement chronologique des critères (A C D B E) et des faits (1 3 5 4 2)

d

La sériation s’intéresse aujourd’hui à des critères non exclusivement temporels, en tentant d’utiliser le maximum d’informations intrinsèques des éléments à sérier pour obtenir une classification finale temporelle (on prend donc de plus en plus en compte les facteurs à la fois temporels et technologiques, sociologiques, économiques, démographiques, spatiaux – cas de la toposériation – croisés en catégories homogènes). La sériation est une méthode de classement mathématique déductive. Elle permet d’obtenir un classement chronologique des faits et du matériel sérié par un calcul implicite de corrélation entre les éléments précédents et suivants. L’objectif et de maximiser le lien avec les éléments voisins ainsi que l’exclusivité de l’élément concerné, qui rend compte de la dynamique de la séquence.

Comme tout outil statistique, la sériation doit répondre à des hypothèses et dépend des échantillons sériés. Les résultats n’ont donc qu’une portée statistique au sens restrictif du terme et il est donc souhaitable d’associer la sériation à d’autres méthodes.

d

Les hypothèses statistiques associées


La sériation s’appuie sur des hypothèses qui fixent le cycle d’existence des produits sériés. On peut souvent décrire ce cycle par une courbe de vie, supposée unimodale, de son apparition à sa disparition. La présence en volume de l’élément est par ailleurs supposée suivre une loi normale (cas de la matrice d’effectif). La durée de présence doit être continue sur la plage d’existence (cas des matrices de présence).

De plus pour obtenir une sériation plus efficace et plus sûre, il faut que :
– les unités doivent être homogènes en durée ;
– les unités doivent être homogènes en tradition culturelle ;
– les unités doivent êtres homogènes en origine locale.
On peut également imposer des hypothèses d’homogénéité en fonction.

D’une façon générale, il faut retenir que les variables retenues doivent avoir une signification chronologique et que les échantillons doivent être homogènes.

L’homogénéité des ensembles se traduit également par des conditions de “poids”. Il faut éviter dans le choix des ensembles d’avoir des individus contemporains trop nombreux ou d’avoir des lacunes, qui créent des partitions. Les éléments doivent être homogènes (dans une sépulture) et de poids semblables (quantité du mobilier en présence/ absence dans une sépulture du même ordre).

d

Quelques problématiques susceptibles d’être abordées par la sériation


La sériation servira souvent à résoudre des problématiques précises, notamment de valider ou rejeter un ordre chronologique préétabli par d’autres méthodes.

Signalons notamment :

la périodisation de sites à stratigraphie complexe (cas des habitats néolithiques possédant des structures imbriquées), la sériation intervient alors en validation d’hypothèses associées à d’autres méthodes ;

l’identification culturelle (cas des niveaux archéologiques stratifiés préhistoriques), par la sériation du matériel ;

la périodisation de sites sans stratigraphie (exemple des nécropoles, ensembles clos), grâce à la sériation du mobilier ou de l’agencement spatial par exemple ;

les problèmes de périodisation et de rupture (cas par exemple de la transition Âge du Bronze / Âge du Fer en Europe Occidentale).

Toutes ces problématiques sont abordables par la sériation. Cependant, cette méthode n’apporte pas toujours de réponse satisfaisante (cas de la transition Âge du Bronze / Âge du Fer).

• La mise en place de la méthode de sériation

La méthodologie générale s’articule en cinq étapes :

1. définition d’une problématique (par exemple, soit deux sites a priori classés chronologiquement l’un par rapport à l’autre. L’étude du matériel découvert sur ces sites permet de vérifier l’hypothèse, notamment si certaines pièces sont typologiquement proches) ;

2. expérimentation

3. modélisation

4. interprétation

5. théorisation

f

Choix à effectuer avant d’appliquer une méthode de sériation


• Le choix des critères et des faits
Les critères et les faits doivent dans un premier temps répondre au mieux aux hypothèses statistiques, dont celle d’homogénéité.

Il s’agit ensuite de trouver des caractères (ou critères) communs mais différents dans la forme. Notons qu’un caractère unique comme un caractère global n’a aucun intérêt dans l’étude d’une série. Les caractères sélectionnés doivent être homogènes.

Remarquons que la valeur chronologique potentielle supposée sera révélée par la sériation. Les variables à valeur non chronologique induisent des structures parasites qu’il faudra éliminer par la suite (sous forme de partition en général).

De plus les valeurs descriptives doivent, dans un cas optimal, décrire une même réalité (stylistique, fonctionnelle, technologique, sociale…) qui évacuent les partitions parasites. (ce sont les hypothèses d’homogénéité)

Parmi les critères, on distingue :
– les critères durs : ils permettent de décrire la technologie et le décor. Ils s’appuient sur des critères objectifs quantifiables, ou évaluables de façon absolue ;
– les critères flous : plan et forme de structures, morphologie ;
– les critères numériques.

• Critères ou types

Le choix de types ou de critères peut se poser. Il s’agit de réfléchir à l’échelle des valeurs de la sériation afin de ne pas mélanger des critères objectifs et des critères interprétés (ce qui risque d’être le cas des types si l’on ne s’en tient pas à un simple catalogue de critères regroupés sous le nom de type) de façon illégitime.

Le type, dans un cas parfait, ne doit que permettre de reprendre une liste de critères de façon synthétique et non se substituer à eux. Dans ce cas, on obtient une sériation par blocs après diagonalisation qui permet de périodiser les événements en périodes et sous-périodes ou périodes de transition.

Le choix de la sériation par les critères est plus riche car il permet de n’utiliser que des critères objectifs et d’éviter les critères interprétatifs (types). On préférera également les sériations par les critères car elles permettent une optimisation du tableau de sériation par agrégation des caractères.

d

La construction de la matrice


L’application d’une méthode de sériation commence par la construction d’une matrice dont les occurrences sont les faits archéologiques à sérier associés à une documentation descriptive et typologique de ces produits (les critères).

On rencontre souvent deux types de tableaux :

– le tableau d’effectif (qui est souvent un tableau de pourcentage) ;

– le tableau de présence 0 / 1 (absence = 0 /présence = 1).

Les techniques de sériation permettent, à l’aide d’algorithmes, de construire une matrice dont l’ordre des lignes et des colonnes donne la meilleure forme diagonale avec des valeurs maximales sur la diagonale (associés à des valeurs voisines organisées de façon décroissante) pour les tableaux d’effectifs, et des 1 pour les matrices de présence/absence).

L’interprétation de la diagonalisation permet de donner l’ordre chronologique d’apparition (et de disparition) du matériel sérié ainsi que sa durée de vie.

Parmi les classements les plus utilisés, on peut noter :

– les classements par séries, qui donnent un ordre à des faits archéologiques dont la proximité traduit la proximité descriptive ;

– les classements par types regroupent les faits archéologiques par types, qui sont des sous-ensembles homogènes.

La sériation fait apparaître de nombreuses périodes de transition qu’il convient de traiter comme des stades dynamiques témoignant de la transformation plutôt que de les considérer comme des sous-périodes.

L’aspect des tableaux diagonalisés est une conséquence de l’hypothèse de vie unimodale (présence continue sur une plage donnée, correspondant à la forme diagonale). Notons cependant que la forme idéalement diagonale ne se rencontre généralement pas, mais que le modèle peut en être assez proche et permettre alors des interprétations.

• La diagonalisation : la technique manuelle

Elle consiste à réagencer les lignes et les colonnes par permutation de façon manuelle. Elle ne peut pas s’appliquer à de grandes matrices, cependant elle reste très efficace en deuxième intention, après une diagonalisation algorithmique, pour résoudre des conflits non automatiquement solubles.

La manipulation manuelle des lignes et colonnes peut se faire de façon graphique (méthode graphique de Ford pour les matrices d’effectifs, méthode graphique de Czanowski pour les matrices de présence).

• Les techniques utilisant les tableaux de similarité

Un tableau de pourcentage ou de présence peut être utilisé. On construit à partir de la matrice initiale un tableau de similarité* (fait x fait), que l’on réorganise par permutation des lignes (et des colonnes symétriques) de façon à obtenir une diagonale maximale entourant de valeur décroissante en s’éloignant de la diagonale pour les matrices d’effectifs (Robinson), ou dont le bloc diagonal est constitué de 1 sans intercalation de 0 (forme de Pétrie).

Un algorithme, établi par Landau et la Vega (1971) permet d’obtenir la forme optimale, indépendante de l’ordre du tableau initial, en effectuant simultanément une classification automatique (par la méthode de la moyenne) et par un algorithme d’ordonnancement. Il y a donc globalement trois étapes :

calcul des indices de similarité,

réorganisation de la matrice,

recherche de la forme optimale de Robinson ou de Petrie.

La matrice est alors retransformée en matrice de pourcentage et les critères peuvent finalement être classés de façon chronologique.

*La définition de la similarité entre deux faits possèdent plusieurs formes selon le type de tableau (présence, effectif) et selon les auteurs (citons notamment l’indice de Landau, de distance de Tanimoto pour les matrices de présence par exemple).

Ces coefficients sont aussi appelés coefficients de distance.

• Les techniques d’ordonnancement direct

Ces techniques permettent d’éviter de calculer un tableau de similarité.
On y recherche également des formes optimales (Petrie ou Robinson).

• Techniques du barycentre

On utilise assez souvent la technique du barycentre :
– on calcule le rang moyen des 1 dans chaque colonne ;
– on ordonne les colonnes selon le rang moyen décroissant ;
– on effectue les mêmes opérations sur les lignes ;
– on réitère jusqu’à obtention du tableau sérié.

La sériation ne remplace en rien les méthodes de datation relative comme la stratigraphie ou les méthodes physiques de datation absolue. Mais elle permet de construire des séquences de chronologie relative lorsque les méthodes précédentes font défaut. Elle permet également de valider des hypothèses construites à partir de ces datations. L’intérêt est donc d’utiliser un mix de ces méthodes qui permettent de s’assurer d’une véritable valeur des interprétations.

d

Les techniques de sériation rapide


Citons le cas de la technique du scalogramme d’Eliseef (1968), et de celle d’Ester (1981).

• Le scalogramme d’Eliseef

Cette technique permet de sérier une matrice de présence.

1. On construit un tableau de similarité (par exemple en prenant comme indice de similarité le nombre de 1 en commun, ce qu’on appelle une matrice d’occurrences).
2. On calcule la somme des éléments d’une ligne (sans l’élément diagonal maximal) ; l’élément central est révélé par la plus grande valeur, qui correspond à la plus grande corrélation avec les autres éléments ;
3. On isole la deuxième (1er copilote) et la troisième valeur la plus forte (2° copilote). La plus forte valeur sur la ligne du copilote désigne l’élément le plus lié à ce dernier.
4. On réitère.

On obtient alors une matrice diagonalisée. Dans certains cas, la réitération est bloquée assez rapidement par un point mort.

• Technique d’Ester

On s’intéresse ici à une matrice de présence. Dans cette méthode on identifie les 1 inclusifs, c’est à dire qui appartiennent à des sous-ensembles des 1 d’un autre individu, pour ne les traiter qu’après.

1. On construit une matrice d’occurrence
2. On calcule un indice de sériation (nombre de 1 commun à deux individus non inclusifs et en comptant 0 pour les éléments inclusifs).
3. Les colonnes sont classées dans l’ordre décroissant selon l’indice de sériation.

Les hypothèses posent comme principe qu’un objet apparaît pendant une période continue et que pendant cette durée, le nombre des exemplaires constatables suit une distribution normale. L’application de la sériation permet de mettre en évidence des enchaînements chronologiques, des liens de parenté ou de distinction entre objets en se basant sur l’étude de leur présence, de leur absence ou de leur association.

d

Technique d’analyse des données


• La sériation par l’analyse des proximités – multidimensional scaling

Kendall a montré en 1971 qu’en appliquant l’algorithme de multidimensional scaling Mdscal à un tableau à sérier, transformé préalablement en matrice de similarité, (elle-même issue d’une première matrice de similarité), que ce dernier s’ordonne en une représentation plane en forme de fer à cheval de forme caractéristique lorsque cette matrice est sériable.

• La sériation par analyse factorielle

Marquardt a montré que l’analyse en composantes principales, appliquées à des matrices de mesures ou de pourcentages produit comme résultat, dans le cas où les variables sont à caractère évolutif, un premier facteur donnant l’ordre de sériation des individus. En sélectionnant ces variables, la construction d’une matrice de similarité classée en distance euclidienne croissante entre les individus permet d’obtenir une matrice diagonalisée. La représentation est celle d’une double parabole superposée (une pour les faits, l’autre pour les critères) sur les deux premiers axes de l’analyse factorielle. Cette technique a donc l’avantage de fournir le classement à la fois des faits mais aussi des critères.

L’analyse sérielle permet alors une interprétation plus fine des résultats obtenus, notamment des points aberrants.

• Les autres méthodes par blocs

Signalons notamment :
– Sériation par blocs de probabilités symétriques ;
– Sériation par blocs de proximité spatiale ;
– Sériation par blocs de proximité subjective , variante de la méthode précédente.

Si un critère apparaît dans un seul bloc sur plus de 75% du bloc, il est discriminant ; entre 25 et 75%, il est indicatif ; si il est inférieur à 25%, il est indiciaire.

d

Interprétations des résultats de la sériation


Une des premières interprétations réalisables est l’identification des ensembles anciens et récents. [Pour cela, on trace la courbe rejoignant les centres de gravité des colonnes et identifier les ensembles anciens ou récents (en fonction de la fréquence des descriptions par les critères situés exclusivement de part et d’autre de la courbe).]

Toutes les perturbations et aberrations doivent être identifiées. Il faut éliminer les caractères non chronologiques.

• Validation de la sériation

Rappelons le danger consistant à confondre un modèle linéaire avec des structures plus complexes. La technique de sériation employée doit alors en tenir compte.

La sériation par définition doit présenter une corrélation parfaite avec la variable temps. Sa validité est remise en cause par toute corrélation avec une autre variable, intrinsèque ou extrinsèque. La statistique (tests du X² par exemple permet d’effectuer quelques tests caractéristiques).

L’utilisation de méthodes de datation absolue ou relative (stratigrapie) fournit de bonnes informations sur la validité d’une sériation.

• Les avantages de la sériation

La sériation permet de façon assez rapide de vérifier des hypothèses d’ordonnancement chronologique (pensons au temps nécessaire à une datation !) avec une mise en oeuvre relativement aisée (il n’est pas nécessaire de disposer d’un laboratoire équipé pour le faire).

Un autre intérêt de la sériation est de ne faire intervenir que des critères intrinsèques aux éléments sériés, ce qui signifie que l’élément est porteur de toute l’information utilisable. A l’archéologue de savoir la décrypter…
Ces méthodes peuvent être d’un grand secours pour étudier des structures sans stratigraphie notamment.

La nature de la sériation permet de mettre en évidence des corrélations qui ne semblaient peut être pas si évidentes à l’oeil (effet indirect, comme la partition d’une sériation, qui signale un facteur parasite discriminant mais non temporel).

Les méthodes de sériation sont adaptables à une problématique, ce qui en font des outils multiformes et adaptables. Des méthodes dérivées permettent de répondre à certains problèmes spécifiques, comme la toposériation par exemple.

• Les limites de la sériation

La sériation permet d’obtenir un ordre chronologique à partir d’informations intrinsèques. Les principaux problèmes et limites vont provenir du manque d’homogénéité de l’information ou à son caractère incomplet.

Un des problèmes est que les critères sélectionnés sont relativement subjectifs dans leur choix (et non dans leur mesure). Ceci crée évidemment des biais. Très souvent, la sériation ne sera pas parfaite (on ne peut obtenir la forme exacte de Petrie ou de Robinson), mais s’en approche. L’interprétation des aberrations est alors capitale, car dans certains cas, quelques points isolés de façon anodine peuvent remettre en cause la séquence chronologique linéaire obtenue. Les grandes matrices sont donc parfois difficiles à gérer et à interpréter (ce sont pourtant statistiquement parlant les plus intéressantes).

Enfin, la description du modèle peut s’avérer plus complexe que prévue. En effet, tous les matériels ne répondent pas aux hypothèses du cycle de vie unimodale et continu. Il est alors parfois nécessaire de reprendre ces modèles sans les adaptant à des réalités plus complexes, sous réserve d’avoir pu les identifier…

• Les problèmes d’interprétations des matrices non parfaites

Le problème suivant vient de la difficulté de diagonaliser ces matrices imparfaites. Parfois, plusieurs solutions sont possibles, mais ont des sens incompatibles ! La problématique de l’unicité de la solution mérite donc d’être soulevée.

La présence d’une corrélation nulle entre certains éléments provoque une rupture sérielle. Elle peut être due notamment à un facteur parasite qui provoque une partition liée à un critère non chronologique (d’où l’importance de l’analyse et de l’interprétation des critères de la matrice).

De la même façon, un manque de corrélation associé parallèlement à un élément marginal non diagonal peut s’interpréter comme un phénomène non linéaire (séparation en deux branches évolutives).

Parmi les modèles complexes à identifier, notons :

le problème des ruptures sérielles. Il existe des partitions qui rendent apparemment continu un phénomène discontinu.
– les facteurs parasites. Les facteurs hétérogènes créent des structures de partition.
la séparation évolutive. Certaines structures marquent une séparation en deux branches d’évolution.

Dans certains cas, des facteurs parasites empêchent la diagonalisation. il faut alors créer des sous tableaux à sérier indépendamment une fois les facteurs identifiés.

On comprend aisément l’intérêt d’avoir des méthodes statistiques d’identification des variables mélangées, et des méthodes de validation des résultats, par corrélation notamment.


 

 

Archeologie, Patrimoine, Culture et Civilisation, Médiation et Valorisation du Patrimoine, Techniques de l Archeologie en Europe