Dieses Beispiel aus dem Parallelkorpus der USB Köln und des IZ Sozialwissenschaften ist nach zwei verschiedene Sacherschließungen erfasst worden. An der USB Köln sind Terme der Schlagwortnormdatei vergeben worden, am IZ Sozialwissenschaften solche aus dem Thesaurus Sozialwissenschaften. Auffällig bei diesem Beispiel ist das gleichzeitige Auftreten der Terme 'Deutschland <DDR>' aus der SWD und 'DDR' aus dem Thesaurus Sozialwissenschaften. Tritt dieses Termpaar bei nur einem oder sehr wenigen Dokumenten auf, so handelt es ich vermutlich um ein rein zufälliges Auftreten. Kommt es jedoch bei sehr vielen Dokumenten vor, existiert vermutlich eine semantische Beziehung zwischen den beiden Termen. Vereinfacht ausgedrückt: Je öfter zwei Terme zusammen auftreten, desto wahrscheinlicher handelt es sich dabei um Synonyme, oder zumindest um semantisch stark verwandte Begriffe.
Voraussetzung für eine solche Analyse ist jedoch ein Parallelkorpus mit möglichst vielen Dokumenten.