Ein Parallelkorpus ist eine Sammlung von Dokumenten, in der jedes Dokument nach mindestens zwei Sacherschließungen gleichen Typs erschlossen ist, d.h. jedes Dokument ist z.B. mit der SWD und dem IZ-Thesaurus verschlagwortet.
Da in den wenigsten Fällen ein solches Korpus bereits vorliegt, muss er aus zwei zunächst unabhängigen Korpora konstruiert werden. Dazu ist ein Kriterium für die Feststellung der Identität zweier Dokumente notwendig. Da es sich bei den Dokumenten in ViBSoz ausschließlich um Printmedien handelt, kann dazu die ISB-Nummer herangezogen werden. Um doppelt vergebene Nummern und Fehler bei der Erfassung herauszufiltern, wird zusätzlich auf die Gleichheit des Nachnamens mindestens eines Verfassers geprüft.
Liegt ein solches Parallelkorpus vor, können auf statistischem Wege Beziehungen zwischen den einzelnen Termen oder Termgruppen der unterschiedlichen Sacherschließungen abgeleitet werden. Solche Beziehungen werden als (statistische) Transferbeziehungen bezeichnet. Sie können dann in Term-Term Matrizen abgebildet werden.