Für die Heterogenitätsbehandlung ist der Summariser die zentrale Komponente innerhalb des Gatherer-Workflows. Sämtliche Dokumenttypen wurden bislang in das SOIF Format überführt. Der obige Ausschnitt aus einem SOIF-Record zeigt, dass sich mit diesem Format keine hochstrukturierten Daten ablegen lassen.