Eine URL muss im Gatherer-Prozess den obigen Workflow durchlaufen. Zunächst muss die URL eine Reihe von Prefilter überstehen (Beispiele
folgen). Sollte sie nicht aussortiert werden, wird das durch die URL repräsentierte Objekt geholt und mit Hilfe von Summarisern in das interne Datenformat des Gatherers überführt. Bislang wurde SOIF als internes Repräsentationsformat im Gatherer benutzt. In Zukunft wird XML/RDF als internes Datenformat des Gatherers dienen. Die erste Implementierung einer XML-Unterstützung von Harvest-NG ist inzwischen fertiggestellt.

Nachdem das Objekt durch die Summariser in die interne Repräsentation überführt wurde, kann es mit Hilfe von Postfiltern geändert, gelöscht oder schließlich gespeichert werden.