Momentan (12.5.2000) existiert nur ein Summariser für HTML-Dokumente. Dieser überführt HTML-Doukumente in XML-Dokumente (siehe oben), die im Wesentlichen aus drei Teilen bestehen:
manageData: administrative Daten, die zur internen Verwaltung der  Objekte im Gatherer verwendet werden.
metaElements: META-Elemente des HTML-Dokuments.
full-text: Gesamttext der HTML-Seite ohne die HTML-Tags.

Dieser HTML-Summariser ignoriert also die gesamte HTML-Struktur der ursprünglichen Dokumente und ist somit hauptsächlich für solche HTML-Dokumente sinnvoll einsetzbar, die über umfangreiche Meta-Tags verfügen.