CARMEN
AP 1
AP 2/5
AP 4
AP 6
AP 7
AP 9
AP 11
AP 12
AG Metadaten
AG Retrieval
AG Heterogenität
ECAC
   

Gemeinsames Arbeitstreffen AG Heterogenität/AG Retrieval

Im wesentlichen gibt es drei ungeklärte Punkte:

1. Einsatz von unterschiedlichen Werkzeugen für intellektuell erstellte Crosskonkordanzen

  • SIS/TMS wird für die Crosskonkordanzen zwischen Thesauri eingesetzt.
    Probleme:

    • Schwäche vor allem des Eingabewerkzeug

    • Visualisierungs-Tool lässt sich nicht in Client-Applikation einbinden

    • Browsing-Funktionalität von SIS/TMS bietet derzeit keine Möglichkeit der Übernahme von Termen in eine Anfrage (Anbindung an AP7) - Copy-And-Paste von Hand nötig

    • mitgelieferte SIS/TMS-Werkzeuge stellen sehr hohe Anforderungen an die Netz-Verbindung (2 MBit innerhalb WiN für sinnvolles Arbeiten nötig)

  • CarmenX wird für die Crosskonkordanzen zwischen Klassifikationen eingesetzt. Der Einsatz ist v.a. dadurch begründet, dass zunächst unklar war, ob SIS/TMS geeignet ist und CarmenX schon einsatzfähig bereit stand.
    Problem:

    • 1:n-Beziehungen können nicht abgebildet werden.

  • MACS (DDB) kommt ggf. als zusätzliche Alternative ins Spiel. Am 14.02. findet einen Präsentation für CARMEN in der DDB statt.

Es muss einen gut begründete Entscheidung getroffen werden, welches System (möglichst 1 System, ggf. auch 2 Systeme, falls nötig) letztlich eingesetzt und bei Projektende zur Weitergabe empfohlen wird.

Nächste Schritte:

  • Prüfung, ob Klassifikationen in SIS/TMS integrierbar sind. Außerdem Klärung, ob und mit welchem Aufwand Verbesserungen ans SIS/TMS von ICS/FORTH durchgeführt werden können.

  • Prüfung, ob Thesauri (inkl. 1:n-Beziehungen) in CarmenX integriert werden können.

  • Prüfung, ob MACS als Alternative für Klassifikationen und Thesauri einsetzbar ist.

2. Integration von AP11 und AP7

Schnittstelle für das Einbinden der Transfermodule ist geklärt bzw. wird ggf. verbessert. Thesaurus-Funktionalität ist als Zusatzfeature für die Abfrage in AP11 integriert; dadurch kann die Anfrage – ohne Benutzereingriff – um diese Funktionen erweitert werden. Da die Term-Erweiterungen von den Transfermodulen an die Retrievalmaschine zurückgegeben werden, ist eine Anzeige und Beeinflussung durch den Benutzer aber prinzipiell möglich.

Thesaurus soll aber mit Browsing-Funktionalität an der Benutzungsoberfläche zur Verfügung gestellt werden.

AP7 wird Datentypen zur Verfügung stellen, die Thesauri/Klassifikationen unterstützen und bedingt browsbar sind; AP7 muss dafür Kopien der Thesauri/Klassifikationen vorhalten. Offen ist, ob statt dessen über verteilte Server (z.B. SIS/TMS) Thesauri/Klassifikationen eingebunden werden können.

3. Integration AP9 und AP12/AP11

AP9 installiert CarmenX, um auf MSC-PACS-Konkordanzen zugreifen zu können. Diese Konkordanzen werden an einem Parallelkorpus zwischen Fachdatenbanken MATH und PHYS/Inspec überprüft (sofern Daten zur Verfügung gestellt werden).

Dadurch empirische Überprüfung der generellen semantischen Relationen aus intellektuellen Crosskonkordanzen aus AP12 an Hand von Relationen in Artikeln. Dadurch wird eine evtl. Verbesserung der Crosskonkordanzen in AP12 möglich.

Falls statistische Verfahren (Kookkurrenzanalysen) für Übergänge zwischen MSC/PACS bzw. Mathematik/Physik eingesetzt werden sollen, geschieht dies in enger Kooperation mit AP11, um Doppelarbeiten zu vermeiden.

Zeitplan für Tests

Kurzfristig (innerhalb von 2-3 Monaten) steht ein einsatzfähiges System für Anfragen nicht zur Verfügung, daher werden empirische Tests zu den Auswirkungen der Crosskonkordanzen auf das Retrieval-Ergebnis zunächst "manuell" bzw. über Simulation durchgeführt.

1. Februar 2001, Bonn
InformationsZentrum Sozialwissenschaften
Anwesend: Vertreter der AP 7, 9, 11, 12

Protokoll: Robert Strötgen

 


InformationsZentrum Sozialwissenschaften, Robert Strögen
02.02.2001