Roundtable des LII Austria: Ähnlichkeiten, Beziehungen, Vergleiche – Tools zur inhaltlichen Analyse und Präsentation von Dokumenten

Mit spannenden Vorträgen und Diskussionen startete am Mittwoch Abend die IRIS 2018. Der Roundtable des LII Austria unter dem Vorsitz von Erich Schweighofer und Anton Geist stand unter dem Titel “Ähnlichkeiten, Beziehungen, Vergleiche –
Tools zur inhaltlichen Analyse und Präsentation von Dokumenten”.

Das Panel des LII-Roundtables der IRIS 2018: Anton Geist, Angela Stöger-Frank, Matthias Kraft, Vorsitzender Erich Schweighofer und Blaise Dévaud.

Matthias Kraft zeigte manuelle bzw intellektuelle Lösungen für Textvergleiche von Normen aus den 1980er-Jahren. Schon früh wurde eine solche Funktion in Linde online implementiert, dann Mangels Nutzung entfernt, später unter dem Druck der Konkurrenz wieder implementiert. Beziehungen zwischen Dokumenten werden in Linde online redaktionell hergestellt, wobei standardisierte und typisierte Links verwendet werden.

Download: Präsentation von Matthias Kraft

Anton Geist berichtete von den Entwicklungsschritten bei Lexis Nexis. Related Content wurde ab 2012 dargestellt. Man verstand darunter vor allem die Frage, ob und wo ein Dokument zitiert wird. Die Funktion wurde daher über die Suche nach Passiv-Links realisiert.

Nächster Schritt war die maschinelle Suche nach Ähnlichkeiten im Text und bei den Verlinkungen. So können auch Dokumente gefunden werden, die nicht direkt miteinander verlinkt sind, aber mit gleichen oder ähnlichen dritten Dokumenten. Nach vielen Praxiserfahrungen räumt LexisNexis der Ähnlichkeit bei der Verlinkung inzwischen einen höheren Stellenwert ein, als der Ähnlichkeit im Text.

Im aktuellen Produkt LexisNexis 360° wird im Suchergebnis die klassische Trefferliste nach unten verschoben. Darüber wird ein redaktionell erstelltes Dokument angezeigt, das als wichtige erachtete Dokumente aus der Datenbank referenziert.

Download: Präsentation von Anton Geist

Angela Stöger-Frank präsentierte die vom Evidenzbüro des Bundesfinanzgerichtes geführte Finanzdokumentation. Sie enthält Richtlinien, Erlässe und Entscheidungen des österreichischen Finanzministeriums und der Bundesfinanzgerichte. Dabei werden hohe dokumentarische Anforderungen an die zeitliche Versionierung der Dokumente gestellt und nachfolgend an die Darstellung der Unterschiede zwischen den Versionen.

Download: Präsentation von Angela Stöger-Frank

Blaise Dévaud präsentierte eine Datenbank von Weblaw mit Entscheiden von schweizerischen kantonalen und Bundesgerichten sowie dem EGMR. Die Herausforderung besteht darin, diejenigen Entscheide zu finden, die zu einem Instanzenzug gehören. Das zugrunde liegende Material ist sehr inkonsistent, so dass es kaum möglich ist, Beziehungen zwischen den Entscheiden über das Parsen von Geschäftszahlen oder maschinelle Ähnlichkeitssuche zu ermitteln. Weblaw setzt statt dessen auf Crowd-Sourcing. Engagierte Benutzer haben die Möglichkeit, die Dokumente um Verlinkungen mit anderen Dokumenten zu ergänzen.

Download: Screenshots aus der Präsentation von Blaise Dévaud

Das Gesamtbild der vier Vorträge zeigte, dass je nach Umfeld und Anforderungen die Beziehungen zwischen Dokumenten auf unterschiedlichen Wegen ermittelt werden können. Über die klassische manuelle Verlinkung bei Linde online und Findok über die maschinelle Ähnlichkeitssuche bei LexisNexis bis zum Crowdsourcing bei Weblaw. Wobei jüngst auch bei LexisNexis redaktionell erstellte Ergebnisse wieder in den Vordergrund rücken.