Start des Europeana Newspapers Projekts

Pressemitteilung, Berlin, 1. Juli 2012  

Im Rahmen des Europeana Newspapers Projekts machen sieb­zehn euro­päi­sche Partnerinstitutionen in den nächs­ten drei Jahren mehr als 18 Millionen Zeitungsseiten über das Online-Portal Europeana zugäng­lich. Europeana bil­det ein zen­tra­les Verzeichnis von über 23 Millionen digi­ta­li­sier­ten Büchern, Gemälden, Filmen, Ausstellungsstücken sowie Archivalien aus ganz Europa.

Das Europeana Newspapers Projekt wird geför­dert vom Competitiveness and Innovation Framework Program 2007-2013 der Europäischen Kommission und wird über The European Library digi­ta­li­sierte Zeitungsbestände zusam­men­stel­len und diese tech­nisch auf­be­rei­tet präsentieren.

Das Hauptziel des Projekts besteht darin, den Nutzern die Zeitungsinhalte über einen Content Browser mit spe­zi­el­ler Suchoberfläche direkt zugäng­lich zu machen. Der Content Browser wird in das Europeana Portal inte­griert und das Suchen nach ein­zel­nen Wörtern oder nach Wortfolgen inner­halb der Zeitungstexte ermög­li­chen. Dies geht weit über die Suchmöglichkeiten her­kömm­li­cher Bibliothekskataloge hin­aus, in denen nor­ma­ler­weise nur anhand des Datums oder des Zeitungstitels gesucht wer­den kann. Der direkte Zugriff auf die digi­ta­li­sier­ten Zeitungsinhalte erspart den Nutzern zudem den Gang in Sonderlesesäle, in denen his­to­ri­sche Zeitungen für gewöhn­lich nur unter stren­gen Nutzungsbedingungen bereit­ge­stellt werden.

Das Projekt kon­zen­triert sich auf die spe­zi­fi­schen tech­ni­schen Herausforderungen bei der Aufbereitung digi­ta­li­sier­ter Zeitungen wie Optical Character Recognition (OCR), Optical Layout Recognition (OLR), named entity reco­gni­tion (NER), Artikelsegmentierung sowie der Klassifizierung von Seiten. OCR bezeich­net die elek­tro­ni­sche Umwandlung gescann­ter Texte in maschinen-lesbare Zeichen. OLR ermög­licht die Identifizierung und Trennung ein­zel­ner Artikel auf einer gescann­ten Zeitungsseite mit meh­re­ren Artikeln. Durch NER kön­nen die Zeitungstexte nach nor­mier­ten Einheiten wie Personennamen, Körperschaften oder Geographika durch­sucht werden.

Im Rahmen des Projekts wer­den außer­dem die Qualität der genann­ten tech­ni­schen Verfahren eva­lu­iert sowie Empfehlungen für die Umwandlung loka­ler Metadaten in das Europeana Data Model ent­wi­ckelt, indem ein Netzwerk aus pri­va­ten und öffent­li­chen Einrichtung auf­ge­baut wird.

Das Europeana Newspapers Projekt wird von der Staatsbibliothek – Preußischer Kulturbesitz koor­di­niert. Aktuelle Informationen wer­den unter www.europeana-newspapers.eu bereit­ge­stellt. Für wei­tere Informationen wen­den Sie sich bitte über info@europeana-newspapers.eu an Hans-Jörg Lieder oder Thorsten Siegmann an der Staatsbibliothek zu Berlin.

Projektpartner:

  • Staatsbibliothek zu Berlin
  • National Library of the Netherlands
  • National Library of Estonia
  • Öster­rei­chi­sche Nationalbibliothek
  • University of Helsinki, National Library of Finland
  • Staats- und Universitätsbibliothek Hamburg
  • National Library of France
  • National Library of Poland
  • CCS Content Conversion Specialists GmbH
  • LIBER Foundation
  • National Library of Latvia
  •  National Library of Turkey
  • University of Beograd
  • Universität Innsbruck
  • Dr. Friedrich Tessmann Library
  •  The British Library
  • University of Salford
  • The European Library

Europeana in Kürze:

Europeana ist eine mehr­spra­chige online zugäng­li­che Sammlung von meh­re­ren Millionen digi­ta­li­sier­ten Objekten aus euro­päi­schen Museen, Bibliotheken, Archiven und Filmsammlungen.

Aktuell ermög­licht Europeana den Zugang zu über 23 Millionen Büchern, Filmen, Gemälden, Museumsobjekten und Archivalien aus 2.200 euro­päi­schen Kulturinstitutionen.

www.europeana.eu

Dieser Beitrag wurde unter Digitalisierung, Europeana, Zeitung/Zeitschriften veröffentlicht. Setze ein Lesezeichen auf den Permalink.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>