Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Fraunhofer-Publica - Kompetenzdatenbank der angewandten Forschung

Fraunhofer-Publica - referencing applied research competencies
 
: Harmsen, B.; Leiter, A.

Information - Wissenschaft & Praxis 60 (2009), No.3, pp.151-154
ISSN: 1434-4653
German
Journal Article
Fraunhofer IRB ()
Datenbank; Forschung; Erschließung; Qualität; Suchmaschine; Harvesting

Abstract
Fraunhofer-Publica ist die multidisziplinäre, bibliographische Referenzdatenbank für die Veröffentlichungen der Fraunhofer-Gesellschaft, der größten Europäischen Trägerorganisation für angewandte Forschung, und ihre Mitarbeiter. Die Datenbank wurde 1988 ins Leben gerufen und 1991 um Patente ergänzt. Erstmals 1995 übers World Wide Web frei verfügbar, enthält sie seit 1999 auch Volltext-Dokumente. Seit 2005 ist sie "Open Archive Data Provider". Vor kurzem wurde die Web-Oberfläche überarbeitet, wodurch die Zugriffsmöglichkeiten für Suchmachinen-Robots erheblich verbessert werden konnten und Publica-Zitate nun in Google, MSN und in anderen Web-Datenbanken leichter auffindbar sind. 80% der heutigen Publica-Nutzung wird über Suchmaschinen vermittelt.

Das Fraunhofer-Publica Team orientiert sich an vier Qualitätsmerkmalen für die Datenbankproduktion: Beschaffbarkeit der Originaldokumente, Vollständigkeit / Aktualität, Konsistenz der Metadaten und die Verbreitung der Publica-Inhalte. Dies verlangt akkurate Quellangaben, möglichst den Nachweis von IDs wie DOI oder URN sowie möglichst direkte Volltextlinks. Das Optimum im Bezug auf Beschaffbarkeit stellen freie Downloads dar. Was das Kriterium "Verbreitung" anbelangt, werden sowohl das "Harvesten" der Datenbank als auch die direkte Indexierung durch Robots unterstützt. Das Google-Ranking der Listen und Einzeldokumente ist jedoch schlecht, weil sie keine individuellen Titel haben. Deshalb wird als wichtigste Verbesserung angestrebt, individuelle Titel im HTML-Header für Listen und Einzelanzeigen zu generieren. Obwohl das "Harvesting" der Fraunhofer-Publica seit 2005 möglich ist, gibt es nach wie vor keine "Daten-Sets", d.h. fachspezifische Selektionsmöglichkeiten, die wichtig wären, um wissenschaftlichen Fachportalen zuzuarbeiten. Um dies zu ermöglichen, müssen nachträglich ca. 112.000 Publica-Dokumenten grobe DDC-Klassen bis zur 3.Ebene zugeordnet werden.

 

Fraunhofer-Publica is the multidisciplinary, bibliographic reference database for publications of the Fraunhofer-Gesellschaft, Europe's largest research organization for applied research. Started in 1988, Fraunhofer-Publica was first augmented with patent information in 1991, then launched on the World Wide Web in 1995, added full text documents in 1999, and finally became an "Open Archive Data Provider" in 2005. The Fraunhofer-Publica Web interface was recently re-designed to better support "robots", so that Publica citations can now be found by Google, MSN, and other web databases. Today, these "search engines" provide for 80% of the total usage of the database.

The Fraunhofer-Publica team has defined four major quality criteria for the database: availability of full texts that are cited in the database, comprehensiveness / actuality, metadata consistency and dissemination of its contents. These criteria require accurate source data, and the inclusion of IDs, like DOI or URN, if available. Freely accessible downloads are the optimum for high availability. As for dissemination, Fraunhofer-Publica reports can be directly accessed and indexed by "robots" or harvested to include data in other metadata repositories. The Google ranking of Publica lists and single citations is still poor for lack of individual page titles. Hence, the primary improvement will be the provisioning of individual titles in HTML headers for all lists and documents. Although supporting metadata harvesting since 2005, still no "sets" - i.e. subject areas - are defined, which would be needed to serve specific scientific communities. To achieve this about 112.000 documents will need to be retrospectively classified by assigning DDC classes down to the level of section codes.

: http://publica.fraunhofer.de/documents/N-93809.html