Update: Nationalbibliothek speichert das Internet

Wie ich bereits hier schrieb, sieht sich die Nationalbibliothek vor der Aufgabe, eine Richtlinie umzusetzen, die die Einreichung von Publikationen im Internet fordert.

 

Wie Heise nun verlautet, hat sich die Nationalbibliothek erklärt, und die Meldungen der letzten Tage stark eingeschränkt. Hauptsächlich bezöge sich die Richtlinie auf im Internet veröffentlichte Einzelarbeiten wie z.B. Diplom- und Magisterarbeiten, E-Books, Zeitschriften, o.ä. 

Diese könnten auch über eine entsprechend eingerichtete oder einzurichtende Schnittstelle übertragen werden. So reiche es in der Regel lediglich Metadaten und URL anzugeben. Die Nationalbibliothek läd sich das Dokument dann selbstständig herunter und nimmt es in den Index auf.

 

News Seiten, die regelmäßig relevanten Content produzieren, können sich direkt an die Nationalbibliothek wenden, um ein Verfahren und Intervall abzusprechen.

 

Blog- und Forenbetreiber jedoch brauchen sich erst einmal keine Gedanken machen: “Die Nationalbibliothek geht hier eigeninitativ vor. Wir planen Harvesting-Methoden, die eine automatisierte Sammlung kompletter Website erlauben”, sagt Jockel, Sprecher der Nationalbibliothek. Scheinbar wird dann ein Crawler eingesetzt, der geflaggte Sites regelmäßig abgrast und indexiert.

Wäre wünschenswert, wenn wir damit nicht belästigt werden, und sich unsere geistigen Ergüsse nicht irgendwo als Datenleichen ansammeln. Was passiert z.B. mit Überarbeitungen von Artikeln? Was passiert mit Kommentaren? Werden die Daten auch ausgewertet oder nur angesammelt und archiviert? Haben die noch nie was von RSS gehört?

 

Fragen über Fragen. :D