Direkt zum Inhalt springen

Service-Navigation

Sprache ändern

  • English
  • Français
  • Leichte Sprache

Service-Links

  • Hilfe
  • Inhaltsübersicht
  • Kontakt
 
Bildwortmarke: Deutscher Bundestag
 


 
 
 

Navigationspfad: Startseite > Dokumente & Recherche > Web-Archiv

Web-Archiv des Deutschen Bundestages

Snapshot vom 22.02.2005

Dieser Snapshot wurde aus rechtlichen Gründen oder zur Verbesserung der Benutzbarkeit verändert und entspricht nicht mehr der originalen Fassung. Die Art der Änderung(en) wird innerhalb des Snapshots über den Link "Änderungen" in der roten Kopfzeile sichtbar.


Snapshot ansehen

 

Zurück zur Übersicht

 

Metadaten des Snapshots
Signatur des Snapshots: 5054
 
Provenienz des Snapshots: Referat PI 4, Onlinedienste, Parlamentsfernsehen
 
Projektbezeichnung des Snapshots: Intranet
 
Anlass des Snapshots: Ereignis
 
Ereignis des Snapshots:
 
Begleitinformationen: Beim Konvertieren des Datenbstandes fiel auf, dass im verzeichniss aktuell/bp/... viele html-dateien liegen, die eigentlich nur fehlerseiten sind und ausschliesslich externe links beinhalten. normalerweise stellte sich beim konvertieren der datensätze eine anzahl von etwa 2.700 externen links heraus. der datensatz mit der id 56 enthäölt über 15.000 externe links. in dem auffälligen verzeichniss liegen etwa 5.000 html-dateien mit je etwa 10 externen links. jedoch ist nur einer dieser externen links von datei zu datei unterschiedlich, sodass dadurch etwa 5.000 externe links mehr erklärt werden können (die anderen links werden durch eine überprüfungsroutine nicht mehrfach in die datenbank eingetragen, sondern schon bestehende einträge mit gleicher url verwendet). bleiben noch etwa 7.200 weitere externe links, die in anderen verzeichnissen liegen müssen. eine datenbank-analyse brachte als ergebnis, dass etwa 7.400 externe link-einträge vorhanden sind, die auf das cgi-bin-verzeichnis verweisen und wie folgt gestaltet sind: http://www.bundestag.de/cgi-bin/drs.pl?... es muss untersucht werden, aus welchen dateien diese links stammen. auffällig ist weiterhin, dass die beschriebenen fehlerseiten in diesem snapshot absolute links (somit vom system als extern erkannte links) enthalten, in vorhergehenden snapshots jedoch relative links enthielten. was bewirkte diese veränderung?
 
Datum des Snapshots: 22.02.2005
 
Betriebssystem des Snapshots: MS WinXP, SP2
 
Downloadtool des Snapshots: WinHTTrack Website Copier, 3.43.3.0
 
Ausgewählte Domain: www.bundestag.de
 
Ausgeschlossene Domains: dip.bundestag.de
Interne Linktiefe: 9999
 
Externe Linktiefe: 0
 
Anzahl der heruntergeladenen Dateien: 86207
 
Anzahl der heruntergeladenen Ordner: 7512
 
Größe des Snapshots in Bytes nach dem Download: 2.9 GiB
 
Statistik angelegt, Statistik ansehen
Neu hinzugekommene Dateiextensionen:
Größe des Snapshots in Bytes nach dem Konvertierungsvorgang: 3.0 GiB
 
Konvertierungstool des Snapshots (HTML nach XHTML): HTML Tidy, HTML Tidy for Windows released on 7 December 2008
 
Parameter des Konvertierungstools:
Anzahl der konvertierten Dateien: 64703
 
Anzahl der Fehlerdateien:
 
Indexierungstool des Snapshots: SWISH-E
 
Parameter des Indexier-Programmes: IndexFile [INDEXFILEPATH] IndexDir [INDEXDIRECTORYPATH] MetaNames keywords date author description swishdocpath IndexOnly .doc .pdf .txt .htm .html .rtf .xml IndexContents TXT* .pdf FileFilter .pdf :/programme/SWISH-E/bin/pdftotext.exe$ $\'%p\' -$ IndexContents TXT* .doc FileFilter .doc :/programme/SWISH-E/bin/catdoc.exe$ $\'%p\'$ FileRules filename is error.html FileRules filename is config.txt FileRules dirname is METAFILES FileRules filename is new.txt IndexReport 0
 
Anzahl der ermittelten Schlagworte: 599450
 
Anzahl der Dateien der Edierversion: 86213
 
Anzahl der Ordner der Edierversion: 7512
 
Größe der Edierversion in Bytes: 3325610986
 
Anzahl der Änderungen: 5 (zuletzt am 2016-09-13)
Änderungen anzeigen
 
Anzahl der Anhänge: 0 (zuletzt am )
Anhänge anzeigen
 


  • Impressum |
  • Datenschutz

Seitenanfang


 
 

© Deutscher Bundestag