Navigationspfad: Startseite > Dokumente & Recherche > Web-Archiv
Dieser Snapshot wurde aus rechtlichen Gründen oder zur Verbesserung der Benutzbarkeit verändert und entspricht nicht mehr der originalen Fassung. Die Art der Änderung(en) wird innerhalb des Snapshots über den Link "Änderungen" in der roten Kopfzeile sichtbar.
Signatur des Snapshots: |
5054 |
---|---|
Provenienz des Snapshots: |
Referat PI 4, Onlinedienste, Parlamentsfernsehen |
Projektbezeichnung des Snapshots: |
Intranet |
Anlass des Snapshots: |
Ereignis |
Ereignis des Snapshots: |
|
Begleitinformationen: |
Beim Konvertieren des Datenbstandes fiel auf, dass im verzeichniss aktuell/bp/... viele html-dateien liegen,
die eigentlich nur fehlerseiten sind und ausschliesslich externe links beinhalten. normalerweise stellte sich beim konvertieren der datensätze eine anzahl von etwa 2.700 externen links heraus. der datensatz mit der id 56 enthäölt über 15.000 externe links.
in dem auffälligen verzeichniss liegen etwa 5.000 html-dateien mit je etwa 10 externen links. jedoch ist nur
einer dieser externen links von datei zu datei unterschiedlich, sodass dadurch etwa 5.000 externe links mehr erklärt werden können (die anderen links werden durch eine überprüfungsroutine nicht mehrfach in die datenbank eingetragen, sondern schon bestehende einträge mit gleicher url verwendet).
bleiben noch etwa 7.200 weitere externe links, die in anderen verzeichnissen liegen müssen.
eine datenbank-analyse brachte als ergebnis, dass etwa 7.400 externe link-einträge vorhanden sind, die auf das
cgi-bin-verzeichnis verweisen und wie folgt gestaltet sind: http://www.bundestag.de/cgi-bin/drs.pl?... es muss untersucht werden, aus welchen dateien diese links stammen.
auffällig ist weiterhin, dass die beschriebenen fehlerseiten in diesem snapshot absolute links (somit vom system als extern erkannte links) enthalten, in vorhergehenden snapshots jedoch relative links enthielten. was bewirkte diese veränderung? |
Datum des Snapshots: |
22.02.2005 |
Betriebssystem des Snapshots: |
MS WinXP, SP2 |
Downloadtool des Snapshots: |
WinHTTrack Website Copier, 3.43.3.0 |
Ausgewählte Domain: |
www.bundestag.de |
Ausgeschlossene Domains: | dip.bundestag.de |
Interne Linktiefe: |
9999 |
Externe Linktiefe: |
0 |
Anzahl der heruntergeladenen Dateien: |
86207 |
Anzahl der heruntergeladenen Ordner: |
7512 |
Größe des Snapshots in Bytes nach dem Download: |
2.9 GiB |
Statistik | angelegt, Statistik ansehen |
Neu hinzugekommene Dateiextensionen: |
|
Größe des Snapshots in Bytes nach dem Konvertierungsvorgang: |
3.0 GiB |
Konvertierungstool des Snapshots (HTML nach XHTML): |
HTML Tidy, HTML Tidy for Windows released on 7 December 2008 |
Parameter des Konvertierungstools: | |
Anzahl der konvertierten Dateien: |
64703 |
Anzahl der Fehlerdateien: |
|
Indexierungstool des Snapshots: |
SWISH-E |
Parameter des Indexier-Programmes: |
IndexFile [INDEXFILEPATH] IndexDir [INDEXDIRECTORYPATH] MetaNames keywords date author description swishdocpath IndexOnly .doc .pdf .txt .htm .html .rtf .xml IndexContents TXT* .pdf FileFilter .pdf :/programme/SWISH-E/bin/pdftotext.exe$ $\'%p\' -$ IndexContents TXT* .doc FileFilter .doc :/programme/SWISH-E/bin/catdoc.exe$ $\'%p\'$ FileRules filename is error.html FileRules filename is config.txt FileRules dirname is METAFILES FileRules filename is new.txt IndexReport 0 |
Anzahl der ermittelten Schlagworte: |
599450 |
Anzahl der Dateien der Edierversion: |
86213 |
Anzahl der Ordner der Edierversion: |
7512 |
Größe der Edierversion in Bytes: |
3325610986 |
Anzahl der Änderungen: |
5 (zuletzt am 2016-09-13) Änderungen anzeigen |
Anzahl der Anhänge: |
0 (zuletzt am ) Anhänge anzeigen |