Navigationspfad: Startseite > Dokumente & Recherche > Web-Archiv
Signatur des Snapshots: |
5054 |
---|---|
Provenienz des Snapshots: |
Referat PuK 4, Onlinedienste, Parlamentsfernsehen |
Projektbezeichnung des Snapshots: |
Internet |
Anlass des Snapshots: |
Turnus |
Datum des Snapshots: |
19.07.2011 |
Betriebssystem des Snapshots: |
Windows NT WEBARCHIV 5.2 build 3790 |
Downloadtool des Snapshots: |
WinHTTrack Website Copier, 3.43-7 |
Ausgewählte Domain: |
www.bundestag.de |
Ausgeschlossene Domains: | *[name].*[name]das-parlament*[name].*[name]/*, */*dasparlament*/*, *[name].*[name]blickpunkt-bundestag*[name].*[name]/*, */*blickpunkt*/*, *[name].*[name]mitmischen*[name].*[name]/*, *[name].*[name]streamfarm*[name].*[name]/*, *[name].*[name]berlin*[name].*[name]/*, webtv.bundestag*, *[name].*[name]contentforce*[name].*[name]/*, sdc.bundestag.de/*, dip21.bundestag.de/*, dipbt.bundestag.de/*, */*pruefung*/*, suche.bundestag.de/*, */*service/error*/*, */kontakt/kontakt/index*, *service/kontakt/kontakt/index.jsp?mailReceiver*, *ediathek/index.jsp?* |
Interne Linktiefe: |
10 |
Externe Linktiefe: |
0 |
Anzahl der heruntergeladenen Dateien: |
50072 |
Anzahl der heruntergeladenen Ordner: |
5181 |
Größe des Snapshots in Bytes nach dem Download: |
5.7 GiB |
Statistik | angelegt, Statistik ansehen |
Neu hinzugekommene Dateiextensionen: |
|
Größe des Snapshots in Bytes nach dem Konvertierungsvorgang: |
5.8 GiB |
Konvertierungstool des Snapshots (HTML nach XHTML): |
HTML Tidy, HTML Tidy for Windows released on 7 December 2008 |
Parameter des Konvertierungstools: | |
Anzahl der konvertierten Dateien: |
34413 |
Anzahl der Fehlerdateien: |
|
Indexierungstool des Snapshots: |
SWISH-E |
Parameter des Indexier-Programmes: |
IndexFile [INDEXFILEPATH]
IndexDir [INDEXDIRECTORYPATH]
#zu indizierende meta-tags
MetaNames keywords date author description swishdocpath
#zu indizierende dateitypen
IndexOnly .doc .pdf .txt .htm .html .rtf .xml
#dateifilter
FileFilter .pdf /usr/bin/pdftotext $%p -$
IndexContents TXT .pdf
FileFilter .doc /usr/local/bin/catdoc $%p$
IndexContents TXT .doc
#auszuschließende dateien und ordner
FileRules dirname contains METAFILES
#fehlerreport
IndexReport 0 |
Anzahl der ermittelten Schlagworte: |
0 |
Anzahl der Dateien der Edierversion: |
|
Anzahl der Ordner der Edierversion: |
|
Größe der Edierversion in Bytes: |
|
Anzahl der Änderungen: |
0 (zuletzt am ) Änderungen anzeigen |
Anzahl der Anhänge: |
0 (zuletzt am ) Anhänge anzeigen |