Ein einfacher Weg um de.indymedia.org zu archivieren

von: anonym am: 22.10.2023 - 15:33

Themen:

Ein einfacher Weg um Artikel von de.indymedia zu archivieren, unter Verwendung nur eines Programms (wget)

Da in einem Kommentar vor kurzem danach gefragt wurde, hier eine kurze und einfache Anleitung um Artikel von de.indymedia.org zu archivieren:

-benötigt wird ein Computer mit Internetzugang, und ein Linuxterminal (die WindowsbenutzerInnen nehmen hier ihr Linuxsubsystem)
-ferner braucht ihr das Programm "wget". Sollte es nicht installiert sein, müsst ihr das tun, zB. mit dem Befehl "sudo apt install -y wget" (der Befehl ist für Debian, ggf. anpassen)
-ferner braucht ihr die Textdatei die an diesen Artikel angehängt ist (indylinks.txt). Diese enthält die Links aller Artikel ab ca. 2014 (also die im jetzigen System gepostet wurden), beginnend mit dem neuesten Artikel.
-in dem Verzeichnis in dem die Textdatei nach dem Download liegt, schreibt ihr dann den folgenden Befehl "wget --wait=2 --limit-rate=200K --adjust-extension -i indylinks.txt"
-Erklärungen:
-wait=2: verzögert die Anfragen, um den Server nicht zu überlasten
-limit-rate=200k : limitiert die Downloadgeschwindigkeit, aus demselben Grund
-adjust-extension : speichert die empfangenen Dateien mit der Erweiterung html
-i indylinks.txt : definiert die Datei mit den Links

Im Ergebnis hat Mensch ca. 19000 html-Dateien in einem Verzeichnis. Diese können lokal aufgerufen und durchsucht werden. Die Bilder und anderen Dateien sind bei dieser Methode allerdings nicht enthalten. Ebenfalls werden keine css-Dateien oder ähnliches heruntergeladen (das Layout der lokalen Dateien ist also "roh", nur der Text).

Um einen vollständigen Spiegel mit Dateien und allem zu erstellen, kann entweder diym_php verwendet werden (siehe hier: https://de.indymedia.org/tutorial/285694) oder ein anderes Programm (zB. httrack : https://www.httrack.com/).

Die beschriebene Methode über die Links zu den einzelnen Artikeln ist allerdings ein einfacherer und schnellerer Weg.

Fröhliches Spiegeln.

dreamer

PS: dieser Artikel wurde zuerst hier gepostet: http://hq73inugsyl5pzhnbm2uonuq6h2veztdhicvoiefhlofrzbbwa57xsad.onion/no...,
die entsprechende Datei liegt hier: http://hq73inugsyl5pzhnbm2uonuq6h2veztdhicvoiefhlofrzbbwa57xsad.onion/no...

Datei: