Na razie mam ok. 290 podstron, szacuję, że jeszcze kilkadziesiąt jest możliwych do pobrania.
Niestety z braku czasu nie udało mi się popracować nad sprawą od poprzedniego wpisu... Może w ten weekend się uda.
Tym co udało się (i jeszcze się ewentualnie uda) oczywiście się podzielę - mam nadzieję, że Pan Krzysztof nie będzie miał nic przeciwko.
Ciekawe WWW
Ciekawe WWW
Republika marzeń...
-
Krzysztof Gerlach1
- Posty: 9
- Rejestracja: 2025-12-03, 20:19
Ciekawe WWW
Oczywiście, że nie mam nic przeciwko! Po to je przez lata zamieszczałem, aby każdy mógł bez kłopotu skorzystać, nie tracąc czasu i pieniędzy.
KG
KG
Ciekawe WWW
Popracowałem w weekend, efekty poniżej w spakowanych plikach do pobrania z mojego dysku Google.
Niestety, tak jak przypuszczałem, na archive.org są tylko strzępki oryginalnych treści
Większość (albo nawet wszystkie? nie sprawdzałem zbyt dokładnie...) treści została zarchiwizowana po raz ostatni w 2021 r.
Udało mi sie pobrać 310 plików html (czyli stron z postami) i 14 załączników (w plikach jpg, ale raczej niepodlinkowanych w plikach html). Objętość po rozpakowaniu to prawie 30 MB.
Jakoś "dziko" te linki się wyświetlają - najlepiej w prawym górnym rogu "pseudoobrazka" kliknąć "Otwórz w nowej karcie" i stamtąd pobrać spakowany plik.
Pliki html+jpg:
Dodatkowo poniżej spakowany wykaz linków, które mimo istnienia w zestawach linków tak naprawdę nie są dostępne:
Zestawy linków do pobierania tworzyłem na 3 sposoby:
- LinkGopherem (dodatek do Mozilli Firefox)
- z wykazu dostępnego pod adresem http://web.archive.org/web/*/http://www ... s.fora.pl/* (uwaga: u mnie często występował błąd ładowania takiego zestawu)
- i wreszcie manualnie przeklikując wszystkie (!) łącza do stron tematów i podstron z kolejnymi postami i kopiując ich linki.
Oczywiście bardzo dużo z nich się powielało, ale trafiały się "niespodzianki" w postaci adresów które były tylko w jednym zestawie, a nie figurowały w dwóch innych.
W pobranych plikach html nie crosslinkowałem zawartości - oznacza to, że wszelkie elementy graficzne, skrypty i style CSS są po otwarciu strony z lokalnego dysku w przeglądarce "dociągane" z archive.org.
Także wszelkie łącza w tych plikach kierują nie do pliku na dysku, a na odpowiednią stronę w archive.org.
Niestety, tak jak przypuszczałem, na archive.org są tylko strzępki oryginalnych treści
Większość (albo nawet wszystkie? nie sprawdzałem zbyt dokładnie...) treści została zarchiwizowana po raz ostatni w 2021 r.
Udało mi sie pobrać 310 plików html (czyli stron z postami) i 14 załączników (w plikach jpg, ale raczej niepodlinkowanych w plikach html). Objętość po rozpakowaniu to prawie 30 MB.
Jakoś "dziko" te linki się wyświetlają - najlepiej w prawym górnym rogu "pseudoobrazka" kliknąć "Otwórz w nowej karcie" i stamtąd pobrać spakowany plik.
Pliki html+jpg:
Dodatkowo poniżej spakowany wykaz linków, które mimo istnienia w zestawach linków tak naprawdę nie są dostępne:
Zestawy linków do pobierania tworzyłem na 3 sposoby:
- LinkGopherem (dodatek do Mozilli Firefox)
- z wykazu dostępnego pod adresem http://web.archive.org/web/*/http://www ... s.fora.pl/* (uwaga: u mnie często występował błąd ładowania takiego zestawu)
- i wreszcie manualnie przeklikując wszystkie (!) łącza do stron tematów i podstron z kolejnymi postami i kopiując ich linki.
Oczywiście bardzo dużo z nich się powielało, ale trafiały się "niespodzianki" w postaci adresów które były tylko w jednym zestawie, a nie figurowały w dwóch innych.
W pobranych plikach html nie crosslinkowałem zawartości - oznacza to, że wszelkie elementy graficzne, skrypty i style CSS są po otwarciu strony z lokalnego dysku w przeglądarce "dociągane" z archive.org.
Także wszelkie łącza w tych plikach kierują nie do pliku na dysku, a na odpowiednią stronę w archive.org.
Republika marzeń...