und zwar möchte ich gerne mit einem cron alle 5 min prüfen ob eíne website sich verändert hat. Habt ihr eine Idee wie ich so etwas realisiere?
Mir würde ein ablauf und evtl eine liste der benötigten funktionen reichen hab mal wieder gedankensperre
Lad die Seite einmal und speicher einen MD5-String davon.
Lad die Seite ein zweites Mal, generiere einen MD5-String und vergleich die Strings. Wenn sich was verändert hat, unterscheiden sich auch diese.
Finde ich persönlich einfacher, als die komplette Seite in einer Datei zu speichern, um dann zu überprüfen.
Sende dem Server die letzte Änderungszeit, wenn er mit 304 NOT MODIFIED antwortet, ist die Seite nicht geändert.
Hängt natürlich von der Qualität der Seite ab…
jo, wenn die Seite mit PHP generiert ist und eine Anzeige wie hier im Forum existiert:
“Aktuelle Zeit: 2. Apr 2010, 02:30”
Dann würde sich die Seite ohnehin jede Minute verändern… oder vll sogar jede Sekunde wenn ein Sekundenanzeige vorhanden ist.
Handelt es sich um eine statische Seite empfiehlt sich die Variante die michi7x7 vorgeschlagen hat.
Man sendet die HTTP Header Zeile “If-Modified-Since” mit einem Datum im RFC-2822 Format (z.B. “Thu, 21 Dec 2000 16:01:07 +0200”) und man sollte ein “304 Not Modified” im Gegenzug erhalten, wenn sich die Seite seit dem angegebenen Datum nicht verändert hat.