PHP Skript Nr. 1
3.09.2007 von Michael Seitz
Tags: content, crawler, domain, hp, ip, laufen, parameter, php, ram, skript
Gestern bin ich mit meinem ersten Skript fertig geworden.
Es war nichts großes, lediglich ein Skript das sich eine Webseite holt und diese dann wieder ausgiebt.
Das sieht dann folgendermaßen aus:
Was für mich interessant war, ist die Art der Parameterübergabe. Die Url wird dem Skript im Aufruf der Url (z.B. “skript.php?url=aufzurufende_url.html“) übergeben.
Wie gehts nun weiter? Ich werde ein Crawlerskript bauen, ich will alle Webseiten einer Domain finden und in einer Liste ausgeben Worauf ich achten werde ist auf jeden Fall die Suchtiefe, verlinkte Kalender können jeden Stack überlaufen lassen. ![]()


Huh… erstmal würde ich den Server anders konfigurieren, so dass register_globals=off ist (hat Sicherheitshintergründe) und dann würde/müsste ich das Script ändern, so dass die superglobals genutzt werden
content = file_get_contents($_GET['url']);
und zwar mit den Hochkommas….#
In nur einem kleinen Skript… soviele Fehler
. Die Lernkurve ist wohl noch steil 
hihi, der einzige Fehler ist wohl nur ein schlecht konfigurierter Server. So kann dir jeder eine uninitialisierte Variable überschreiben, bzw. es kommen jede Menge “Warnings” und “Notices” wenn du das error-reporting ein wenig aufdrehst.
Du solltest eigentlich immer mit “error_reporting(E_ALL | E_STRICT);” programmieren. Das erspart dir viele Fehler und Sicherheitslücken
Crawler auch für Fremde URLS oder nur deine Seiten, bei anderen Seiten würde ich dir empfehlen die Seiten mit CURL einzulesen.
Da werde ich wohl curl nehmen müssen…
Warum das Rad neu erfinden? Eventuell solltest Du Dir einmal wget ansehen …