Google, Formulare, SEO und noindex
Mal eine Frage: Seit geraumer Zeit indexiert Google nun Webseiten, die hinter Formularen liegen. Bis dies Standards sein wird, dauert es nicht mehr lang. Wie aber setze ich für einzelne Links den Attributswert “noindex“?
Oder ganz konkret: Nehmen wir an, ich habe eine Datenbank mit den Feldern “Name”, “Wohnort” und “Hobby”, deren 20 Datensätze auf der Seite index.html ausgegeben werden.
Ebenfalls auf der Seite index.html gibt es die Möglichkeit, die Datenbank gefiltert auszugeben: Über ein Formular kann ich beispielsweise auswählen “Nur 5 Datenbankeinträge anzeigen”. In diesem Fall wird wieder die index.html angezeigt, diesmal nur mit 5 Einträgen.
Bisher nicht weiter problematisch, doch seit Google auch “forms” mit einbezieht, landen Filterergebnis-URL im Suchindex. Nun kann ich natürlich per robots.txt einzelne Seiten ausschließen, das möchte ich aber nicht - die index.html soll schließlich weiterhin im Index sein. Direkt in der Datei noindex anzugeben funktioniert aus dem selben Grund nicht. Und Einzelne Links direkt im Formular auf noindex zu setzen geht schlichtweg nicht.
Was tun? Habe ich etwas übersehen? Wie kann ich das Problem lösen? Noch bin ich ratlos.

man sollte seiten mit filteroptionen so aufbauen, das die filter nach dem schema index.html?filter=5 aufgebaut werden. so kann man dann über die robots.txt alle seiten mit einem “?” ausschließen (http://www.google.de/support/webmasters/bin/answer.py?answer=40367). Glaubt man verschiedenen Quellen (z.B. http://blog.techdivision.com/google-kann-nun-formulare-ausfullen/) so indiziert google nur formular die keine personalisierten daten verlangen und über method=”GET” abgeschickt werden (siehe z.B. wordpress Suchfeld). Somit sollte ein großteil aller formulare gar nicht indiziert werden, da diese über method=”POST” abgeschickt werden. überlegt man jetzt weiter, kann man natürlich auch die website so programmieren, dass wenn ein filter abgeschickt wird die robots in den meta-tags auf “noindex,follow” gesetzt werden. so werden die seiten nicht indiziert und der bot folgt trotzdem den links. bezogen auf wordpress existieren genug plugins, die dies schon automatisch machen bzw. wo man dies einstellen kann.
Danke für die Antwort - leider hilft mir das nur bedingt weiter, da es sich im ganz konkreten Fall um eine Software “out of the box” handelt, an der ich nur ungern tiefgreifende Änderungen durchführe. Beim Hersteller den Fehler anmerken: Ja, schon erledigt
Die ganz allgemeine Frage ist damit jedoch noch nicht gelöst: Gibt es eine Möglichkeit, Links hinter GET-Formulare ohne dem Umweg Metatag und robots.txt auszuschließen, sprich über ein mit übergebenes Attribut im Verweis?