És molt habitual que quan mirem els logs dels nostres llocs web, ens posem les mans al cap i comencem a preocupar-nos. És el cas d'un gran amic, l'Àlvaro d'iSocialWeb, que em comentava aquest matí si sabia per què tenia milers de peticions a la seva pàgina wp-login.php (la pàgina per fer login al panell d'administrador de WordPress). En el seu cas, tenia aquesta pàgina bloquejada per robots.txt, així que segur que no era el Googlebot de Google, ja que es prenen les regles del robots.txt com una obligació.

Les seves regles al robots.txt
Per entendre per què això pot passar, primer hem d'entendre com identifiquem Googlebot. En el seu cas, tenia moltíssims events a aquesta URL:

Events a la URL wp-login.php
En el cas de l'Àlvaro, feia servir l'eina Screaming Frog Log Analyzer, una eina molt potent que interpreta els logs i els agrupa per poder treure conclusions ràpidament.
Un dels problemes d'aquestes eines és que no verifiquen que el Googlebot sigui realment el Googlebot de Google.
Qualsevol persona amb un simple Screaming Frog Crawler pot simular que és Googlebot, i aquesta mateixa pràctica la fan servir molts spammers per fer atacs de força bruta a WordPress, ja que la URL sempre és la mateixa.

Simular Googlebot amb Screaming Frog
Què podem fer per combatre aquest tipus d'atacs?
Li comentava a l'Àlvaro que primer havia de veure si realment es tractava de Googlebot. Per fer-ho, ho podem mirar de dues formes:
En el seu cas era clar, el rang d'IPs no era el mateix.

Logs i IPs des de Screaming Frog Log Analyzer
Així doncs, un altre cas tancat en el qual hem de prendre mesures perquè no ens passi això.
Exemples d'accions a prendre:
- Moure la URL de wp-login.php a una altra URL inventada, així no tenim patrons típics.
- Posar un limitador com per exemple Login Lockdown.
Cas solucionat.
Fins aviat!
Actualització: com veure-ho sense complicar-se amb Screaming Frog Log Analyzer
Gràcies a MJ Cachón per explicar-nos que Screaming Frog Log Analyzer té una columna que marca si un bot és spoofed (fals). Llegeix més sobre això a les notes de la versió 2.0.