Back to Question Center
0

Semalt Provizas Konsiletojn pri Kiel Trakti Botojn, Araneojn Kaj Kraketojn

1 answers:

Krom krei serĉilon amikajn URLojn, la .htaccess-dosiero permesas al la retejestroj bloki specifajn robotojn de aliri al sia retejo. Unu vojo por bloki ĉi tiujn robotojn estas tra la robotoj.txt-dosiero. Tamen, Ross Barber, la Semalt-9-datita Klienta Sukcesa Administranto, deklaras, ke li vidis iujn kraketojn ignorantajn ĉi tiun peton. Unu el la plej bonaj manieroj estas uzi la .htaccess-dosieron por haltigi ilin de indeksado de via enhavo.

Kiuj estas ĉi tiuj bots?

Ili estas tipo de programaro uzata de serĉiloj por forigi novajn enhavojn de interreto por indeksado.

Ili plenumas la jenajn taskojn:

  • Vizitu retpaĝojn, kiujn vi ligis al
  • Kontrolu vian HTML-kodo por eraroj
  • Ili konservas la retpaĝojn, kiujn vi ligas kaj vidas, kiujn retpaĝoj ligas al via enhavo
  • Ili indeksas vian enhavon

Tamen iuj bots estas malbonaj kaj serĉas vian retejon por retpoŝtaj adresoj kaj formoj, kiuj kutime kutimas sendi al vi nedeziratajn mesaĝojn aŭ spamojn. Aliaj eĉ serĉas sekurecajn flugilojn en via kodo.

Kion oni bezonas por bloki retumpanojn?

Antaŭ ol uzi la .htaccess-dosieron, vi devas kontroli la jenajn aĵojn:

1. Via retejo devas esti kuranta sur Apache-servilo. Nuntempe, eĉ tiuj retejo gastigantaj kompanioj duonaj en sia laboro, donas al vi aliron al la postulita dosiero.

2. Vi devas havi aliron al vi, ke vi estas la krudaj serviloj de via retejo, por ke vi povu lokalizi, kiujn bots vizitis viajn retpaĝojn.

Notu, ke vi ne povos bloki ĉiujn malutilajn botojn krom se vi blokos ĉiujn, eĉ tiujn, kiujn vi konsideras. Novaj robotoj venas ĉiutage, kaj pli malnovaj estas modifitaj. La plej efika maniero estas certigi vian kodon kaj fari ĝin malfacile por robotoj por spamo.

Identiganta botojn

Bots povas esti identigitaj per la IP-adreso aŭ de ilia "Uzanto-Agento-Stringo", kiun ili sendas en la HTTP-kaplinioj. Ekzemple, Google uzas "Googlebot."

Vi eble bezonos ĉi tiun liston kun 302 bots se vi jam havas la nomon de la bot, kiun vi volas resti for uzante .htaccess

Alia maniero estas elŝuti ĉiujn logajn dosierojn de la servilo kaj malfermi ilin per tekst-redaktilo. Ilia loko en la servilo povas ŝanĝi laŭ la agordo de via servilo. Se vi ne povas trovi ilin, serĉu helpo de via retejo gastiganto

Se vi scias, kion paĝo vizitis, aŭ la tempo de vizito, estas pli facile veni kun nedezirata bot. Vi povas serĉi la protokolon kun ĉi tiuj parametroj.

Unufoje, vi rimarkis, kion bots vi devas bloki; Vi povas tiam inkluzivi ilin en la .htaccess-dosiero. Bonvolu noti, ke blokado de la boto ne sufiĉas por deteni ĝin. Ĝi eble revenos kun nova IP aŭ nomo.

Kiel bloki ilin

Elŝuti kopion de la .htaccess-dosiero. Faru rezervojn se necese.

Metodo 1: blokado de IP

Ĉi tiu kodo fragmentigas la boton per IP-adreso 197.0.0.1

Ordo Dedi, Permesi

Denu de 197.0.0.1

La unua linio signifas, ke la servilo blokos ĉiujn petojn, kiuj kunigas la mastrojn, kiujn vi specifis kaj permesos al ĉiuj aliaj.

La dua linio diras al la servilo sendi 403: malpermesitan paĝon

Metodo 2: Blokado de uzantoj

La plej facila maniero estas uzi la reescribaĵon de Apache

ReescribiEngine On

RewriteCond% {HTTP_USER_AGENT} BotUserAgent

RewriteRule. - [F, L]

La unua linio certigas, ke la re-redakta modulo estas ebligita. Linio du estas la kondiĉo, kiun aplikas la regulo. La "F" en linio 4 diras al la servilo redoni 403: Malpermesita dum la "L" signifas ke ĉi tiu estas la lasta regulo.

Vi tiam alŝuti la .htaccess-dosieron al via servilo kaj anstataŭigu la ekzistantan. Kun la tempo, vi bezonos ĝisdatigi la bot-IP. Se vi faros eraron, nur alŝutu la rezervon, kiun vi faris.

November 29, 2017
Semalt Provizas Konsiletojn pri Kiel Trakti Botojn, Araneojn Kaj Kraketojn
Reply