{"id":9413,"date":"2012-10-09T16:50:07","date_gmt":"2012-10-09T14:50:07","guid":{"rendered":"http:\/\/\/\/sitestory.dk\/wordpress\/?p=9413"},"modified":"2015-01-01T12:48:02","modified_gmt":"2015-01-01T11:48:02","slug":"hvordan-man-blokerer-robotter-og-afskum-med-htaccess","status":"publish","type":"post","link":"https:\/\/sitestory.dk\/wordpress\/2012\/10\/09\/hvordan-man-blokerer-robotter-og-afskum-med-htaccess\/","title":{"rendered":"Hvordan man blokerer robotter og afskum med htaccess"},"content":{"rendered":"<p><strong>En lille tekstfil kan fungere som portner til din hjemmeside. Den kan afvise uartige s\u00f8gerobotter, forhindre hotlinks til billeder o.m.a.<\/strong><\/p>\n<p>Dette er det sidste (i hvert fald forel\u00f8big!) n\u00f8rdede indl\u00e6g om u\u00f8nskede g\u00e6ster p\u00e5 hjemmesiden. I de f\u00f8rste skrev jeg om, hvordan man kan kortl\u00e6gge den u\u00f8nskede trafik, og dette handler om, hvordan man kan blokere for den.<\/p>\n<p>Som jeg f\u00f8r har skrevet (links nederst i dette indl\u00e6g), er der masser af s\u00f8gerobotter, der gennemtrawler dit websted. Nogle er artige og nyttige, mens andre i bedste fald kun bruger masser af b\u00e5ndbredde.<\/p>\n<p>Uartige robotter bl\u00e6ser p\u00e5, hvad du skriver i <a title=\"Om robots.txt\" href=\"http:\/\/www.robotstxt.org\/robotstxt.html\" target=\"_blank\">robots.txt<\/a>, og kan kun holdes ude ved at formene dem adgang. Det kan man normalt g\u00f8re med en lille tekstfil, hvis man bor p\u00e5 en Apache-server.<\/p>\n<p>Tekstfilen hedder \u201d.htaccess\u201d og har intet \u201dfornavn\u201d. Den indeholder ordrer til serveren og fungerer som portner, n\u00e5r nogen banker p\u00e5 d\u00f8ren til dit websted. Man kan styre utrolig meget, men her koncentrerer jeg mig om adgang generelt samt sikkerhed i WordPress.<\/p>\n<h3>Blokering af IP-adresser<\/h3>\n<p>Kommandoerne i .htaccess er ofte kompliceret \u201dkinesisk,\u201d men at formene IP-adresser adgang er uhyre enkelt. Man skriver simpelthen linjer med: \u201ddeny from\u201d og s\u00e5 en IP-adresse. Fx:<\/p>\n<pre>deny from 95.108.151.244\r\ndeny from 178.154.243.100<\/pre>\n<p>hvor 95.108.151.244 og 178.154.243.100 er to af de IP-adresser, som bruges af den russiske s\u00f8gemaskine Yandex. Yandex er ikke lyssky, men den er uopdragen, bruger en hulens masse b\u00e5ndbredde og bringer ikke trafik af den type, jeg \u00f8nsker.<\/p>\n<p>Hvis jeg i stedet for 178.154.243.100 skrev 178.154.243., ville jeg blokere alle adresser mellem 178.154.243.0 og 178.154.243.250. Den teknik har jeg fx brugt mod en vifte af kinesiske og ukrainske IP-adresser, som er forslugne og\/eller ondsindede.<\/p>\n<p>Mange hacker- eller spamrobotter, som bes\u00f8ger min side, kommer fra netop Kina og Ukraine, og de uopdragne s\u00f8gemaskiner, BaiduSpider (Kina) og Arefsbot (Ukraine), er heller ikke velkomne. Jeg ser ingen fordele ved deres indeksering.<\/p>\n<p>Blokering af IP-adresser er simpelt, men stormasket og primitivt sammenlignet med mere raffinerede metoder. Men de raffinerede metoder virker m\u00e5ske ikke p\u00e5 din server, og risikoen for fejl er st\u00f8rre.<\/p>\n<p>De relevante IP-adresser finder man ved at granske sine logfiler og evt. sl\u00e5 adresserne op p\u00e5 sider som <a title=\"IP-opslag\" href=\"http:\/\/whatismyipaddress.com\/\" target=\"_blank\" rel=\"nofollow\">WhatIsMyIPAddress<\/a> eller <a title=\"Host name eller IP\" href=\"http:\/\/www.hcidata.info\/host2ip.htm\" target=\"_blank\" rel=\"nofollow\">hcidata.info<\/a>.<\/p>\n<p>Jeg nyder at se i mine logfiler, at blokeringerne virker, og at forslugne robotter ikke l\u00e6ngere \u00e6der omkring en halv gigabyte b\u00e5ndbredde om m\u00e5neden til ingen verdens nytte for mig.<\/p>\n<h3>Blokering af hotlinks<\/h3>\n<p><!--more-->Et hotlink er, n\u00e5r nogen bruger et af dine billeder p\u00e5 deres egen side og linker direkte til billedets adresse p\u00e5 din side. P\u00e5 den m\u00e5de bruger de af din (servers) b\u00e5ndbredde.<\/p>\n<p>P\u00e5 nogle servere kan man blokere for hotlinks via brugerfladen (fx cPanel), men ellers kan man selv, hvis Apache-modulet mod-rewrite er aktivt. Man g\u00f8r det ved at skrive flg. i sin htaccess-fil:<\/p>\n<pre>RewriteEngine on\r\nRewriteCond %{HTTP_REFERER} !^https:\/\/sitestory.dk\/.*$ [NC]\r\nRewriteCond %{HTTP_REFERER} !^https:\/\/sitestory.dk$ [NC]\r\nRewriteCond %{HTTP_REFERER} !^http:\/\/www.sitestory.dk\/.*$ [NC]\r\nRewriteCond %{HTTP_REFERER} !^http:\/\/www.sitestory.dk$ [NC]\r\nRewriteRule .*\\.(jpg|jpeg|gif|png|bmp)$ - [F,NC]<\/pre>\n<p>Ovenst\u00e5ende vil forhindre links til filer med endelsen jpg, jpeg, gif osv., medmindre linket kommer fra sitestory.dk eller www.sitestory.dk. Udr\u00e5bstegnet fort\u00e6ller serveren, at det er en undtagelse fra reglen.<\/p>\n<p>Jeg ville nok ogs\u00e5 undtage en del af de st\u00f8rre s\u00f8gemaskiner, da billeds\u00f8gninger jo ogs\u00e5 bringer trafik.<\/p>\n<p>Selv blokerer jeg ikke for hotlinks \u2013 hvorfor afvise \u201dlinkjuice\u201d? Hvis jeg gjorde, ville mange sikkert kopiere i stedet, og det er meget sv\u00e6rere at spore. Med hotlinks kan jeg i det mindste holde \u00f8je med, hvad der foreg\u00e5r, og jeg kan evt. \u201dstemple\u201d billederne med \u201dsitestory.dk\u201d.<\/p>\n<h3>Sikkerhed i WordPress<\/h3>\n<p>Hackere jagter konstant sikkerhedshuller i WordPress og andre PHP-baserede systemer. PHP er s\u00e5rbar af natur. Jeg har selv pr\u00f8vet at blive hacket, og det var bestemt ikke morsomt.<\/p>\n<p>Jeg bruger nu et plugin, som \u00f8ger sikkerheden ganske betragteligt ved netop at skrive htaccess-filer, som styrer, hvem der m\u00e5 tilg\u00e5 hvad. Plugin\u2019et hedder <a title=\"Link til BulletProof Security hos WordPress\" href=\"http:\/\/wordpress.org\/extend\/plugins\/bulletproof-security\/\" target=\"_blank\">BulletProof Security<\/a>, og det t\u00f8r jeg godt anbefale.<\/p>\n<p>BulletProof Security styrer den del af min webside, som har med WordPress at g\u00f8re. Jeg har skrevet min egen og meget simplere htaccess-fil, som ligger i roden, og som g\u00e6lder generelt. Da resten af mit website er almindelige html-filer og ikke PHP-baseret, er det langt fra s\u00e5 s\u00e5rbart som WordPress, s\u00e5 her koncentrerer jeg mig om at blokere for afskum og forslugne robotter.<\/p>\n<p>Et andet nyttigt WordPress-plugin er <a title=\"Link til plugin'et hos WordPress\" href=\"http:\/\/wordpress.org\/extend\/plugins\/limit-login-attempts\/\" target=\"_blank\">Limit Login Attempts<\/a>, som begr\u00e6nser, hvor mange gange en person kan pr\u00f8ve at logge sig ind som administrator.<\/p>\n<p>IP-adresserne logges, og nogle af de ivrigste b\u00e5tnakker har jeg blokeret definitivt i min htaccess-fil. Chancen for at kn\u00e6kke mit kodeord er uendelig lille, men det forstyrrer min husfred, n\u00e5r de banker p\u00e5 igen og igen.<\/p>\n<h3>Mere om .htaccess<\/h3>\n<p>Dette indl\u00e6g er kun en forsmag skrevet af en novice, og f\u00f8r du kaster dig ud i at skrive dine egne htaccess-filer, vil jeg st\u00e6rkt anbefale, at du l\u00e6ser mere om emnet hos dem, der virkelig ved noget. Et godt sted at starte er fx <a title=\"En side skrevet af eksperter\" href=\"http:\/\/perishablepress.com\/stupid-htaccess-tricks\/\" target=\"_blank\">Perishable Press<\/a>.<\/p>\n<p>Det kan lyde frygtelig indviklet, men \u00e6rlig talt: Hvor sv\u00e6rt kan det v\u00e6re at lave en tekstfil, hvor der st\u00e5r nogle linjer med \u201ddeny from\u201d + IP-adresse?<\/p>\n<p>N\u00e5r man skriver sin .htaccess-fil skal man bare huske at bruge en ren teksteditor som fx Notepad, og bruger man FTP, skal filen overf\u00f8res til serveren som ASCII (alts\u00e5 ikke bin\u00e6r).<\/p>\n<p><strong>Relateret:<\/strong><\/p>\n<ul>\n<li><a title=\"Uopdragne s\u00f8gerobotter, spambots og hackere\" href=\"http:\/\/\/\/sitestory.dk\/wordpress\/2012\/09\/02\/uopdragne-soegerobotter-spambots-og-hackere\/\">Uopdragne s\u00f8gerobotter, spambots og hackere<\/a><\/li>\n<li><a title=\"Logfilen afsl\u00f8rer hjemmesidens u\u00f8nskede g\u00e6ster\" href=\"http:\/\/\/\/sitestory.dk\/wordpress\/2012\/09\/08\/logfilen-afsloerer-hjemmesidens-uoenskede-gaester\/\">Logfilen afsl\u00f8rer hjemmesidens u\u00f8nskede g\u00e6ster<\/a><\/li>\n<li><a title=\"Program til analyse af websidens access log\" href=\"http:\/\/\/\/sitestory.dk\/wordpress\/2012\/09\/09\/program-til-analyse-af-websidens-access-log\/\">Program til analyse af websidens access log<\/a><\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>En lille tekstfil kan fungere som portner til din hjemmeside. Den kan afvise uartige s\u00f8gerobotter, forhindre hotlinks til billeder o.m.a. Dette er det sidste (i hvert fald forel\u00f8big!) n\u00f8rdede indl\u00e6g om u\u00f8nskede g\u00e6ster p\u00e5 hjemmesiden. I de f\u00f8rste skrev jeg om, hvordan man kan kortl\u00e6gge den u\u00f8nskede trafik, og dette handler om, hvordan man kan blokere for den. (&#8230;)<\/p>\n","protected":false},"author":10,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[12],"tags":[2355,2383,2384,2352,1772,2282],"class_list":["post-9413","post","type-post","status-publish","format-standard","hentry","category-it-internet","tag-htaccess","tag-blokering","tag-ip-adresser","tag-robotter","tag-sikkerhed","tag-wordpress"],"_links":{"self":[{"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/posts\/9413","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/users\/10"}],"replies":[{"embeddable":true,"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/comments?post=9413"}],"version-history":[{"count":0,"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/posts\/9413\/revisions"}],"wp:attachment":[{"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/media?parent=9413"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/categories?post=9413"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/sitestory.dk\/wordpress\/wp-json\/wp\/v2\/tags?post=9413"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}