Googlebot raast rond over mijn site (>80mb traffic)

Installatie lukt niet? Plotseling een foutmelding. Of weet je niet hoe iets werkt. Problemen met phpBB2 kun je in dit archief opzoeken.
Forumregels

Sinds 1 januari 2009 wordt phpBB2 niet meer ondersteund.
Onderstaande informatie is verouderd en dient uitsluitend als archief.
phpBB2.0.x
Paul_
Berichten: 78
Lid geworden op: 14 dec 2004, 21:51

Googlebot raast rond over mijn site (>80mb traffic)

Bericht door Paul_ » 08 feb 2005, 13:33

Ik heb sinds november mijn eerste phpbb forum online. In januari had ik 1gig dataverkeer en deze maand verwacht ik op 1,5gig te komen. Maar het gaat sinds gisteren ineens heel hard en in mijn webalizer statistieken is te zien dat het komt door googlebots.

In januari hadden de googlebots in totaal 10mb dataverkeer gegenereerd. Gisteren ging het van een paar mb naar 100mb dataverkeer (nu dus 100mb van de 400mb op mijn site).

Hoe kan dat? Zo groot is mijn site helemaal niet. Dus als het het indexeert dan doet dat het wel erg omslachtig. Mijn database is 3,5mb en ik draai alleen een phpbb forum op dat domein.

Uit mijn webalizer statistieken:
crawl-66-249-65-68.googlebot.com - 15 visits - 74194kbytes data - 3177 files - 3185 hits.

Verder nog een paar googlebots maar die hebben beduidend minder huisgehouden.

Aangezien mijn statistieken slechts 1x per 24uur worden ge-update ben ik benieuwd wat er vandaag gebeurt. Want mijn php administratie paneel zit nu helemaal vol met een andere googlebot.

Is het een worm? Die komen toch met andere IPs als die van google?
Of is google deze dagen mijn site aan het indexeren? Ik draai phpbb 2.0.11

Erik Geurts
Berichten: 21
Lid geworden op: 09 jun 2004, 10:30
Contacteer:

Bericht door Erik Geurts » 08 feb 2005, 16:08

Hoi,

Googlebot is inderdaad erg grondig in het indexeren van phpbb gebaseerde sites. Je moet je realiseren dat die bot alle links op alle pagina's afloopt. Dat kan dus wel eens een flinke partij zoekwerk worden.

Ter geruststelling, het kan even duren (afhankelijk van de omvang van je forum) maar hij (?) is een keer klaar. Dat kan echter wel enkele uren/dagen duren.

Als je niet wilt dat Google je site doorspit, dan kun je een robots.txt file in je root neerzetten met instructies. Maar: als google je site niet doorzoekt, komt de site ook niet/nooit in de google resultaten terecht.

Succes!
Mijn phpBB site: Corsica Prikbord

Paul_
Berichten: 78
Lid geworden op: 14 dec 2004, 21:51

Bericht door Paul_ » 08 feb 2005, 17:33

Hoi Erik,

Bedankt voor je antwoord. Maar is 80mb dataverkeer niet een beetje veel? Mijn site heeft een database van 3,5mb en 2300 berichten waarvan de helft in onzichtbare fora.

En ik ben nu eigenlijk helemaal verbaasd want ik heb eventjes naar statistieken van een 2de domein van mij gekeken. Opdat domein staat alleen een phpbb 2.0.11 forum met 4 berichtjes (het was een testje) en het domein wordt ook nergens gelinkt (dacht ik) normaal is er ook 0.0 verkeer op. Maar gisteren had ook dat kleine forumpje bezoek van een overijverige googlebot. Resultaat 74mb dataverkeer... Op een site met 3users, 4 onderwerpen en 4 berichten.

Vandaag ook continue op het 2de domein 40-80 gasten (met ip van googlebot) en ze bezochten tussen 10:00-16:00 alleen de forum index. Sinds 16:00 hebben ze ook 1 van de subfora ondekt.

Op mijn echte site zit de googlebot alleen nog op de forum index. Echt vaag.

Gebruikersavatar
Alpha
Berichten: 367
Lid geworden op: 13 okt 2004, 13:10
Locatie: Nootdorp

Bericht door Alpha » 08 feb 2005, 17:47

bij mij ook alleen op index... kan het liggen aan de premissies? :?

MTechnic
Berichten: 25
Lid geworden op: 01 okt 2004, 16:47

Bericht door MTechnic » 08 feb 2005, 17:51

ook last van gehad.. nu robot.txt :D dan maar geen google :)
Greetings Maus 8)

XP-Rene
Berichten: 2168
Lid geworden op: 01 dec 2004, 19:33
Locatie: Vlissingen
Contacteer:

Bericht door XP-Rene » 08 feb 2005, 18:46

Waar is die robot text ergens te vinden? Ik heb er namelijk ook nogal veel last van.
KNAVIVO DIERENHULP
Stimuleer verdraagzaamheid. Wees eens wat vaker irritant.

The Sting
Berichten: 762
Lid geworden op: 11 okt 2004, 16:12
Locatie: Brabant

Bericht door The Sting » 08 feb 2005, 18:51

XP-Rene schreef:Waar is die robot text ergens te vinden? Ik heb er namelijk ook nogal veel last van.
http://home.concepts.nl/~hooms/robots.txt

Laat even weten als je hem hebt.
Met groet, The Sting

XP-Rene
Berichten: 2168
Lid geworden op: 01 dec 2004, 19:33
Locatie: Vlissingen
Contacteer:

Bericht door XP-Rene » 08 feb 2005, 19:03

Dank U, en het staat er al op, ben benieuwd.....
KNAVIVO DIERENHULP
Stimuleer verdraagzaamheid. Wees eens wat vaker irritant.

Gebruikersavatar
Cheeta
Berichten: 1165
Lid geworden op: 11 jan 2004, 11:26
Locatie: Mijdrecht Sites: -- Derbi Club --
Contacteer:

Bericht door Cheeta » 08 feb 2005, 19:24

noemen jullie 80mb erg :roll:

ik heb msnbot 600mb 100mb per dag en buurtzaken.nl 150mb per dag
Don't mess with BD and save the Cheeta's!

The Sting
Berichten: 762
Lid geworden op: 11 okt 2004, 16:12
Locatie: Brabant

Bericht door The Sting » 08 feb 2005, 19:58

XP-Rene schreef:Dank U, en het staat er al op, ben benieuwd.....
Laat het nog eens weten?.
Met groet, The Sting

XP-Rene
Berichten: 2168
Lid geworden op: 01 dec 2004, 19:33
Locatie: Vlissingen
Contacteer:

Bericht door XP-Rene » 08 feb 2005, 20:03

Ik zal het over precies een week even laten weten hoe een en ander gelopen is.
KNAVIVO DIERENHULP
Stimuleer verdraagzaamheid. Wees eens wat vaker irritant.

Roelof
Berichten: 82
Lid geworden op: 06 dec 2004, 23:41

Bericht door Roelof » 08 feb 2005, 23:16

The Sting schreef:
XP-Rene schreef:Waar is die robot text ergens te vinden? Ik heb er namelijk ook nogal veel last van.
http://home.concepts.nl/~hooms/robots.txt

Laat even weten als je hem hebt.
Is de bedoeling dat je dat txt file gewoon in de root word geplaatst ??
Wat doe die robots.txt eigelijk die blokeert die zoekrobots ?

Wat net als bij jullie heb ik er dus ook last van nog niet zo veel maar toch om het ergst te voorkomen. wil ik ook van die dingen af.

The Sting
Berichten: 762
Lid geworden op: 11 okt 2004, 16:12
Locatie: Brabant

Bericht door The Sting » 08 feb 2005, 23:26

Roelof schreef:
The Sting schreef:
XP-Rene schreef:Waar is die robot text ergens te vinden? Ik heb er namelijk ook nogal veel last van.
http://home.concepts.nl/~hooms/robots.txt

Laat even weten als je hem hebt.
Is de bedoeling dat je dat txt file gewoon in de root word geplaatst ??
Wat doe die robots.txt eigelijk die blokeert die zoekrobots ?

Wat net als bij jullie heb ik er dus ook last van nog niet zo veel maar toch om het ergst te voorkomen. wil ik ook van die dingen af.
Hij blokt ze inderdaad en in de root, dus bij de index.php.
Maar dat wist je denk ik wel, zeg het erbij omdat dat vaak de volgende vraag is :lol:
Met groet, The Sting

Roelof
Berichten: 82
Lid geworden op: 06 dec 2004, 23:41

Bericht door Roelof » 08 feb 2005, 23:32

The Sting schreef:
Roelof schreef:
The Sting schreef: http://home.concepts.nl/~hooms/robots.txt

Laat even weten als je hem hebt.
Is de bedoeling dat je dat txt file gewoon in de root word geplaatst ??
Wat doe die robots.txt eigelijk die blokeert die zoekrobots ?

Wat net als bij jullie heb ik er dus ook last van nog niet zo veel maar toch om het ergst te voorkomen. wil ik ook van die dingen af.
Hij blokt ze inderdaad en in de root, dus bij de index.php.
Maar dat wist je denk ik wel, zeg het erbij omdat dat vaak de volgende vraag is :lol:
hihi :wink: weet voldoende maar het is gewoon dat txt bestandje he veder niks aan doen ?? gewoon er neer plakken en whola ?

The Sting
Berichten: 762
Lid geworden op: 11 okt 2004, 16:12
Locatie: Brabant

Bericht door The Sting » 08 feb 2005, 23:45

Roelof schreef:hihi :wink: weet voldoende maar het is gewoon dat txt bestandje he veder niks aan doen ?? gewoon er neer plakken en whola ?
Ja, dat moet het doen :thumb:
Met groet, The Sting

Roelof
Berichten: 82
Lid geworden op: 06 dec 2004, 23:41

Bericht door Roelof » 08 feb 2005, 23:57

The Sting schreef:
Roelof schreef:hihi :wink: weet voldoende maar het is gewoon dat txt bestandje he veder niks aan doen ?? gewoon er neer plakken en whola ?
Ja, dat moet het doen :thumb:
Oke :thumb: Gedaan. Volgens mij werkt het direct al
Normaal waren er al zo'n 20 de zelfde ip's aan het zoeken nu nog enkele.
soms 2 Hmm valt nog mee te leven

Thanks :bier:

Grtzz Roelof

Paul_
Berichten: 78
Lid geworden op: 14 dec 2004, 21:51

Bericht door Paul_ » 09 feb 2005, 14:57

Cheeta schreef:noemen jullie 80mb erg :roll:

ik heb msnbot 600mb 100mb per dag en buurtzaken.nl 150mb per dag
Ik noem het niet erg, wel raar.

Vooral het feit dat de googlebot nu wel heel raar doet op een ander niet actief forum van mij. Het is een domein dat nergens gelinkt wordt, het bevat alleen phpbb 2.0.11 met 4 berichten. En er komt normaal geen verkeer op. Wat doet googlebot?

1 februari 0 byte dataverkeer
2 februari 0 byte dataverkeer
3 februari 0 byte dataverkeer
4 februari 0 byte dataverkeer
5 februari 2 kbyte dataverkeer
6 februari 7697 kbyte dataverkeer
7 februari 73334 kbyte dataverkeer
8 februari 108094 kbyte dataverkeer

900 kbyte is dataverkeer door mij de rest is van googlebot

Daar heeft googlebot dus 180mb gedownload binnen 2 dagen op een mini phpbb pagina. Het lijkt me een bug van phpBB of van google of komt dit ook voor op andere pagina's? Bv pagina's met alleen html?

Gebruikersavatar
Bee
Berichten: 13403
Lid geworden op: 29 aug 2004, 10:30

Bericht door Bee » 09 feb 2005, 18:11

Werkt jou phpBB met sessies in de link? Dan gaan het goochelen met sessies en gaat het verkeerd indexeren.
... Maar ik modereer (nog) niet.

The Sting
Berichten: 762
Lid geworden op: 11 okt 2004, 16:12
Locatie: Brabant

Bericht door The Sting » 09 feb 2005, 18:13

bee schreef:Werkt jou phpBB met sessies in de link? Dan gaan het goochelen met sessies en gaat het verkeerd indexeren.
Wil je dit eens uitleggen, begrijp het niet, wat zijn sessies in de link?.
Met groet, The Sting

Gebruikersavatar
Bee
Berichten: 13403
Lid geworden op: 29 aug 2004, 10:30

Bericht door Bee » 09 feb 2005, 18:51

Je hebt van die links, waarin een volledige sessienummer staat. Google kan niet zo goed opschieten met die sessies, want die lijken steeds te veranderen, daardoor veranderd volgens google de link, en daardoor ziet hij telkens andere pagina's
... Maar ik modereer (nog) niet.

Gesloten