Webmaster Sitesi
Türk Webmaster Forumu
Webmaster Sitesi
Geri git   Webmaster Sitesi > Seo Nedir > SEO Arama Motoru Optimizasyonu

Standart indeksleme işlemi, google ve tüm diğer botlar

SEO Arama Motoru Optimizasyonu forum başlığına Standart indeksleme işlemi, google ve tüm diğer botlar konusunun bir özeti Bu konunun anlaşılması google ve arama motorlarıyla iyi geçinmek isteyen webmasterlar için tasarım ve hazırlı kaşamasında rehber niteliğindedir. Standart bir İndeksleme şu şekilde işler: 1.) Bot (Örümcek) ana sayfaya ulaşır. ...
Cevapla
 
  #1  
WS 08-04-2009, 13:30
W-S Resmi
W-S W-S offline

10. Rank
 
Gulenadam Standart indeksleme işlemi, google ve tüm diğer botlar

Bu konunun anlaşılması google ve arama motorlarıyla iyi geçinmek isteyen webmasterlar için tasarım ve hazırlı kaşamasında rehber niteliğindedir.

Standart bir İndeksleme şu şekilde işler:
1.) Bot (Örümcek) ana sayfaya ulaşır. Burada sayfaya ait tüm alt bağlantıları ve dışarı çıkan bağlantıları toplar ve kendi veri tabanına indirir.

Diğelim 10 alt klasör ve 10 alt sayfan mevcut 10 adette dışarı bağlantı verilmiş. Bunları toplar.

Ana sayfaya 30 puan verirsek, her bir bağlantıya 1 adet puan verilir. Bunlar ileride google pr hesabına direkt katkı yaparlar.

10 klasörümüzün 10 puanı var toplamda ve her klasöre 1 puan pr gitmiştir.

Şu şekilde olayı gösterelim.
Yani ana sayfanız 30 puan önemli ise google gözünde alt sayfalar 1 puan önemlidir. Sıralamada bunu benzer şekilde kullanır.

Bu bölme işlemi standart pr hesaplamasının da temelini oluşturur. Az klasore linki veya sayfaya linki veya çıkış linki olan siteler daha çok pr ve önem taşırlar. (Eksik bilgi var tabi, pr değeri yüksek sitelere çok çıkış vermeninde olumlu etkisi olur)

Şimdi bot bu ana sayfada 30 url topladı diyelim.
10 klasore ulaştı ve burada toplam 50 sayfa 5 klasor daha topladı
Tekrar bu bilgileri veri tabanına indirir ve yeni bir örümcek bu kalan urleleri indekslemeye başlar. Ancak bu işlem için tüm sayfayı indirmesi gerekeceği için açılan kanallarda /thread) bir kopma olabilir ve indeksleme başarılı olamaz. Google botta 1 gigabit bağlantı kullanır ve 100,000 threade ulaştığında thread başına 10kkps gücü kalacaktır. Genelde apache vb. web sunucular vb. tüm isteklere cevap veremez bazılarını kaçırır bu da indekslenmeyen sayfaların açıklamalarından biridir. Bu nedenle tüm sayfa ve omurga yapımızı google'a anlatmak için bir site haritası yaparız.

Şimdi google örümceği tüm bu sayfaları dolaştıktan sonra kendi algoritmasındaki kalite puanına göre bu sayfaları değerlendirir. Ana sayfadan direkt link alan klasor onun bir alt klasörüne göre daha değerlidir.

Bu mantıkla daha çok hit almasını istediğiniz sayfaları ana sayfaya içerik yapmanız veya oradan direkt bağlantı vermeniz daha mantıklıdır.

İndeksleme işlemi olarak google diğer botlardan daha gelişmiştir. Örneğin yahoo slurp botu indekslerken resmen siteye tecavüz eder. Bir anda tüm topladığı bağlantıları gelmeye kalkar ve bazıları eyvah ddos alıyorum sitem niye çöktü durduk yere gibi söylemlere başlar. Botlar bi anlamda sitenin bulunduğu serverı ezerler.

Slurp botu için bu nedenle robots.txt nize bir gecikme verilmelidir. Tabi o zamana kadar yahoo botuna uslu durmayı öretebilirse gerek kalmaz. Google tarama hızını bizim ayalarlamamıza müsade ediyor. Akıllı, terbiyeli bir bot.
robots.txt'nize bu şekilde bir gecikme verdirebilirsiniz.

önce ufak değerle başlanıp yükün çok gelmemesi için daha yüksek değerlere çekilmesi önerilir
indeksleme işlemi için tek baş belası yahoo değildir cuil, msn vb. arama motorları zaman zaman serverınıza uğrayıp bilgileri veritabanlarına ç-alıntılar yaparlar. Tek kurtuluş bunlara robots.txt disallow vermektir. E'sen de arama motoru yaz sende ç-al ama di mi. Maksat herkes aradığını bulsun. Nerde bu devlet nerde bu adalet diyenler için. Ya da adama bak benim içeriği çekiyor veritabanına atıyor sonra birileri aradıkça benim içeriğimle benden para kazanıyor beş kuruşta bana vermiyor diyenleriniz olabilir.
Bu adamlar dürüstse o zaman korsanlar da dürüst üstelik cesur adamlardır demek geliyor içimden ama korsanlığa özendirmeyim sizleri Sonuçta o korsan olmazsa bize kim hit göndericek bu kadar. Yani aramızda büyük korsanlara ihtiyacımız var, sayelerinde biz küçükler verdikleri hitlerle geçinip gidiyoruz.

kısaca
dosyanızı txt yapıp ftp ana dizinine koyarsanız tüm botları sayarsınız. Korsan botları hariç. Onlar robots.txtye aldırmayan botlardır.

İndeksleme işlemi işte böyle bişey, teknolojin varsa indeksle başka sitelerin haberlerini, sitelerini, blogları vb. vb. hatta git kütüphaneye copyrightları bitmiş kitapları robotlarınla at içeriğine. Sonra fikirleri düşünceleri yarışmalarla topla yatırımların daha çok kazansın diye. İşte al sana yeni bir google (denizaltı gözlüğü) daha.

Şimdi en iyi indeskleyen örümcek en çok içeriği, en kısa zamanda ve en sık aralıklarla indeksleyebilen ve değerli içeriği en yukarı çekebilen örümcektir. Şuan bunu en iyi google yapmaktadır. (Rusların google a rakip arama motoru Randex i ve pek çok başka botu incelemedim henüz)

3 farklı google örümcek var olduğu düşünülür:

1 tanesi siz google.com üzerinde arama yaptığınızda arama motoru veritabanına ulaşıp bilgiyi getiren örümcek.
1 tanesi veritabanına url taşıyan daha yıldırım örümcek bazıları freshbot dediler
1 tanesi içeriği içeriği komple taşıyan kamyoncu örümcek (kamyon kamyon bilgi taşıdığı resmedilerek)

siz webmasterlar ilk sitenize yıldırım örümcek gelir. Bu adam url yollarını ve kamyonların geçeceği yolları ana merkeze bildirir. Ve bildirirken bu elindekileri ne kadar çekebiliyorsa bir geçici indeks veritabanına atar. İşte aramalarda yenisitelerin aniden yukarda çıkmaların nedeni bu yıldırım eklembacaklı paşasıdır. Bu paşayı sitemap veya site haritası çok memnun eder. Yoksa kendisi gezip inip derinliklere o apachenin ve diğer sunucunun taşlı yollarında, kopmalara, kayıplara uğramadan direkt çekebilir. en azından neyi nerde bulacağını bilir.

Bizim bu yukardaki bilgiler de mühimmat gibi bişey tehlikeli madde taşıyoruz google'ın saklamaya çalıştığı ticari gerçekleri... Biri alır bunla atom bombası yapar bilemem, ya da o forum bu forum gezer neden google bana gelmiyor indekslenmiyorum derdi ne bunun der der durur.

Yıldırım eklembacaklısının önüne yem atın. Biliyorsunuz onun görevi ç-alıntı yapılacak siteler sayfalar ve taze içerik bulmaktı. Örneğin ana sayfanızda bir bağlantı oluşturun (ona bi kanal açın) o bağlantının bir ucunda site haritanız olsun. Yıldırım gelince o linki ve içindeki o tazecik bağlantıları görüp kamyoncu bota bildirmek isteyecektir.

Buradaki bilgi kısmen olaya yeni başlayanları anlaması için düzenlendi.

Orijinal webmastersitesi yazısı alıntılar da Webmaster Sitesi'ne mutlaka link veriniz.
WS
  #2  
WS 08-04-2009, 14:05
kenger Resmi
WS Forumun Abisi
8. Rank
 
Standart

teşekküreler w-s bunu bizlerle paylaştığın için.
  #3  
WS 08-04-2009, 18:14
wmoderator Resmi
4. Rank
 
Standart

çok faydalı bir paylaşım teşekkürler ws
  #4  
WS 08-04-2009, 21:17
 
Standart

elien saglik güzel paylasimd evamini bekleriz
  #5  
WS 07-05-2009, 14:06
SeoStar Resmi
2. Rank
 
Standart

saol güzel paylaşım......
  #6  
WS 07-05-2009, 19:48
hastesi Resmi
3. Rank
 
Standart

Hep şu uzun makaleler yüzünden seo dan muaf kaldım ya. Emeğine sağlık...
  #7  
WS 11-05-2009, 14:11
SeoStar Resmi
2. Rank
 
Standart

tekara diyorum güzel paylaşım diye ama bir sorum olacak sadece bu kodumu robot.txt yazıp gönderiyoruz ftp ye (bu kod bütün arama botlarının girmesini ve zarar vermemesini sağlıyor demi)
Alıntı:
PHP- Kodu:
User-agent: *
Disallow: /
  #8  
WS 30-05-2009, 11:52
qqaq33 Resmi  
Standart

mantıklı ve güzel
  #9  
WS 30-05-2009, 17:14
W-S Resmi
W-S W-S offline

10. Rank
 
Standart

Alıntı:
SeoStar Nickli Üyeden Alıntı Mesajı göster
tekara diyorum güzel paylaşım diye ama bir sorum olacak sadece bu kodumu robot.txt yazıp gönderiyoruz ftp ye (bu kod bütün arama botlarının girmesini ve zarar vermemesini sağlıyor demi)
Evet tüm botlar dışarı demek.
Bu kod sadece robots.txt ye saygı duyan botları keser genelde de buna uması beklenir bir arama motorundan.
  #10  
WS 25-06-2009, 22:42
sedat5453 Resmi
3. Rank
 
Standart

teşekkürler güzel bilgiler
Cevapla


Konuyu Toplam 1 Üye okuyor. (0 Kayıtlı üye ve 1 Misafir)
 
Seçenekler


Benzer Konular
Konu Konu Açan Forum Cevap Son Mesaj
Site Satış: GOOGLE ve diğer arama motorlarında İLK SAYFADA ÇIKIN!! onworrn Websitesi Alış - Satış 7 08-03-2010 22:45
Google yahoo ve daha birsürü arama motoruna ping atarak 2 dakikada botlar sizde Efsanespace Google 3 07-02-2010 23:32
Google AdSense TM Çevrimiçi Standart Hüküm ve Şartları banias Google Adsense 6 21-03-2008 10:23
Google Analytics neden diğer bazı web analitik çözümlerinden farklı değerler raporluyor? kadınca Google 0 15-03-2008 22:09
Google AdSenseTM Online Standart Şart ve Koşulla miguel Webmastersitesi çöplüğü 1 17-11-2007 17:33

Webmastersitesi.com forumunda, içerikler sahiplerince otomatik eklendiği için, yazılar yazanlarının sorumluluğundadır, ihbarda bulunulan içerikler, yöneticiler tarafından 24 saat içinde yayından çıkartılacaktır.
 
© Copyright 2007-2010. Tüm Hakları Saklıdır. Webmaster Sitesi® Forumu.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259