Kako Google Indeksira Sadržaj Stranice

Da bi se stranice sajta našle i rangirale u rezultatima Google ih najpre mora pročitati, razumeti i klasifikovati.

Vlasnici sajtova ovo često olako shvataju, podazumevajući da će se sajt pojaviti na Guglu, kao i svaka nova stranica.

Međutim, u praksi se često dešava da Google ne uspe da pročita sadržaj stranice što se manifestuje izostankom u rezultatima pretrage. Ako vaš sajt nije adekvatno indeksiran gubite najkvalitetnije BESPLATNE posete koje najčešće rezultiraju prodajom i rezervacijom.

Da ne bismo imali ove probleme moramo olakšati Guglu proces prikupljanja i razumevanja podataka na našem sajtu a da bismo to učinili treba razumeti kako Google to radi.

A najpre i mi moramo razumeti na koji način Google sve to radi.

 

 

Šta je Google Crawling? (Prikupljanje podataka sa sajta)

 

Google botovi svakodnevno obilaze ogroman broj sajtova prikupljajući informacije o novim sadržajima na sajtu ili promenama na postojaćem sadržaju. Ovaj proces se naziva Google Crawling.

U suštini, botovi samo prate linkove. Kada dođu na određenu stranu vašeg sajta oni prate sve linkove sa te strane, kako ka drugim stranama sajta tako i ka kompletno drugim sajtovima.

Zbog toga je izuzetno važno da na našem sajtu imamo pravilno postavljen SITEMAP.XML fajl, čija je uloga da prenese Google botovima informaciju o svim stranama koje imamo na satu.

 

Šta je Google Indexing? (razumevanje, klasifikacija i rangiranje podataka)

 

Indeksiranje sajta (strane sajta) od strane Google-a omogućava sajtu da se pojavi u rezultatima Google pretrage.

Tehnički, predstavlja proces analize sajta od strane Google botova, koji prikupljaju sve njima dostupne informacije sa vašeg sajta, kako bi ih kasnije klasifikovali i rangirali prema ključnim rečima i relevantnosti.

Ukoliko na vašem sajtu postoje stvari koje ne želite da budu indeksirane (npr. kontakt forme…) možete koristiti robots.txt fajl, koji onemogućava botovima da vide određene delove vašeg sajta, samim tim oni ne mogu biti indeksirani.

 

Kakav sadržaj Google lakše čita i indeksira

 

Google će na vašem sajtu videti veći deo sadržaja, međutim ako imate dupliranih tekstova na sajtu, bagova, „broken link-ova“ i slično, Google će to odmah prepoznati i lošije oceniti vaš sajt jer će mu biti teže da pročita, razume i klasifikuje sadržaj sa istog.

Takođe, ukoliko sadržaj nije adekvatno optimizovan, Guglu će biti mnogo teže da adekvatno prepozna tematiku sadržaja i samim tim će ga mnogo lošije rangirati i mnogo ređe ili uopšte neće prikazivati u rezultatima pretrage.

Da bi „olakšali posao“ Google botovima, potrebno je da pravilno organizujemo strukturu strane i sadržaja.

Konkretno, na svakoj strnici trebate optimizovati ove elemente koji olakšavaju Guglu razumevanje sadržaja strane:

  1. Naslov strane – Title tag

Pomoću meta taga <title> unosite naslov stran u njen HTML kod. Kada ga Google očita on će ga dalje koristiti za prikaz u rezultatima pretrage, kao i jedan od izvora ključnih reči.

Treba biti dužine do 65 karaktera, jer se više od toga ne prikazuje na SERP-u (Search Engine Results Page).

  1. Opis stranice – Description tag

Pomoću taga <description> unosite opis stranice u HTML kod. Ovaj opis će biti vidljiv u rezultatima pretrage i veoma je važno da, zajedno sa naslovom, čini  rezultat na koji će korisnici najradije kliknuti (deluje najkorisnije, najpouzdanije, najkompletnije, najzanimljivije ili možda najintrigantnije…)

Za razliku od naslova, opis može biti nešto duži, 150-160 karaktera, pa samim tim i treba nešto detaljnije opisati sadržaj strane i privući ljude da posete vaš stranu.

  1. Slike

Kako roboti ne mogu videti i razumeti sadržaj slike, da bi objasnili Guglu šta je na slici neophodno je da unesete takozvani „alt tag“. Alt tag je deo koda svake slike koji treba biti iskorišćen za opis slike.

Na primer, ukoliko je stranica o apartmanima koje izdajete i na stranici imate dve slike, sliku dvokrevetne sobe i sliku dnevne sobe, onda je adekvatan alt tag slike dvokrevetne sobe dat sa:

<img src=”http://www.primer.com/slika.png” alt=”dvokrevetna soba”>

Greška bi bila staviti (ili potpuno izostaviti alt tag):

<img src=”http://www.primer.com/slika.png” alt=”slika 1”>

Korišćenjem alt tagova takođe omogućavate svojim slikama da se pojave u rezultatima pretrage kroz kolonu: Slike.

Evo kako na primeru sajta naše agencije kako u rezulatitima Google pretrage (SERP-u) izgledaju title i description tag u tekstu koji smo napisali, ali i koliko je važno koristiti adekvatne alt tagove:

title i meta description tag
Tako je, držimo 1. poziciju! 🙂

 

Koje tipove sadržaja Google teško ili uopšte ne ideksira i treba ih izbegavati

 

Iako je sadržaj „meso“ za pretraživače i treba ga biti što više u što raznovrsnijim oblicima, ipak postoje tipovi sadržaja čije indeksiranje treba onemogućiti ili čak ukloniti sa sajta.

Ukoliko je potrebno da se unese šifra kako bi se korisnici logovali na vaš sajt, botovi neće moći da dođu do sadržaja vašeg sajta. Zbog toga je nemoguće da se takvi sadržaji nažu u rezultatima pretrage.

Takođe, ukoliko npr. imate dinamičku formu za popunjavanje upita na sajtu, ona neće biti indeksirana.

Ovakav vid sadržaja treba izbegavati kada je to moguće.

Naravno, ukoliko imate sajt hotela na kome postoji mogućnost online plaćanja, neophodno je da to bude maksimalno bezbedno. Ali, kada su u pitanju obične kontakt forme, potrudite se da bude što jednostavnija i što jasnija, kako botovima tako i posetiocima vašeg sajta.

Takođe, Google otežano čita iframe-ove, koji se najčešće ubacuju u vidu YouTube embedovanih klipva ili raznovrsnih formi sa različitih eksternih servisa, kao što su recimo ubačena forma eksternog sistema za rezervacije, forma nekog email alata i sl.

 

Najčešći razlozi zbog kojih sadržaj sajta nije indeksiran

 

Postoji dosta potencijalnih razloga, zbog čega neki sadržaj nije indeksiran od strane Gugla. Najčešće je posredi da su kreatori sajta svesno ili nesvesno dali informaciju da sadržaj ne treba indeksirati, ali postoje i drugačiji razlozi.

Ovo su neki od najčešćih razloga:

  1. Noindex, nofollow

Ukoliko u HTML kodu u „head“ sekciji imate liniju koda:

<meta name=”robots” content=”noindex, nofollow”>

Onda možete biti sigurni da vaš sadržaj nije indeksiran.

Kako je robots.txt prvo šta Gugl botovi traže na sajtu, svaki sadržaj koji sadrži ovakav fajl će ostati neindeksiran. Ukoliko želite da bude indeksiran potrebno je prilagoditi gore navedenu liniju koda.

 

  1. Canonical link može biti nepravilno postavljen.

Canonical link služi da u situacijama kada postoji više strana na sajtu sa istim sadržajem, objasni Guglu koja strana je original a koje su kopije. U takvim slučajevima Gugl će indeksirati original i samo nju će davati kao rezultat pretrage.

Linija koda canonical linka je sledećeg oblika:

<link rel=”canonical” href=”https://primer.rs>

 

  1. Vaša stranica je „Orphan“ stranica.

A šta to znači? Orphan stranice su zapravo stranice ka kojima ne vodi niti jedan link. To znači da na njih niste obratili pažnju, zaboravili ste na njih pa se u SEO-u nazivaju siročićima (orphans).

Kako se Gugl botovi kreću od strane do strane putem linkova, ukoliko postoji stranica ka kojoj ne vodi niti jedan link postoji velika verovatnoća da je botovi neće pronaći. U ovim slučajevima problem se rešava postavljanjem linka ka orphan strani sa neke od već indeksiranih stranica na sajtu i ubacivanjem stranice u mapu sajta.

Sa druge strane, ponekad je veoma korisno da postoje stranice ka kojima ne postoje linkovi sa drugih stranica. Na primer, specijalna ponuda letovanja samo za ljude koji su bili gosti hotela u proteklih godina, za koju i ne želimo bude vidljiva svima već samo onima kojima je namenjena. Zato tu stranicu nećemo nigde linkovati na sajtu, nećemo je ubacivati u glavni (ili bilo koji drugi) meni sajta i u „head“ sekciji ćemo uneti već ranije pomenutu liniju koda:

<meta name=”robots” content=”noindex, nofollow”>

Ovo su tri najčešća razloga zbog kojih vasa stranica nije indekirana. Ukoliko ste proverili sve ovo i utvrdili da je drugi uzrok neindeksiranja, onda je potrebna detaljnija analiza sadržaja i celokupnog sajta.

 

Kako olakšati Google krolovanje i indeksiranje

 

Gugl botovi imaju veoma jasan i programiran način rada. Zbog toga razumevanje njihovog funkcionisanja i adaptiranje sadržaja njihovim potrebama može u mnogome olakšati indeksiranje istog.

Da bi olakšali krolovanje i indeksiranje trebate najpre kreirati Sitemapu koja će sadržati sve stranice koje želite da budu indeksirane.

Zatim se postarajte da sve stranice budu pravilno linkovane, prateći arhitekturu sajta (glavne stranice sa najviše linkova, slabije stranice sa manje linkova itd…).

Potrebno je pored označavanja važnih stranica, podjednako staviti do znanja koji sadržaj se ne treba indeksirati (koristiti „noindex“, 301 redirection).

Takođe, ne sme se dozvoliti da se uđe u predugi krug redirekcija, jer se time nepotrebno gubi veliki deo „crawler budget-a“.

 

Ukoliko je Google-u na bilo koji način otežano ili onemogućeno da pravilno indeksira sadržaj vašeg sajta to će se definitivno odraziti na vaše pozicije u rezultatima pretrage, broju BESPLATNIH poseta koje dobijate sa Google-a i naravno, u krajnjoj liniji, odraziće se negativno i na prodaju (za koju možda niste ni svesni da može biti značajno bolja).

Želite da proverimo kakva je situacija sa indeksiranjem vašeg sajta ali i da izvršimo kompletnu analizu njegovih performansi? Možete me kontaktirati

Bilo bi super da svoja iskustva, ali i pitanja, postavite u komentarima ispod teksta.

1 thought on “Kako Google Indeksira Sadržaj Stranice”

Napišite svoj komentar