Duplicirane stranice u joomla k2. JL No Doubles - uklanja duplicirane stranice. Je li moguće automatski se riješiti duplikata?

06.11.2019 Savjet

U ovom članku želim govoriti o dupliciranim stranicama u Joomli. Puno je članaka napisano na ovu temu, ali čini mi se da vrijedi zabilježiti svoje viđenje ovog problema. U ovom članku ću govoriti o Joomla 3, iako su gotovo svi savjeti relevantni za Joomla 2.5.

Problem dupliciranih stranica u Joomli seže duboko u korijene samog CMS-a, točnije, ne čak ni u samu Joomlu, već u preteču CMS Mambo. Činjenica je da tada nisu razmišljali o CNC-ovima (ljudski čitljivim URL-ovima), a kada je problem postao aktualan i puštena Joomla 1.5, umjesto radikalne prerade sustava veza, napravljena je mrlja s kojom se sada bavimo . Da, tada se to činilo kao rješenje problema, ali kao što vidimo, polumjera je prerasla u globalni problem.

Srećom, Joomla programeri razumiju da postoji problem, ali ne žele poduzeti radikalne mjere, koje je, usput rečeno, predložila zajednica. Došlo je čak i do uspješnog prikupljanja sredstava za novi Joomla router, ali promjenama je teško doći do glavne distribucije Joomle.

Dakle, što Joomla zapravo radi kako bi izbjegla duplikate?

Opet su krenuli putem polovičnih mjera i uveli kanonsku oznaku, koja je dizajnirana da ukazuje na pravu Joomla stranicu. Nećemo o trnovitom putu provedbe, samo ću napomenuti da je zaista bio trnovit. I reći ću da vam ova metoda doista omogućuje smanjenje broja duplikata na web mjestu, ali problem je u tome što ova metoda gotovo ne radi za Joomla komponente, budući da programeri komponenti moraju voditi računa o implementaciji podrške, ispravnoj podršci, a to se ne događa uvijek. I da budem iskren, kanonska oznaka sama po sebi nije lijek za sve.

O ovom jednostavnom i učinkovit način Reći ću vam u nastavku.

Zapravo, ova metoda će vam pomoći smanjiti broj snimanja nekoliko puta. U mojoj praksi to mi je omogućilo smanjenje broja uzimanja za 10 puta.

Što nam treba za ovo?

  • Malo vremena i ruke

Prvo što nam Google kaže je da isključimo dupliciranu domenu.

Kako to učiniti?

Preusmjeravanje s www domene na ne-www domenu. Odnosno, idemo na stranicu www.site.ru i preusmjeravamo se na stranicu site.ru.

Dodajte sljedeće pravilo u .htaccess datoteku.

RewriteCond %(HTTP_HOST) ^www\.site\.ru$ RewriteRule ^(.*)$ http://site.ru/$1

Zamijenite Site.ru svojom domenom.

Sada prijeđimo na ugodne stvari.

Instalirajte dodatak JL No Doubles i omogućite ga u upravitelju dodataka. Ako imate samo standardne Joomla materijale, onda ne morate ništa konfigurirati. Zapravo, ovaj niz jednostavnih koraka pomoći će vam da radikalno smanjite broj duplikata na stranici.

Razgovarali smo o tome zašto nastaju i kako ih tražiti. U ovom članku ću vam reći kako možete ukloniti duplikate ili spriječiti njihovo pojavljivanje Rezultati pretraživanja.

Budući da je svaki slučaj individualan, razmotrit ćemo najpopularnije metode koje savršeno funkcioniraju u 99% slučajeva. Možete odabrati jedan za sebe ili ga koristiti u kombinaciji.

Iako su sve ove metode primjenjive na bilo koji drugi CMS sustav, detaljnije ću se zadržati na značajkama Joomle.

Svi ovi primjeri važe ako ste omogućili standardni SEF i URL preusmjeravanje u globalnim postavkama J-a.

  • 1. Dodatak za Joomla

Prva stvar koju možete učiniti ako imate zabune u URL-ovima (kada se poveznice formiraju iz pseudonima kategorije i stavke izbornika) je instalirati dodatak Shnodoubles iz sherze.

Izvrstan dodatak, nosi se sa svojim zadatkom 100%. Nakon instalacije, pogrešno formirana poveznica (iz aliasa kategorije) preusmjerava se na ispravnu (iz stavke izbornika). Možete preuzeti ovaj prekrasan dodatak koji uklanja duplikate za Joomla 2.5 (izravna veza!)

Nakon aktivacije dodatka, neki će se duplikati jednostavno zalijepiti.

  • 2. Robots.txt za Joomla

Ova datoteka dolazi u standardnoj Joomla distribuciji, nalazi se u korijenu i dostupna je na poveznici site.ru/robots.txt. Glavna svrha je da daje upute robotima za pretraživanje za indeksiranje stranice. Uz njegovu pomoć možete zatvoriti neke (vama potrebne) dijelove stranice, također je podržan regularni izrazi– može se zatvoriti pojedinačne stranice po maski.

Najčešće koristim ovu uputu (uz ono što dolazi u zadanoj datoteci):

Samo jedna linija rješava veliku količinu smeća. To može biti:

  • stranice za ispis materijala, također sadrže print= ili tmpl=component u URL-ovima
  • poveznice na rss feed
  • stranice s rezultatima pretraživanja web mjesta
  • također će zatvoriti stranice paginacije
  • Mogu postojati i druge opcije, ovisno o proširenjima koja se koriste

Hoćete li upotrijebiti ovaj redak ili blokirati svaku vrstu stranice pojedinačno, odlučujete sami, ali imajte na umu da se previše robota smatra potpuno popustljivim. Također vrijedi paziti da ovaj redak ne pokriva nešto važno, na primjer, mapu web mjesta - u ovom slučaju možete napisati: Allow: /path_to_map

Možete pročitati više o korištenju robots.txt u Yandex pomoći - help.yandex.ru/webmaster/?id=996567

  • 3. Atribut rel="canonical" oznake

Korištenje ovog atributa pomoći će robotu da odredi koje stranice trebaju biti uključene u indeks, a koje ne. Ako na web-mjestu postoje vrlo slične stranice (nejasni duplikati), koje se razlikuju samo, na primjer, u opcijama sortiranja - nove od početka, ili poredajte uzlaznim redoslijedom, ili prikažite po 20-30, itd., tada možete koristiti ovaj atribut. U tom slučaju morat ćete odabrati jednu kanoničku stranicu koja će biti rangirana, a ostalima dodati rel = “canonical” označavajući odabranu stranicu - takvi dokumenti neće biti uključeni u rezultate pretraživanja, robot će znati da ne moraju biti uključeni u indeks.

Za više informacija o tome kako implementirati rel="canonical" u Joomla 1.7/2.5, pogledajte

  • 4. 301 preusmjeriti

Prikladno je koristiti ako ste promijenili adrese stranica, ali dokumenti i dalje postoje, odnosno niste ih izbrisali. U ovom slučaju, za ispravno lijepljenje, preporuča se koristiti 301 preusmjeravanje u .htaccess - tražilice će znati da je dokument premješten na novu adresu. Ova metoda vam omogućuje da spremite indikatore web stranice - Tietz i PR.

301 preusmjeravanja također se mogu koristiti za spajanje duplikata. Na primjer, dobro poznata snimanja početna stranica stranica na Joomli je /index.php i alias stavke izbornika Home, na primjer, /home ili /homepage

Lijepljenje ih je jednostavno, otvorite .htaccess i unesite

Preusmjeri 301 /index.php http://site.ru/

Ili možete napraviti 301 preusmjeravanje na php u indeksnoj datoteci vašeg predloška

if($_SERVER["REQUEST_URI"] == "/index.php") (
zaglavlje("Lokacija: /",TRUE,301);
Izlaz();
}
?>

I dat ću vam klasično preusmjeravanje s www na bez www

RewriteEngine uključen
RewriteCond %(HTTP_HOST) ^www.example.ru$
RewriteRule ^(.*)$ http://example.ru/$1

* example.ru zamijenite imenom svoje domene.

  • 5. Meta oznaka robota

Drugi način za sprječavanje indeksiranja duplikata u Joomli je korištenje meta oznake:

Na ovaj trenutak Ova je metoda za Google učinkovitija od zabrane uputa u datoteci robots.txt. Na primjer, da biste blokirali indeksiranje stranica za ispis i duplikata na?tmpl=component, možete otvoriti datoteku component.php u korijenu vašeg predloška i unijeti ovu oznaku u .

Da biste zatvorili stranice s rezultatima pretraživanja na web stranici pomoću standardnog com_search, možete dodati uvjet u index.php predloška



Ali prvo morate definirati varijablu

$opcija = JRequest::getVar("opcija", null);

Neću ulaziti preduboko u uvjete u predlošcima, nije o tome članak, nadam se da je princip jasan.

  • 6. Uklanjanje url-a s ploče

Još brz način– ručno uklanjanje s ploče webmastera.

Za Yandex morate otići na adresu - webmaster.yandex.ru/delurl.xml

Još uvijek postoji 1 ne baš popularna metoda za uklanjanje Joomla duplikati iz rezultata pretraživanja, ali razmotrit ćemo i to.

  • 7. X-Robots-Tag zaglavlja

Dosta rijedak naslov, češće ga koriste strani optimizatori, radi za Google. Nažalost, Yandex još nije komentirao podršku za ovo http zaglavlje.

HTTP/1.1 200 OK
Datum: utorak, 25. svibnja 2010. 21:42:43 GMT
...
Oznaka X-Robots: noindex
...

Kao što vidite, postoji mnogo načina za uklanjanje duplikata Joomla sadržaja; trebali biste barem približno razumjeti kako svaki od njih funkcionira kako biste odabrali najprikladniju opciju i primijenili je na svoju situaciju.

Dobar dan svima, ako čitate ovaj članak, to znači da vi, kao i mnogi početnici web programeri, imate sasvim opravdano pitanje - kako se nositi s dupliciranim stranicama u Joomli.

U ovom ću članku pokušati odgovoriti na ovo pitanje. Prvo, razgovarajmo o opasnostima pojavljivanja dupliciranih stranica na web mjestu, a zatim ćemo vidjeti gotova rješenja boriti se protiv duplikata i konačno pogledati alternativu načini rješavanja dupliciranih stranica.

Zašto se isplati riješiti se dupliciranih stranica?

Nije tajna da Joomla, kao i svaki drugi sustav za upravljanje sadržajem, stvara identične stranice dostupni na različitim adresama web stranica - duplikati. Za posjetitelje vaše stranice te iste stranice su bezopasne; oni možda nisu ni svjesni njihovog postojanja.

Međutim, duplikati koji su bezopasni za posjetitelje mogu značajno utjecati na poziciju stranice u rezultatima pretraživanja. Zašto se ovo događa?

Zamislimo situaciju - napisali ste nekoliko jedinstvenih materijala i objavili ih na svojoj web stranici. Roboti za pretraživanje su ih indeksirali, sve je u redu, ali nakon nekog vremena robot za pretraživanje pronalazi duplikate ovih stranica. Robot za pretraživanje ne razumije da je ovo duplikat, za njega su to dvije potpuno različite stranice, kao rezultat toga, prvobitno jedinstveni materijal više nije jedinstven.

Kao rezultat pojave velikog broja identičnih stranica (duplikata) na stranici, pozicija stranice u rezultatima pretraživanja može jako "sleći". Zato je vrijedno riješiti se dupliciranih stranica što je brže moguće.

Zašto se pojavljuju duplikati?

Duplikati u CMS Joomla pojavljuju se kao rezultat instaliranja dodatnih proširenja. Ali to nije jedini razlog njihovog nastanka.

Jednako čest razlog za stvaranje dupliciranih stranica je nepromišljena struktura stranice. Kako to može biti povezano, pitate se? Da, vrlo je jednostavno - stvorili ste nekoliko kategorija na web mjestu s jednom nadređenom kategorijom i stavili materijale u te kategorije. Unutar materijala postavljate poveznice na prethodno izrađene materijale i tako dalje. Za primjer pogledajte snimak zaslona:

Ako ne napravite izbornik za kategorije, adresa stranice može izgledati ovako:

Http://joom4all..php?option=com_content&view=article&id=38&catid=10

Adresa je daleko od savršene i htjeli ste se riješiti brojeva u adresnoj traci. Da biste to učinili, kreirate stavke izbornika za kategorije i materijal. Nakon ovoga, adresa se pokazala još privlačnijom:

Http://site/sites-creation/basics/intro

I sve bi bilo u redu, ali stare adrese stranica nisu nestale, ostale su kao duplikati. Kao rezultat toga, ista stranica može imati nekoliko adresa odjednom:

Http://site/32-sites-creation/10-basics/38-intro http://site/32-sites-creation/basics/intro http://joom4all..php?option=com_content&view=article&id=38&catid =10

Nije ugodna situacija, zar ne, osim toga, tražilice sve te stranice smatraju potpuno različitima.

Načini rješavanja dupliciranih stranica

Naravno, najbolje je izbjeći pojavu dupliciranih stranica u početnoj fazi - unaprijed razmislite o strukturi web mjesta, stvorite potrebne kategorije i stavke izbornika. No, kako praksa pokazuje, ne rade svi to, a s vremenom se postavlja pitanje kako ukloniti duplikate iz rezultata pretraživanja.

Postoji nekoliko opcija za rješavanje duplikata:

  • Korištenje posebnih nastavaka
  • datoteka robots.txt
  • Preusmjeri 301 u htaccess datoteci
  • Upotrijebite ploču za webmastere za uklanjanje nepotrebnih adresa
  • Komponenta preusmjeravanja

JL No Doubles dodatak za borbu protiv dupliciranih stranica

Najjednostavnije i ujedno dovoljno učinkovit način borba protiv dupliciranih stranica Ovo je upotreba ekstenzija. Jedno takvo proširenje je Dodatak JL No Doubles.

Dodatak je vrlo lagan i ne zahtijeva nikakve posebne postavke. Sve što trebate učiniti je preuzeti ovaj dodatak, instalirajte i omogućite. Ostatak posla obavit će sam.

Dodatak JL No Doubles uklanja duplicirane stranice u više od dvadeset komponenti, uključujući komponentu com_content. Možete konfigurirati izlaz pogreške 404 ili preusmjeravanje 301 na ispravna stranica mjesto. Stranica postavki dodatka izgleda ovako:

Postoji samo pet parametara za konfiguriranje dodatka:

  • Licencni ključ– za aktiviranje dodatka s komponentama k2, Virtuemart, Zoo.
  • Višestrukost granica– postavke za kategorije Joomla materijali. Možete postaviti preusmjeravanje kada stvarate veze poput /advanced?start=3. Sve što trebate učiniti je označiti broj materijala prikazanih u kategoriji.
  • Koristite 301 preusmjeravanja– možete omogućiti mogućnost korištenja preusmjeravanja na ispravnu stranicu ili (ako je postavljeno na “ne”) izdati pogrešku 404. Ako vaša stranica postoji dovoljno dugo vremena i druge stranice povezuju na njegove stranice, preporučam postavljanje preusmjeravanja kako ne biste izgubili na težini stranica.
  • Alias– postavka koja zamjenjuje pseudonim za veze kao što su komponenta/sadržaj/članak (početna prema zadanim postavkama).
  • Stop riječi– ovo su nizovi pronađeni u adresi stranice koji se ne bi trebali obrađivati.

Razvrstali smo osnovne postavke, sada idemo na karticu "Komponente":

Na ovoj kartici odabiremo komponente koje se koriste na stranici i dostupne su za indeksiranje. Prema zadanim postavkama, komponenta com_content je već odabrana. Ne biste trebali odabrati sve moguće komponente, pogotovo ako ih ne koristite, to će stvoriti nepotrebno opterećenje na vašoj stranici.

Korištenje datoteke Robots.txt

Bez obzira koliko izvrstan dodatak za preusmjeravanje stranica bio, nećete se moći riješiti svih duplikata. U tom slučaju možete zabraniti robotima za pretraživanje da indeksiraju određene stranice web mjesta, drugim riječima, blokirati pristup njima.

Već smo razgovarali o svim zamršenostima postavljanja datoteke Robots.txt u ovom članku. Ukratko ću samo reći da postoji naredba da se dio vas blokira od "očiju" robota Zabraniti .

301 redirect i htaccess datoteku

Drugi uobičajeni način rješavanja duplikata je postavljanje preusmjeravanja, drugim riječima, 301 preusmjeravanje na ispravnu stranicu. To se može učiniti u datoteci " .htaccess ».

Da biste kreirali preusmjeravanje, morate koristiti direktivu RewriteRule, ali morate biti sigurni da je mod_rewrite modul omogućen na vašem hostingu.

Php na web stranicu, za to u datoteci “.htaccess” nakon RewriteEngine On direktive pišemo sljedeći redak:

RewriteRule http://site/index.php$ http://site

U ovom smo članku detaljnije raspravljali o radu s datotekom ".htaccess".

Komponenta preusmjeravanja

Vrlo korisna, au isto vrijeme komponenta ugrađena u Joomla 3 koja vam omogućuje ručno konfiguriranje preusmjeravanja stranice. Ova komponenta za svoj rad koristi poseban dodatak koji je prema zadanim postavkama onemogućen.

U početku morate omogućiti dodatak, srećom ne morate ga tražiti među ostalima, jer nakon odlaska na stranicu “Komponente” -> “Preusmjeravanje” dobit ćete poruku da morate omogućiti dodatak i poveznicu za aktiviranje.

Nakon što je dodatak omogućen, možete stvoriti preusmjeravanje navođenjem početne (stare) i završne (nove) adrese stranice:

Ova metoda je dobra kada nema previše dupliciranih stranica.

Sažmimo to

Zaključno, želio bih reći da iako je Joomla poznata po stvaranju dupliciranih stranica, postoji mnogo načina da ih se riješite. Možete sami odlučiti koja je metoda najbolja, ali mogu reći da će integrirani pristup rješavanju ovog problema biti poželjniji. I trebali biste početi s pravim pristupom izradi strukture web stranice.

Osim toga, vrijedi razmisliti o tome kako se riješiti index.php u adresnoj traci web mjesta, to će također pomoći u smanjenju broja dupliciranih stranica.

Izrada i promoviranje web stranica na statičkom HTML-u sve je manje popularno, a većina webmastera prelazi na moderni CMS, posebice Joomlu, koja osim svojih prednosti može uznemiriti korisnika, prije svega dupliciranjem stranica. Dvostruke stranice u Joomli svojevrsna su pošast webmastera, iako su, iskreno, mnogi sustavi za automatizaciju web stranica krivi za to.

Traži duplikate

Prvo, da vidimo kako to odrediti duplicirane stranice i zašto negativno utječu na proces promocije web stranice. Najlakši način za utvrđivanje dupliciranja je korištenje naprednog pretraživanja na Yandexu, gdje unosimo vaš projekt u redak "site", a ovaj ili onaj upit u redak za pretraživanje. Kao rezultat toga, možete vidjeti stranice web mjesta prema njihovoj relevantnosti; postoje i stranice koje se međusobno dupliraju. Još je jednostavnije koristiti Netpeak Spider, koji će isprazniti stranice i pronaći duplikate u njima jednim klikom.

Drugo važno pitanje je zašto tražilice imaju negativan stav prema tome, jer se ne radi o namjernom pokušaju obmane tražilica, već tehnički problemi CMS, za koji bi, u principu, roboti trebali znati. Činjenica je da su roboti ti koji mogu identificirati takve stranice kao namjernu neželjenu poštu, jer se zapravo isti materijal nalazi na dvije različite adrese. Pokušaji dopisivanja s Yandexovom službom za podršku ne vode ništa, stoga pokušajte izbjeći duple Joomla stranice.

Brisanje duplikata

Zabrani: /traži/

Zabrani: /*.pdf

Zabrani: /*print=1

Onemogući: /*type=atom

Onemogući: /*type=rss

Onemogući: /*task=rss

Zabrani: /*?sl*

Zabrani: /*?sl*

Stoga je glavna baza skladišta u koju Joomla može ubaciti duplikate prekinuta. Ako netko stvarno mora otvoriti neke stranice, na primjer, za komponentu xmap, odnosno da bi dodao mapu web stranice na panel webmastera, tada se potrebne stranice lako mogu otvoriti pomoću direktive Allow: koja se nalazi ispred Zabrani:.

Međutim, meni osobno nisu dale život duplicirane Joomla stranice poput

A duge pretrage nisu dovele ni do čega pozitivnog osim ručnog zatvaranja stotina poveznica s lijeve strane u robots.txt. No, jednog dana odgovor je došao poput uvida i otvorio mi oči za najjednostavnije stvari, s kojima se, pouzdano znam, nisam samo ja susreo. Mnogi ljudi danas prakticiraju (i to rade ispravno) promociju web stranica u u društvenim mrežama, instaliranjem gumba za integraciju. U isto vrijeme, ne obraćaju svi pozornost na činjenicu da neki dodaci, kada se integriraju u Twitter, jednostavno prekinu vezu i da biste riješili problem morate konfigurirati ili zamijeniti dodatak, budući da roboti slijede vezu "tweet" i završavaju gore na svom izrezanom prikazu, u koji ulaze zbog svog elektroničkog neznanja da ga indeksiraju.

Problem se pokazao jednostavan kao bakreni lavor, šteta što se na ovaj način uklanja samo dio hvatova, iako me to najviše zabrinulo. Ispostavilo se da se neke pogreške optimizacije još uvijek pojavljuju zbog kombinacije propusta webmastera i nedostataka CMS-a, pa se to može i treba riješiti. Sretno.

Ako niste zadovoljni duplikatima poput /sobstven-sate/eksperiment-seo/383.html, odnosno skraćenim adresama stranica, upotrijebite dodatak za Joomla Shnodoubles koji možete pronaći guglanjem ili pisanjem meni u komentarima, s njim sam u potpunosti riješio problem u nekoliko minuta minuta. Nakon što sam razmislio o tome i umoran od otkazivanja pretplate, predlažem da preuzmete nodoubles za Joomlu izravno sa stranice.

Također nudim video o uklanjanju duplikata u Joomli korištenjem 301 preusmjeravanja -

Pitanja i odgovori

Je li moguće automatski se riješiti duplikata?

Odsutnost duplikata je 90% zajamčena u automatskom načinu rada. Za Joomlu je dovoljno konfigurirati robote i htaccess, kao i pozabaviti se spajanjem stranica u glavnu navigaciju. Međutim, kako se stranica širi, mogu se pojaviti duplikati, stoga ih pratite putem Netpeak Spidera.

Zar PS pauci ne razumiju da su duplikati na Joomli pogreška programera?

Zašto vlasnik ne ispravi ovu grešku? Ako kupite auto s kvarom, nećete se žaliti da vas je prometna policija kaznila zbog činjenice da se prednja svjetla ne pale ili ispušni plinovi ne zadovoljavaju standarde? Nema smisla kontaktirati podršku jer se CMS ne plaća.

Danas rijetko kažnjavaju oštre kazne za duplikate, ali... Ako, na primjer, duplicirane stranice, imate 3-4 dokumenta u pretrazi s istim sadržajem, ali različitim URL-ovima, mislite li da će statička težina biti maksimalna na svakoj od njih, ili će se razmazati? Na kraju, na vama je da odlučite treba li vam ukrasno smetlište ili želite dijeliti informacije s korisnicima i za to primati zaradu kada ispravna postavka CMS.