Duplicați pagini în joomla k2. Duplicați pagini Joomla - cum să scăpați de ele. Deci, ce face de fapt Joomla pentru a evita duplicatele?

06.11.2019 Programe

JL No Doubles - pluginul este conceput pentru a ajuta persoanele care au probleme cu paginile duplicate, îmbinând multe pagini identice într-una singură, redirecționând de la pagina greșită la cea corectă. Pluginul poate fi folosit și pentru a forma structura corectă a site-ului atunci când acesta se modifică. Să presupunem că ați schimbat alias-ul unui element de meniu sau ați mutat un articol într-o altă secțiune.

Acest plugin este simplu și instrument la îndemână, pentru a reduce duplicatele de mai multe ori. Să presupunem că site-ul web Joomline a redus duplicatele de 4 ori după ce a început să folosească acest plugin.

Pluginul se bazează pe Shnodoubles, trimis la Hekima pentru suport Joomline.

Setul include:

  • Pluginul JL No Doubles.

Atenţie! Pluginul nu funcționează cu componente SEF terțe! Pluginul nu funcționează dacă SEF Joomla este dezactivat. Este posibil să existe o problemă cu adresele URL chirilice.

Cea mai recentă versiune actuală pentru Joomla 2.5 este 2.2.0

Unde să folosești pluginul?

Structura site-ului

Eliminați duplicatele care sunt în motoare de căutare. Redirecționări automate atunci când structura site-ului se modifică.

În alte componente

Puteți utiliza pluginul în: K2, Virtuemart, JoomShopping, HikaShop, Grădină zoologică.

Exemple de utilizare

În Joomla, o pagină poate avea o mulțime de adrese și poate rămâne aceeași pagină.

De exemplu, site-ul Joomline are următoarele pagini:

http://site/index.php?option=com_content&view=article&id=498&catid=37&Itemid=199

http://site/index.php?option=com_content&view=article&id=498

http://site/novosti/498-den-rozhdeniya-joomline-skidki.html

http://site/novosti/498-den-rozhdeniya-joomline-skidki

http://site/novosti/498

Și multe alte pagini similare și toate aceste pagini pot intra în indexul motorului de căutare. De fapt, este foarte neplăcut când mergi la Yandex webmaster sau Google webmaster și vezi pe site-ul tău că există 100 de pagini din 1000 sau chiar mai multe. Din acest motiv, site-ul dvs. poate avea un clasament slab și, în general, întâmpină multe dificultăți.

Caracteristicile JL No Doubles:

  • Suport Joomla 3.
  • Localizare: rusă și engleză.
  • Posibilitatea de a configura o redirecționare 301 către pagina corectă.
  • Posibilitatea de a da o eroare 404 atunci când ajungeți pe o pagină incorectă.
  • Posibilitatea de a seta excepții pentru orice componentă instalată pe site.
  • Lucrul cu com_content (materiale Joomla), com_tag (etichete Joomla).
  • Lucrul cu meniul Joomla.
  • Suport: K2, Virtuemart, ZOO, JoomShopping, HikaShop.
  • JoomShopping acceptă: carduri de produse, categorii și producători.
  • Suportul profund pentru categoriile Joomla, paginarea și tot felul de categorii duplicate sunt procesate corect.
  • Suport pentru excluderea expresiilor regulate. Util pentru tot felul de sisteme de statistici și extensii care nu respectă regulile routerului Joomla.
  • Suport pentru site-uri multilingve.
  • Suport pentru adrese URL chirilice

Bună ziua tuturor, dacă citiți acest articol, înseamnă că, la fel ca mulți dezvoltatori web începători, aveți o întrebare complet legitimă - cum să faci față paginilor duplicate în Joomla.

În acest articol voi încerca să răspund la această întrebare. Mai întâi, să vorbim despre pericolele apariției paginilor duplicate pe site, apoi vom vedea soluții gata făcute lupta împotriva duplicaturilor și, în sfârșit, uită-te la alternative modalități de a trata paginile duplicate.

De ce merită să scapi de paginile duplicat?

Nu este un secret pe care îl creează Joomla, ca orice alt sistem de management al conținutului pagini identice disponibil la diferite adrese de site-uri web - duplicate. Pentru vizitatorii site-ului dvs., aceleași pagini sunt inofensive; este posibil să nu fie conștienți de existența lor.

Cu toate acestea, duplicatele care sunt inofensive pentru vizitatori pot afecta semnificativ poziția site-ului în rezultatele cautarii. De ce se întâmplă asta?

Să ne imaginăm o situație - ați scris mai multe materiale unice și le-ați publicat pe site-ul dvs. Roboții de căutare le-au indexat, totul este în regulă, dar după ceva timp robotul de căutare găsește duplicate ale acestor pagini. Robotul de căutare nu înțelege că acesta este un duplicat, deoarece acestea sunt două pagini complet diferite, ca urmare, materialul inițial unic nu mai este unic.

Ca urmare a apariției unui număr mare de pagini identice (duplicate) pe site, poziția site-ului în rezultatele căutării se poate „scădea” foarte mult. De aceea, merită să scapi de paginile duplicate cât mai repede posibil.

De ce apar duplicatele?

Duplicatele în CMS Joomla apar ca urmare a instalării extensiilor suplimentare. Dar acesta este departe de singurul motiv pentru formarea lor.

Un motiv la fel de comun pentru formarea paginilor duplicate este o structură a site-ului neconsiderată. Cum se poate conecta acest lucru, vă întrebați? Da, este foarte simplu - ați creat mai multe categorii pe site cu o singură categorie părinte și ați plasat materiale în aceste categorii. În interiorul materialelor creați legături către materiale create anterior și așa mai departe. Pentru un exemplu, uitați-vă la captura de ecran:

Dacă nu creați un meniu pentru categorii, atunci adresa paginii poate arăta astfel:

Http://joom4all..php?option=com_content&view=article&id=38&catid=10

Adresa este departe de a fi perfectă și ai vrut să scapi de numerele din bara de adrese. Pentru a face acest lucru, creați elemente de meniu pentru categorii și materiale. După aceasta, adresa s-a dovedit a fi mai atractivă:

Http://site/sites-creation/basics/intro

Și totul ar fi bine, dar adresele vechi ale paginilor nu au dispărut, rămân ca duplicate. Ca urmare, aceeași pagină poate avea mai multe adrese simultan:

Http://site/32-sites-creation/10-basics/38-intro http://site/32-sites-creation/basics/intro http://joom4all..php?option=com_content&view=article&id=38&catid =10

Nu este o situație plăcută, nu-i așa că, în plus, roboții de căutare consideră toate aceste pagini complet diferite.

Modalități de a face față paginilor duplicate

Desigur, cel mai bine este să evitați apariția paginilor duplicate în etapa inițială - gândiți-vă în prealabil la structura site-ului, creați categoriile și elementele de meniu necesare. Dar, după cum arată practica, nu toată lumea face acest lucru și, în timp, apare întrebarea cum să eliminați duplicatele din rezultatele căutării.

Există mai multe opțiuni pentru a trata duplicatele:

  • Folosind extensii speciale
  • Fișierul Robots.txt
  • Redirecționează 301 în fișierul htaccess
  • Utilizați panoul pentru webmasteri pentru a elimina adresele inutile
  • Componenta de redirecționare

Plugin JL No Doubles pentru combaterea paginilor duplicate

Cel mai simplu și în același timp suficient mod eficient combaterea paginilor duplicate Aceasta este utilizarea extensiilor. O astfel de extensie este Pluginul JL No Doubles.

Pluginul este foarte ușor și nu necesită setări speciale. Tot ce trebuie să faceți este să descărcați acest plugin, instalați și activați. El va face singur restul muncii.

Pluginul JL No Doubles elimină paginile duplicate din mai mult de douăzeci de componente, inclusiv componenta com_content. Puteți configura rezultatul unei erori 404 sau a unei redirecționări 301 către pagina corecta site-ul. Pagina de setări a pluginului arată astfel:

Există doar cinci parametri pentru configurarea pluginului:

  • Cheie de licență– pentru a activa pluginul cu componentele k2, Virtuemart, Zoo.
  • Multiplicitatea limitelor– setări pentru categorii Materiale Joomla. Puteți configura o redirecționare când creați linkuri precum /advanced?start=3. Tot ce trebuie să faceți este să indicați numărul de materiale afișate în categorie.
  • Utilizați redirecționări 301– puteți activa capacitatea de a utiliza o redirecționare către pagina corectă sau (dacă este setată la „nu”) emite o eroare 404. Dacă site-ul tău există suficient pentru o lungă perioadă de timp si alte site-uri link la paginile sale, recomand setarea unei redirectionari pentru a nu pierde din greutatea paginilor.
  • Alias– o setare care înlocuiește un alias pentru link-uri precum component/conținut/articol (acasă în mod implicit).
  • Cuvinte oprite– acestea sunt șiruri găsite în adresa paginii care nu ar trebui procesate.

Am rezolvat setările de bază, acum să mergem la fila „Componente”:

Pe această filă, selectăm componente care sunt utilizate pe site și sunt disponibile pentru indexare. În mod implicit, componenta com_content este deja selectată. Nu ar trebui să selectați toate componentele posibile, mai ales dacă nu le utilizați, acest lucru va crea încărcare inutilă pe site-ul dvs.

Folosind fișierul Robots.txt

Indiferent cât de grozav este pluginul de redirecționare a paginii, nu veți putea scăpa de toate duplicatele. În acest caz, puteți interzice roboților de căutare să indexeze anumite pagini ale site-ului, cu alte cuvinte, blocați accesul la acestea.

Am discutat deja despre toate complexitățile instalării fișierului Robots.txt în acest articol. Pe scurt, voi spune doar că există o directivă de a bloca o parte din tine de „ochii” robotului Nu permiteți .

301 redirecționare și fișier htaccess

Un alt mod obișnuit de a trata duplicatele este să configurați o redirecționare, cu alte cuvinte, o redirecționare 301 către pagina corectă. Acest lucru se poate face în fișierul " .htaccess ».

Pentru a crea o redirecționare, trebuie să utilizați directiva RewriteRule, dar trebuie să vă asigurați că modulul mod_rewrite este activat pe găzduirea dvs.

Php la pagina site-ului web, pentru aceasta în fișierul „.htaccess” după directiva RewriteEngine On scriem următoarea linie:

RewriteRule http://site/index.php$ http://site

Am discutat despre lucrul cu fișierul „.htaccess” mai detaliat în acest articol.

Componenta de redirecționare

Destul de utilă și, în același timp, o componentă încorporată în Joomla 3 care vă permite să configurați manual redirecționarea paginii. Această componentă folosește un plugin special pentru funcționarea sa, care este dezactivat implicit.

Inițial, trebuie să activați pluginul, din fericire nu trebuie să îl căutați printre altele, deoarece după ce mergeți la pagina „Componente” -> „Redirecționare” veți primi un mesaj că trebuie să activați pluginul și un link pentru a-l activa.

După ce pluginul este activat, puteți crea o redirecționare specificând adresa de început (veche) și de sfârșit (nouă) a paginii:

Această metodă este bună atunci când nu există prea multe pagini duplicat.

Să rezumam

În concluzie, aș vrea să spun că, deși Joomla este renumit pentru crearea de pagini duplicat, există multe modalități de a scăpa de ele. Puteți decide singur care metodă este cea mai bună, dar pot spune că o abordare integrată pentru rezolvarea acestei probleme va fi de preferat. Și ar trebui să începeți cu abordarea corectă pentru crearea unei structuri de site web.

În plus, merită să vă gândiți cum să scăpați de index.php din bara de adrese a site-ului, acest lucru va ajuta și la reducerea numărului de pagini duplicat.

Am vorbit despre motivul pentru care apar și despre cum să le căutăm. În acest articol, vă voi spune cum puteți elimina duplicatele sau cum le puteți împiedica să apară în rezultatele căutării.

Deoarece fiecare caz este individual, vom lua în considerare cele mai populare metode, care funcționează perfect în 99% din cazuri. Puteți alege unul pentru dvs. sau îl puteți utiliza în combinație.

Deși toate aceste metode sunt aplicabile oricărui alt sistem CMS, mă voi opri în detaliu asupra caracteristicilor Joomla.

Toate aceste exemple sunt valide dacă ați activat SEF standard și redirecționarea URL în setările globale ale lui J.

  • 1. Plugin pentru Joomla

Primul lucru pe care îl puteți face dacă aveți confuzie în adresele URL (când link-urile sunt formate atât din alias-ul categoriei, cât și din elementul de meniu) este să instalați pluginul Shnodoubles de la sherza.

Plugin excelent, își face față sarcinii 100%. După instalarea acestuia, linkul format incorect (din alias-ul categoriei) este redirecționat către cel corect (din elementul de meniu). Puteți descărca acest plugin minunat care elimină duplicatele pentru Joomla 2.5 (link direct!)

După activarea pluginului, unele duplicate vor rămâne pur și simplu împreună.

  • 2. Robots.txt pentru Joomla

Acest fișier vine în distribuția standard Joomla, se află în rădăcină și este disponibil la link-ul site.ru/robots.txt. Scopul principal este că oferă instrucțiuni de căutare roboților pentru indexarea site-ului. Cu ajutorul lui puteți închide câteva secțiuni (de care aveți nevoie) ale site-ului, este și suportat expresii obisnuite– poate fi închis pagini individuale prin mască.

Cel mai adesea folosesc această instrucțiune (în plus față de ceea ce vine în fișierul implicit):

Doar o singură linie scapă de o cantitate mare de gunoi. Poate fi:

  • pagini pentru materiale de tipărire, conțin și print= sau tmpl=component în URL-uri
  • link-uri către fluxul rss
  • paginile cu rezultatele căutării pe site
  • va închide și paginile de paginare
  • Pot exista și alte opțiuni, în funcție de extensiile utilizate

Dacă utilizați această linie sau blocați fiecare tip de pagină individual, este la discreția dvs., dar rețineți că prea mulți roboți sunt considerați complet permisivi. De asemenea, merită să vă asigurați că această linie nu acoperă ceva important, de exemplu, o hartă a site-ului - în acest caz, puteți scrie: Allow: /path_to_map

Puteți citi mai multe despre utilizarea robots.txt în ajutorul Yandex - help.yandex.ru/webmaster/?id=996567

  • 3. Atributul rel="canonical" al etichetei

Folosirea acestui atribut va ajuta robotul să determine ce pagini ar trebui incluse în index și care nu. Dacă pe site există pagini foarte asemănătoare (dubluri neclare), care diferă doar, de exemplu, în opțiunile de sortare - cele noi de la început, sau sortați în ordine crescătoare sau afișați cu 20-30 etc., atunci puteți utiliza acest atribut. În acest caz, va trebui să selectați o pagină canonică, care va fi clasată și să adăugați rel = „canonic” la restul indicând pagina selectată - astfel de documente nu vor fi incluse în rezultatele căutării, robotul va ști că acestea nu trebuie incluse în index.

Pentru mai multe informații despre cum să implementați rel="canonical" în Joomla 1.7/2.5, consultați

  • 4. 301 redirecționare

Este indicat să se folosească dacă ați schimbat adresele paginilor, dar documentele încă există, adică nu le-ați șters. În acest caz, pentru lipirea corectă, se recomandă utilizarea unei redirecționări 301 în .htaccess - motoarele de căutare vor ști că documentul s-a mutat la o nouă adresă. Această metodă vă permite să salvați indicatorii site-ului – Tietz și PR.

Redirecționările 301 pot fi folosite și pentru a îmbina duplicatele. De exemplu, luări binecunoscute pagina principala site-ul de pe Joomla este /index.php și alias-ul elementului de meniu Acasă, de exemplu, /home sau /homepage

Lipirea lor este destul de simplă, deschideți .htaccess și intrați

Redirecționare 301 /index.php http://site.ru/

Sau puteți face o redirecționare 301 către php în fișierul index al șablonului dvs

if($_SERVER["REQUEST_URI"] == "/index.php") (
antet("Locație: /",TRUE,301);
Ieșire();
}
?>

Și vă voi oferi o redirecționare clasică de la www la fără www

RewriteEngine Pornit
RewriteCond %(HTTP_HOST) ^www.example.ru$
RewriteRule ^(.*)$ http://example.ru/$1

* example.ru înlocuiți cu numele dvs. de domeniu.

  • 5. Meta-roboți etichetă

O altă modalitate de a preveni indexarea duplicaturilor în Joomla este să utilizați o metaetichetă:

Pe acest moment Această metodă este mai eficientă pentru Google decât interzicerea instrucțiunilor din fișierul robots.txt. De exemplu, pentru a bloca paginile tipărite și duplicatele de la?tmpl=component de la indexare, puteți deschide fișierul component.php din rădăcina șablonului și introduceți această etichetă în .

Pentru a închide paginile cu rezultatele căutării de pe un site web utilizând com_search standard, puteți adăuga o condiție la index.php al șablonului



Dar mai întâi trebuie să definiți o variabilă

$opțiune = JRequest::getVar(„opțiune”, null);

Nu voi intra prea adânc în condițiile din șabloane, nu despre asta este vorba în articol, sper că principiul este clar.

  • 6. Eliminarea adresei URL din panou

O alta cale rapidă– eliminare manuală din panoul webmaster.

Pentru Yandex, trebuie să mergeți la adresa - webmaster.yandex.ru/delurl.xml

Există încă o metodă nu foarte populară de a elimina duplicate Joomla din rezultatele căutării, dar o vom lua în considerare și noi.

  • 7. X-Roboți-Anteturi de etichete

Un titlu destul de rar, folosit mai des de optimizatorii străini, funcționează pentru Google. Din păcate, Yandex nu a comentat încă despre suportul pentru acest antet http.

HTTP/1.1 200 OK
Data: marți, 25 mai 2010 21:42:43 GMT
...
X-Robots-Tag: noindex
...

După cum puteți vedea, există multe modalități de a elimina conținutul Joomla duplicat; ar trebui să înțelegeți cel puțin cum funcționează fiecare dintre ele pentru a alege cea mai potrivită opțiune și a o aplica situației dvs.

Crearea și promovarea site-urilor web pe HTML static devine din ce în ce mai puțin populară, iar majoritatea webmasterilor trec la CMS modern, în special Joomla, care, pe lângă avantajele sale, poate și supăra utilizatorul, în primul rând, prin duplicarea paginilor. Paginile duplicate în Joomla sunt un fel de flagel al unui webmaster, deși, sincer, multe sisteme de automatizare a site-urilor web sunt vinovate de acest lucru.

Căutați duplicate

Mai întâi, să vedem cum să determinăm pagini duplicateși de ce afectează negativ procesul de promovare a site-ului web. Cel mai simplu mod de a determina duplicarea este să utilizați căutarea avansată pe Yandex, unde introducem proiectul dvs. în linia „site” și cutare sau cutare interogare în linia de căutare. Ca urmare, puteți vedea paginile site-ului în funcție de relevanța lor; există și pagini care se dublează între ele. Este și mai ușor să utilizați Netpeak Spider, care va descărca paginile și va găsi duplicate în ele cu un singur clic.

A doua întrebare importantă este de ce motoarele de căutare tratează acest lucru negativ, deoarece aceasta nu este o încercare deliberată de a înșela motoarele de căutare, ci probleme tehnice CMS, despre care, în principiu, roboții ar trebui să știe. Adevărul este că roboții sunt cei care pot identifica astfel de pagini ca spam deliberat, deoarece, de fapt, același material este furnizat la două adrese diferite. Încercările de a coresponde cu serviciul de asistență Yandex nu duc la nimic, așa că ar trebui să încercați să evitați paginile Joomla duplicate.

Ștergerea duplicatelor

Nu permiteți: /căutare/

Nu permiteți: /*.pdf

Nu permiteți: /*print=1

Nu permiteți: /*type=atom

Nu permiteți: /*type=rss

Nu permiteți: /*sarcina=rss

Nu permite: /*?sl*

Nu permite: /*?sl*

Astfel, baza principală a depozitului în care Joomla poate umple duplicate este tăiată. Dacă cineva chiar trebuie să deschidă unele pagini, de exemplu, pentru componenta xmap, adică pentru a adăuga o hartă a site-ului la panoul webmaster, atunci paginile necesare pot fi deschise cu ușurință folosind directiva Allow:, care este plasată înainte Nu permite:.

Cu toate acestea, personal nu am fost dat viață de paginile Joomla duplicate, cum ar fi

Și căutările lungi nu au dus la nimic pozitiv, cu excepția închiderii manual a sutelor de link-uri din partea stângă în robots.txt. Cu toate acestea, într-o zi răspunsul a venit ca o perspectivă și mi-a deschis ochii asupra celor mai simple lucruri, pe care, știu sigur, nu am fost singurul care l-a întâlnit. Mulți oameni practică astăzi (și o fac corect) promovarea site-ului în în rețelele sociale, prin instalarea butoanelor pentru integrare. În același timp, nu toată lumea acordă atenție faptului că unele plugin-uri, atunci când sunt integrate în Twitter, pur și simplu întrerup legătura și pentru a rezolva problema trebuie să configurați sau să înlocuiți pluginul, deoarece roboții urmează linkul „tweet” și se termină. sus pe vizualizarea sa decupată, în care intră din cauza ignoranței lor electronice pentru a indexa.

Problema s-a dovedit a fi la fel de simplă ca un bazin de cupru, este păcat că doar o parte din capturi sunt îndepărtate în acest fel, deși aceasta este partea care m-a îngrijorat cel mai mult. Se pare că unele erori de optimizare apar încă din cauza unei combinații de supraveghere a webmasterului și defectele CMS, așa că acest lucru poate și ar trebui să fie tratat. Noroc.

Dacă nu sunteți mulțumit de duplicate precum /sobstven-sate/eksperiment-seo/383.html, adică adrese de pagini scurtate, utilizați pluginul pentru Joomla Shnodoubles, pe care îl puteți găsi pe google sau scriindu-mi în comentarii, cu el am rezolvat complet problema în câteva minute minute. M-am gândit la asta și am obosit să mă dezabonez, sugerez să descărcați nodoubles pentru Joomla direct de pe site.

Ofer și un videoclip despre eliminarea duplicatelor în Joomla folosind o redirecționare 301 -

Intrebari si raspunsuri

Este posibil să scapi automat de duplicatele?

Absența duplicaturilor este garantată în proporție de 90% în modul automat. Pentru Joomla, este suficient să configurați roboți și htaccess, precum și să vă ocupați de îmbinarea paginilor în navigarea principală. Cu toate acestea, pe măsură ce site-ul se extinde, pot apărea duplicate, așa că urmăriți-le prin Netpeak Spider.

Nu înțeleg păianjenii PS că duplicatele de pe Joomla sunt o greșeală a dezvoltatorilor?

De ce această eroare nu este corectată de proprietar? Dacă cumpărați o mașină cu un defect, atunci nu vă veți plânge că poliția rutieră v-a amendat pentru faptul că farurile nu se aprind sau gazele de eșapament nu respectă standardele? Nu are rost să contactați asistența, deoarece CMS-ul nu este plătit.

În zilele noastre rareori se amendează dur pentru duplicate, dar... Dacă, de exemplu, pagini duplicate, ai în căutare 3-4 documente cu același conținut, dar URL-uri diferite, atunci crezi că greutatea statică va fi maximă pe fiecare dintre ele, sau se va pata? În cele din urmă, rămâne la latitudinea dvs. să decideți dacă aveți nevoie de un site de gunoi decorativ sau dacă doriți să împărtășiți informații cu utilizatorii și să primiți profit pentru el atunci când setare corectă CMS.