Duplikált tartalom
A duplikált tartalom definíciója
A duplikált tartalmak olyan tartalmak, amelyek több helyen is előfordulnak az interneten. Több hely alatt különböző URL-eket értünk, tehát ha egy tartalom két weboldalon is szerepel (akár egy webhelyen belül, akár két külön webhelyen), akkor duplikált tartalmakról van szó.
Mi a baj a duplikált tartalmakkal?
A duplikált tartalom sok fejfájást okozhat a webmestereknek, ugyanis habár a Google konkrétan nem szab ki büntetést értük, súlyosan ronthatják egy webhely vagy weboldal rangsorolását.
A probléma a keresőmotorok szempontjából
A duplikált tartalmak több ízben is bajosak a keresőmotorok részéről, ugyanis nem tudják, hogy mely verziókat vegyék be indexükbe, hogy egy, vagy több verzió között osszák-e szét a linktekintélyt, illetve hogy mely verzió(ka)t rangsorolják a különböző releváns keresésekre.
A probléma a webmesterek szempontjából
Ha duplikált tartalmak szerepelnek a webhelyen, akkor veszélyeztethetik tartalmak rangsorolását, ami forgalomkiesést eredményezhet.
Hogy a lehető legjobb keresőélményt biztosítsák, a keresőmotorok ritkán mutatják ugyan azon tartalom több verzióját, és igyekeznek inkább a lehető legjobb találatot kiválasztani ezek közül. Ez erősen felhígítja az összes verzió láthatóságát.
A problémát tovább fokozza, hogy ha egy másik webhely szeretne egy olyan tartalomra hivatkozni, amely több helyen is megtalálható az interneten, akkor nem minden hivatkozás mutat majd ugyan arra a verzióra, ezzel szétosztva a linktekintélyt is, amelyet ezek a visszahivatkozások örökítenek (és amelyek az eredeti forrást illetnék meg).
Mindez alacsonyabb rangsorolást és láthatóságot eredményez majd annak ellenére, hogy a tartalom jó minőségű, és sokkal „többre lenne képes”.
Hogyan jöhetnek létre a duplikált tartalmak?
Az esetek többségében a webmesterek nem szándékosan hozzák létre a duplikált tartalmakat, azonban ennek ellenére a becslések szerint az internet durván 29%-a áll ilyen jellegű tartalmakból. Íme néhány eset, amely duplikált tartalmakat eredményezhet.
URL változatok
Az URL paraméterek, például a kattintáskövető, és analitikai kódok duplikált tartalmakat okozhatnak. Ezekért nem csak maguk a paraméterek felelősek, hanem az is számít, hogy ezek milyen sorrendben helyezkednek el az URL-ben.
Hasonló problémaforrást jelentenek a munkamenet-azonosítók. Ezek akkor vannak jelen, amikor minden webhelyre érkező felhasználó egy másik azonosítót kap, amely az URL-ben szerepel.
Gond lehet még az is, ha egy weboldalnak nyomtatóbarát verziója is van, amelyet szintén az URL alapján különböztetünk meg, és ez a verzió is indexelésre kerül.
Ezeket a problémákat egyszerűbb elkerülni, mint megoldani – próbálj ne olyan URL szerkezeteket kialakítani, amelyek paramétereket használnak, vagy más verziókat jelölnek (ezeket szkriptek segítségével is tovább lehet adni).
HTTP, HTTPS, illetve WWW és nem WWW oldalak
Ha webhelyednek külön verziói vannak (www.webhelyem.hu és webhelyem.hu), akkor az ezeken szereplő tartalmakat a keresőmotorok különálló, de megegyező, tehát duplikált tartalmaknak tekintik. Ugyan ez a helyzet, ha webhelyed korábbi, HTTP verziója is megvan még az új, HTTPS verzió mellett. Ha mindkettő látható a keresőmotoroknak, akkor jó eséllyel sok duplikált problémád lesz.
Másolt, átvett tartalmak
Nem csak a blogbejegyzések és egyéb szerkesztői szövegek számítanak tartalmaknak, hanem például a termékoldalakon található tulajdonságok is. Ez egy gyakori probléma a webáruházakban, ahol két nagyon hasonló termék adatlapja szinte szóról szóra megegyezik egymással, és csak néhány jellemzőben térnek el egymástól (például szín, méret, stb.)
Gondot okozhat az is, amikor több viszonteladó webhelyén jelenik meg ugyan az a gyártói leírás egy termékről – például amikor több webáruház is ugyan azt az okostelefont árulja, és mindegyik simán csak bemásolja a termék leírását a gyártó webhelyéről.
Mi a megoldás a duplikált tartalmakra?
A duplikált tartalmakat sokkal egyszerűbb megelőzni vagy kiküszöbölni, de ez nem minden esetben lehetséges (például a fenti webáruházas példa esetén). A duplikált tartalmakból származó problémákat általában minden esetben ugyan úgy szokás megoldani: ki kell jelölni az egyetlen „hivatalos” verziót a sok közül.
Ha egy tartalom több helyen is szerepel egy webhelyen (és szeretnéd, hogy ez így is maradjon), akkor „kanonizálni” kell az elsődleges verziót a keresőmotorok számára. Ezt többféleképpen is megteheted, és a céljaidtól, illetve a helyzetedtől függ, hogy melyiket használod majd.
301-es átirányítás
Sok esetben úgynevezett 301-es átirányítást kell alkalmazni a duplikált tartalmak oldalairól a hivatalos, elsődleges oldalra. Ilyenkor a hivatalos oldalra összpontosul majd a keresőmotorok figyelme, és a linktekintély is.
Rel=”canonical” címke
Egy másik megoldás rel=”canonical” attribútummal megjelölni a tartalmat. Ezzel azt jelezheted a keresőmotoroknak, hogy kezeljék úgy az adott oldalt, mintha az egy másik, kijelölt URL másolata volna. Ilyenkor minden hivatkozás, ami erre az oldalra mutat valójában a megjelölt, „kanonikus” URL-t „erősíti” majd. Ehhez részletes útmutatót a Google Súgójában találsz.
Noindex címke
Hasznos a noindex címke is, amellyel megakadályozható, hogy a keresőmotorok indexeljék az adott oldalt. Ezt az oldal HTML forráskódjában kell elhelyezni, és érdemes feljegyezni, hogy mely oldalak tartalmazzák, mert ha megfeledkezel róla, akkor nehéz lesz rájönni, hogy miért nem rangsorol az oldal, ha később mégis szeretnéd, hogy indexeljék a motorok.
Ezt a robot.txt fájlban is elvégezheted, de ezzel légy óvatos, mert könnyedén tönkreteheted vele webhelyed indexeltségét, viszont egy helyen sorolhatod fel az összes noindexelt oldaladat.
Előnyben részesített domain beállítása a Search Console-ban
A Google Search Console lehtővé teszi, hogy beállíts egy preferált domaint webhelyed számára, és megszabd, hogy a Google indexelő robotja másképpen kezelje-e a különböző URL paramétereket. Ezen opciók beállításával számos duplikált tartalomból származó problémát oldhatsz meg/kerülhetsz el.
A megoldás egyetlen hátulütője, hogy csak a Googlebotra van hatással, és nem változtatja meg, hogy hogyan szemléli webhelyedet a Bing vagy a Yahoo keresője – ezeknek a keresőmotoroknak saját kezelőfelülete van (mint amilyen a Google Search Console-ja is), és ezekben kell megkeresned, hogy hogyan állíthatod be az URL-ek kezelését.
A Google itt kínál segítséget ehhez.
Gyakori kérdések
Mi az a duplikált tartalom?
A duplikált (vagy többszörösen előforduló) tartalmak olyan tartalmak, amelyek több webhelyen, vagy egy webhely több oldalán is megtalálhatók az interneten.
Miért kell foglalkozni a duplikált tartalmakkal?
Annak ellenére, hogy a Google nem bünteti őket, a duplikált, azaz többször előforduló tartalmak jelentősen leronthatják egy webhely rangsorolásait a találati oldalakon. A keresőmotorok megzavarodhatnak, ha nem tudják, hogy mely tartalmakat jelenítsék meg az adott kulcsszóra a sok közül.
Mi okozhat duplikált tartalmakat?
Ha egy webhely URL paramétereket használ; ha egy webhely oldalai HTTP, HTTPS, WWW és nem WWW címeket is elérhetők; illetve, ha egy webhelyre máshonnan másolnak át tartalmakat.
Mit lehet tenni a duplikált tartalmakkal?
Jellegüktől függően duplikált tartalmak problémája orvosolható 301-es átirányításokkal, kanonizálással, illyetve a noindex címke használatával. Továbbá, érdemes lehet beállítani az előnyben részesített domaint a Google Search Console felületén.