W tym artykule przeczytasz:

Odpowiadamy na pytania!

Duplicate content dzielimy na zewnętrzny i wewnętrzny. Duplikacja zewnętrzna to powielanie treści pod wieloma adresami url natomiast wewnętrzna odnosi się do duplikacji w obrębie jednej domeny. W tym przypadku najczęściej problem tkwi w błędnym ustawieniu przekierowań wersji tej samej strony. Gdy strona jest dostępna pod adresem z www, bez www, http, https to jest ona odbierana jako duplikat. Kwestia przekierowań może zostać rozwiązana w pliku .htaccess ale nie tylko. Przekierowania można ustawiać na serwerze lub wdrażając przekierowania na stronie za pomocą PHP lub w JavaScript. Jak to dokładnie wygląda? Dowiesz się poniżej.

Czym jest duplicate content?

Głównym celem efektywnie działającego content marketingu jest tworzenie i dystrybucja unikalnej, dobrze zoptymalizowanej i wartościowej treści. Z duplicate content (DC) mamy do czynienia, gdy opublikowany tekst znajduje się pod kilkoma adresami URL. Powielanie treści często jest wynikiem nieświadomych działań, wynikających z braku odpowiedniej wiedzy na ten temat. Mówiąc o duplicate content należy wspomnieć o dwóch jego rodzajach:

Treść powielona w obrębie jednej witryny

Jak sam nagłówek wskazuje, mowa tutaj o duplicate content wewnętrznym, czyli powielaniu treści w ramach jednej domeny. Powodem wystąpienia problemu jest najczęściej popełnienie kilku podstawowych błędów tj.:

👉 brak przekierowań 301, kilka adresów prowadzi do jednej podstrony, tworząc duplikat np.

  • http://domena.pl,
  • http://www.domena.pl,
  • https://domena.pl,
  • https://www.domena.pl,
  • https://domena.pl/index.html,
  • https://domena.pl/index.php,
  • https://domena.pl/index.html?utm_source=rss itp.

Wszystkie powyższe adresy mogą wyświetlać tę samą treść strony głównej.

👉 Powielanie opisów produktów w sklepie internetowym - każdy opis powinien być unikalny, ukazujący specyfikację i zalety produktu.

👉 Powielanie opisu kategorii - zdarza się, że główny opis kategorii zostaje celowo powielony na stronicowaniu, filtrowaniu lub sortowaniu danej kategorii. Cel ⇛ Pomoc przy wyborze produktów. Efekt ⇛ Duplicate content.

👉 Duplikacja pierwszej strony paginacji kategorii - błędem, który często pojawia się w tym przypadku jest powielanie pierwszej strony kategorii która dostępna jest pod adresem domena.pl/kategoria i np. domena.pl/kategoria?page=1. W efekcie otrzymujemy zduplikowaną stronę, na której treść nie różni się niczym w odniesieniu do strony bez paginacji tj. domena.pl/kategoria.

👉 Wdrożenie wersji językowej - kilkukrotnie spotkałam się z błędem iż, nie wszystkie podstrony danej witryny zostają przetłumaczone na wskazany język. Często, owszem podstrona istnieje ale na niej znajduje się nieprzetłumaczony tekst w języku polskim, co tworzy duplikat.

👉 Parametry GET, brak standaryzacji - Często zdarza się tak, że jeżeli mamy kilka parametrów GET w linku, strona będzie uruchamiać się prawidłowo, niezależnie od tego w jakiej kolejności zostaną wpisane.

Przykład:
domena.pl?sort=up&typ=new&page=1,
domena.pl?sort=up&page=1&typ=new,
domena.pl?page=1&sort=up&typ=new,
domena.pl?typ=new&page=1&sort=up,
domena.pl?page=1&typ=new&sort=up,
domena.pl?typ=new&sort=up&page=1,

Treść powielona w obrębie wielu domen

O zewnętrznym duplicate content mówimy, kiedy ta sama treść opublikowana została na przynajmniej dwóch stronach internetowych. Przyczyny takiego zjawiska mogą być różne, najczęściej są to:

  • Kopiowanie treści z innych źródeł (kradzież).
  • W przypadku produktów, dość powszechnym zjawiskiem jest kopiowanie opisów ze strony producenta.
  • Kopiowanie fragmentów treści bez zastosowania odsyłacza semantycznego.

Gdzie najczęściej mamy do czynienia z zewnętrznym duplicate content?

  • Opisy produktów - Powielany opis producenta.
  • Duplikowanie opisów produktów na platformach takich jak Ceneo, Allegro, OLX.
  • Powielanie treści w social media, na stronach informacyjnych, katalogach i innych.
  • Powielanie treści w artykułach prasowych i sponsorowanych. Przepisy prawne i regulaminy - publikując na swojej stronie warto zachować czujność i oznaczyć takie strony tagiem "noindex".

Jak sprawdzić czy treść jest zduplikowana?

Zewnętrzny duplicate content możemy zweryfikować na kilka sposobów. Na jeden z nich pozwala nam już samo Google. Możemy sprawdzić czy dany fragment tekstu, występuje w zduplikowanej formie na innych serwisach. Jak to zrobić?

  1. Skopiuj fragment treści, która Cię interesuje (około 30 słów) i wklej ją w wyszukiwarkę Google. Ważna wskazówka, treść należy umieścić w cudzysłowie, jeżeli tego nie zrobimy Google wyszuka dla nas różnych dopasowań.
  2. Google wyświetli wszystkie zaindeksowane adresy URL zawierające wskazany fragment treści.
  3. W sytuacji kiedy okaże się, że zduplikowanych wyników jest bardzo dużo, wyszukiwarka Google ukryje je pod przyciskiem. Rozwijając tą listę, będziesz mógł sprawdzić wszystkie podobne wyniki.

Wskazówka: Jak pewnie zauważyłeś 30 słów w przypadku rozbudowanego artykułu to trochę mało, zweryfikowanie całości będzie więc trudniejsze. Jeżeli Google znalazł wiele podobnych wyników, sugeruję kliknąć w kilka wybranych i porównać dane treści. Jeżeli będą one niemal identyczne, najprawdopodobniej takich wyników jest więcej.

Jak poradzić sobie z zewnętrzną duplikacją?

  1. Jeżeli na Twojej stronie znajduje się treść, która została powielona na innych stronach internetowych przeredaguj ją lub dopisz jak największą ilość własnej rozbudowanej treści, o jak najwyższej wartości merytorycznej.
  2. Jeżeli z jakichś powodów nie jesteś w stanie przeredagować lub rozbudować treści, która w tej chwili występuje na stronie, napisz ją całkowicie od nowa.
  3. W przypadku stron internetowych zawierających regulamin, informację o plikach cookies itd - wyklucz je z indeksacji.

Wskazówka: Jeżeli zauważyłeś, że ktoś dokonał plagiatu Twojej autorskiej treści, możesz zgłosić plagiat bezpośrednio do Google. Po weryfikacji treść taka zostanie wykluczona z indeksu.

Co jeszcze możesz zrobić?

👉 Zablokuj możliwość kopiowania treści na swojej stronie. 👉 Zablokuj prawy przycisk myszy na swojej stronie. 👉 Ustaw opcję dodawania linku do strony skopiowanego tekstu. 👉 Ustaw opcję podmiany pliku graficznego w przypadku kopiowania treści z Twojej strony.

Zduplikowane opisy produktów w sklepie internetowym

Kwestia unikalnych opisów produktów w sklepach internetowych bardzo często jest bagatelizowana. Najczęściej, dzieje się tak w przypadkach, kiedy na jeden model produktu przypada jego kilka wersji np. kolorystycznych. Ile razy spotkałeś się z niemal identycznym opisem, który różnił się jedynie szczegółami takimi jak kolor, rozmiar czy rodzaj zastosowanych komponentów? Coś Ci powiem... to nie jest dobre i zdecydowanie warto takich praktyk unikać.

Zdarza się również, że publikowane opisy zaczerpnięte są od producenta. Wówczas problem może okazać się powszechniejszy. Dlaczego? A no dlatego, że na podobny pomysł mogło wpaść kilku sprzedawców oferujących w swoim sklepie te same produkty.

Wszystkie strony mogą mieć wspólne elementy

Na prawie każdej stronie internetowej zdarzają się powielone elementy np. słowa czy frazy ale nie jest to odbierane przez Google jako duplicate content. Problem z powieloną treścią pojawia się wtedy, kiedy kopiujemy pełne fragmenty treści lub całą treść określonej podstrony witryny.

Unikalne opisy produktów - dlaczego warto?

Tylko działania White Hat SEO, mogą przynieść zamierzone efekty. Unikalne i dobrze zoptymalizowane opisy produktów w sklepie internetowym, to jeden z nieodzownych elementów etycznego SEO.

Google stawia na wysoką wartość treści, dlatego też unikalność opisów jest niezwykle istotna. Unikalne treści są doceniane przez wyszukiwarkę, co pomaga im zaistnieć w SERPach na wyższych pozycjach, co z kolei przekłada się na większy ruch i zainteresowanie odbiorców.

Tworząc własny opis w sklepie internetowym masz szansę uwidocznić dokładnie to na czym Ci zależy. Możesz skupić się na konkretnych zaletach wynikających z zakupu produktu właśnie u Ciebie. Własna treść, działa również pozytywnie na odczucia Klienta względem prowadzonego biznesu. Czytając unikalny opis, wzbogacony o wartościowe informacje, klient znajduje informacje, które są pomocne w dokonaniu zakupu, dzięki czemu czuje się doceniony, a jego potrzeby zostają należycie spełnione. W ten sposób budujesz wizerunek eksperta w danej branży.

Kolejną zaletą tworzenia własnych opisów jest fakt, iż masz wpływ na formatowanie treści. Ciekawostką dla niektórych może być fakt, że na zachowania klientów wpływa również aspekt wizualny treści, czyli to jak zostanie ona rozmieszczona, obecność nagłówków, wypunktowań, uwidocznienie ważnych informacji w ciekawy i przejrzysty sposób. Kopiując opis i publikując go na stronie w niezmienionej formie, oferujesz użytkownikowi dokładnie to, co Twój konkurent. Nie masz również większego wpływu na optymalizację i prawidłowe umieszczenie słów kluczowych. Zadbaj o unikalną wartość treści, aby jak najlepiej spełnić oczekiwania odbiorców.

Opis synonimizowany

Stworzenie treści synonimizowanej, jak sama nazwa wskazuje, polega na przeredagowaniu istniejącego tekstu tak, by zawierał on jak najwięcej synonimów zastosowanych wcześniej słów. Ważne, aby dużą wagę przyłożyć do jakości treści publikowanej na stronie. Zdecydowanie nie zalecam korzystania z dostępnych generatorów, które samoczynnie redagują treść dodając zamiennie synonimy wyrazów. Zadbaj o wysoką jakość słownictwa i poprawność językową, a także zgodność merytoryczną i umieszczenie w treści istotnych informacji.

Czy duplicate content jest karany przez Google?

Pierwsze rewolucje w świecie contentu zapoczątkowało wprowadzenie w 2011 roku algorytmu Panda, którego celem było między innymi uwidocznienie serwisów, posiadających wartościowy, unikalny i merytoryczny content. Obecnie zmiana ta uważana jest za jedną z najistotniejszych aktualizacji.

Thin Content od tego momentu nie miał racji bytu, Google coraz większą uwagę przywiązywało do wartościowego contentu. Rozbudowane, unikalne i merytoryczne treści zaczęły być coraz bardziej doceniane przez Google, natomiast nieetyczne praktyki skutkowały obniżeniem pozycji w wynikach wyszukiwania.

Choć Google bardzo rzadko decyduje się na kary techniczne za duplicate content na stronie, duplikowane treści wpływają na ranking wyszukiwarek. W momencie kiedy roboty natrafią na kilka stron zawierających taki sam tekst, będą mieć problem ze zdefiniowaniem tego, która z nich "była pierwsza" i która wersja najtrafniej odpowiada na dane zapytanie. Z pewnością ma to niekorzystny wpływ na pozycjonowanie stron internetowych.

Takie treści analogicznie wydają się mniej wartościowe, a wyszukiwarki mają problem z ich prawidłowym indeksowaniem i uwzględnieniem bądź wykluczeniem z wyników wyszukiwania. Pojawia się również problem z kierowaniem metryki linków tj. zaufanie, autorytet, wartość linków itd, wyszukiwarka internetowa nie wie, z którą stroną je powiązać.

Kary jednak się zdarzają ...

Choć bardzo rzadko, jednak zdarza się, że Google przyznaje karę za duplicate content lub decyduje się na całkowite usunięcie witryny z indeksu. Dzieje się tak w sytuacji kiedy treści powielane zostają celowo i notorycznie, a także kiedy inna osoba zgłosi kradzież treści.

Jak znaleźć duplikaty treści?

W przypadku duplicate content w obrębie jednej domeny, znalezienie powielonych treści nie jest zbyt skomplikowane. Nieocenioną rolę odgrywają tutaj narzędzia, dzięki którym jesteśmy w stanie wychwycić duplicate content i podjąć odpowiednie działania w celu wyeliminowania problemu, oto kilka z nich:

Google - Operatory wyszukiwania

Duplikaty treści, możemy wyszukać za pomocą operatorów wyszukiwania.

Site:domena.pl

Wpisując w wyszukiwarkę Google komendę "site:domena.pl" otrzymasz listę 300 zaindeksowanych podstron w obrębie danej domeny. Dzięki tej możliwości, możesz przejrzeć podstrony witryny, które zostały zaindeksowane przez Google. Jest to jedna z możliwości wychwycenia duplicate content na stronie internetowej. Musisz jednak wziąć pod uwagę fakt, iż ręczne sprawdzanie wyników w przypadku sklepów internetowych może być uciążliwe, z uwagi na ilość podstron.

"fraza" site:domena.pl

Jeżeli chcemy ograniczyć zakres wyszukiwania jedynie do konkretnej frazy, możemy to zrobić za pomocą komendy "fraza" site:domena.pl. Wówczas Google wyświetli nam wszystkie podstrony witryny, gdzie konkretne słowo kluczowe zostało zastosowane. Na tej podstawie możemy wychwycić zduplikowane treści.

site:domena.pl intext "treść"

Dzięki temu operatorowi, jesteśmy w stanie sprawdzić czy na danej stronie internetowej, konkretny fragment treści opublikowany został więcej niż jeden raz. Co to konkretnie znaczy? W miejsce treść, wklejamy fragment tekstu, który chcemy znaleźć w obrębie wskazanej domeny i zatwierdzamy klawiszem enter. W tym momencie, Google wskaże nam wszystkie zaindeksowane podstrony witryny, na których występuje dany fragment.

Screaming Frog

W kontekście poszukiwania zduplikowanych treści w obrębie jednej domeny, Screaming Frog jest dla nas nieocenioną pomocą. Pełna analiza contentu jest dostępna od wersji 13.0, jednak aby dokładnie przeanalizować domenę pod kątem duplicate content potrzebna będzie wersja płatna programu.

Funkcjonalność SEO Spider przeprowadza szczegółową analizę strony internetowej umożliwiając następujące czynności:

Znalezienie duplicate content - zduplikowanych zawartości.

  • Znalezienie uszkodzonych linków.
  • Analiza metadanych.
  • Stworzenie audytu przekierowań.
  • Wyodrębnienie danych za pomocą XPath.
  • Renderowanie strony internetowej za pomocą zintegrowanego Chromium WRS do indeksowania stron internetowych Java Script oraz struktur takich jak. Angular, React i Vue.js.
  • Generowanie map witryn XML.
  • Integrację z GSC, GA oraz PSI.
  • Meta tagów (title i description).
  • Nagłówków H1-H6.
  • Contentu (dostępne w pełnej wersji).
  • Tekstów alternatywnych i title do grafik.
Jak to zrobić?

Narzędzia antyplagiatowe

Podczas tworzenia lub sprawdzania unikalności treści warto korzystać z dostępnych narzędzi antyplagiatowych. Oto kilka z nich:

Copyscape Plagiarism Checker

program antyplagiatowy online - Copyscape
program antyplagiatowy online - Copyscape

Plagiarism Checker

program do plagiatu Plagiarism
program do plagiatu Plagiarism

Copywritely

Copywritely, program do wykrywania plagiatu
Copywritely, program do wykrywania plagiatu

Jak uniknąć duplikacji treści

Przekierowanie 301

Pamiętaj, że: https://www.twoja-super-strona.pl oraz https://twoja-super-strona.pl to dla Google dwie różne domeny. Należy przekierować w ten sposób: www.twoja-super-strona.pl -301-> twoja-super-strona.pl lub odwrotnie. Jak dokładnie to zrobić zostało opisane tutaj: Przekierowanie 301 strony z www na bez www i odwrotnie. Warto jednocześnie wyeliminować dodatkowe kopie jak np.: twoja-super-strona.pl/index.html lub twoja-super-strona.pl/index.php?abc=

Wykorzystanie Search Console

Pomocnym narzędziem w tej sytuacji jest także Google Search Console, dzięki któremu możesz przesłać dany URL do indeksu Google, a także sprawdzić raport o stanie w indeksie. Dzięki niemu możesz przeanalizować, które z adresów nie zostały zaindeksowane i dowiedzieć się, czy podczas indeksowania przez Google, nie zaistniał jakiś problem. Przeglądając raport dowiesz się o następujących nieprawidłowościach:

  • Błąd - strona nie została zaindeksowana. Sprawdzając szczegóły konkretnego błędu dowiesz się dokładnie, co jest powodem jego wystąpienia.
  • Ostrzeżenie - Strona została zaindeksowana ale zawiera błąd, który najlepiej wyeliminować.
  • Wykluczono - Strona, która nie została zaindeksowana. Google uznało jednak, że takie działanie było zamierzone, np. strona zawierała dyrektywę noindex lub była to zduplikowana strona kanoniczna, która została zaindeksowana wcześniej.

Szczegółową instrukcję dotyczącą raportu o stanie w indeksie znajdziesz tutaj.

Jak wysłać prośbę o zaindeksowanie?

  1. Sprawdź adres URL za pomocą narzędzia - Wklej wybrany URL i zatwierdź

    Google Search Console - Sprawdź dowolny URL
    Google Search Console - Sprawdź dowolny URL

  2. Kliknij “Poproś o zaindeksowanie”

    Google Search Console - sprawdź URL wersji aktywnej
    Google Search Console - sprawdź URL wersji aktywnej

Ważne: Proces weryfikacji adresu URL przez Google trwa zazwyczaj od kilku dni do kilku tygodni. Wielokrotne powielanie prośby o indeksację nie przyspieszy tego procesu.

Linki kanoniczne

W sklepach internetowych i nie tylko należy ustawić linki kanoniczne (rel="canonical"). Przykład:
< link rel="canonical" href="https://domena.pl/kategoria"/ >

W przypadku sklepów online, kiedy celem jest osiągnięcie wysokiej pozycji całej kategorii, kluczowe jest ustawienie linków kanonicznych przy stronicowaniu produktów w kategoriach. Jako podstrona kanoniczna najczęściej ustawiana jest pierwsza strona z produktami z odpowiedniej kategorii lub podstrona zawierająca wszystkie produkty z danej kategorii - w zależności od ilości produktów.

Meta Robots Noindex

Dzięki Meta Robots Noindex możemy zapobiec wyświetlaniu zduplikowanych treści w wyszukiwarce Google. Podczas indeksowania strony internetowej, roboty Google napotykając ten tag w przypadku danej podstrony, całkowicie wyeliminują ją z wyników wyszukiwania.

Dyrektywę "noindex" możemy zastosować na dwa sposoby - w postaci nagłówka odpowiedzi HTTP oraz w postaci metatagu. Czym różnią się te dwie metody? Zobaczcie sami!

< meta name="robots" content="noindex" / > - precyzyjna kontrola nad indeksowaniem i wyświetlaniem strony w wynikach wyszukiwania Google.

Nagłówek HTTP X-Robots-Tag

X-Robots-Tag może być elementem zamieszonym w nagłówku HTTP odpowiedzi na żądanie konkretnego URL. Postępując w ten sposób poinformujesz roboty Google, aby nie indeksowały danego adresu URL. Oto przykład:

HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: noindex
(…)

Szczegóły znajdziesz w instrukcji dotyczącej specyfikacji metatagu robots, atrybutu data-nosnippet i nagłówka HTTP X-Robots-Tag udostępnianej przez Google.

O czym pamiętać?

⇛ Spójność podczas tworzenia linków wewnętrznych w całej witrynie. Jeżeli ustalona kanoniczna wersja domeny to https://www.domena.p/, to wszystkie wewnętrzne linki powinny prowadzić do https://www.domena.pl/ ... zamiast https://domena.pl/ …

⇛ Podczas dystrybucji treści sprawdź czy witryna dystrybuująca dodaje odnośnik z powrotem do treści oryginalnej a nie innego adresu URL.

⇛ Warto dodać odwołujący link rel=canonical, który informuje roboty Google o tym, która treść jest wersją oryginalną czyli kanoniczną

Odpowiadamy na pytania!

Czy Google traktuje tłumaczone treści jako powielone?

Nie. Wartościowa, odpowiednio przetłumaczona treść nie będzie tworzyć duplikatu. Warto jednak zadbać o poprawność językową tłumaczenia, tak aby jak najlepiej dostosować tekst do oczekiwań internautów.

Jak Google wybiera kanoniczny adres domeny

Jeżeli daną stronę internetową można otworzyć używając wielu adresów URL, robot Google analizując domenę sprawdzając czy wskazuje stronę kanoniczną, zdarza się jednak, że robot wybierze sobie inną - można to sprawdzić w Google Search Console w zakładce stan.

Czy witryna mobilna jest liczona jako zduplikowana treść?

Projektując stronę internetową warto zadbać o jej responsywność, czyli odpowiednie dostosowanie do urządzeń mobilnych. Responsywna strona internetowa (Responsive Web Design) to strona, która automatycznie dostosowuje swoją rozdzielczość do rozmiaru wyświetlacza urządzenia. Responsywna strona internetowa NIE JEST TRAKTOWANA JAKO DUPLIKAT.

Zdarza się jednak, że niektóre witryny posiadają zupełnie oddzielną stronę w wersji mobilnej, która dostępna jest pod innym adresem. Najczęściej w takich sytuacjach w adresie spotkamy się z przedrostkiem m. lub moblile - m.domena.pl, mobile.domena.pl. Warto zwrócić uwagę na taką sytuację, gdyż zaniedbanie jej prowadzić może do wystąpienia duplikacji. Jakie jest rozwiązanie?

Musisz dokładnie wskazać robotom Google istniejące wersje witryny. Aby to zrobić musisz zaimplementować w desktopowej oraz mobilnej wersji strony następujące zapisy:

  1. link rel=”alternate” href=”https://m.domena.pl”> - zamieszczamy w sekcji head, desktopowej wersji strony. Zapis informuje o alternatywnej wersji mobilnej strony.
  2. - zamieszczamy w sekcji head mobilnej wersji strony, ustawiając jako kanoniczny adres wersji desktopowej.

Czy syndykowanie treści to duplikat?

Syndykowanie to nic innego jak świadome i dobrowolne udostępnianie opublikowanej już treści innym serwisom. Serwisy takie umożliwiają dodanie treści na innej stronie i przedrukowanie jej przez innych użytkowników. Jeżeli podejmujesz się takiego działania, zadbaj aby w przypadku opublikowanego już artykułu podać jego źródło, czyli miejsce gdzie znajduje się jego oryginalna wersja (link do strony). W ten sposób robot natrafi co prawda na powieloną treść ale powiąże ją z odpowiednim źródłem.

Czy podobna treść to również duplicate content?

To zależy co rozumiemy przez słowo "podobna". Ważne jest odpowiednie przeredagowanie treści w ten sposób, aby stanowiła ona swoją unikalną wartość. Zadbajmy o to, aby w naszym opisie nie pojawiały się fragmenty przekopiowanego tekstu, pomocna w tym przypadku jest synonimizacja, o której wspominałam wyżej. Opisując produkt czy usługę zadbajmy aby jak najtrafniej sprecyzować zalety skorzystania z oferty.