W ostatnio napisanym przeze mnie artykule dotyczącym optymalizacji sekcji head na stronach internetowych bazujących na WordPress-ie opisałem wtyczkę pt. All in One SEO Pack. Wtyczka ta ma również inne właściwości, które pomagają w dużej mierze wyeliminować duplicate content w obrębie danego bloga. Co to jest duplicate content? Jak sama nazwa wskazuje jest to ta sama treść powielona na różnych stronach internetowych serwisu www, w naszym przypadku bloga. Wielu mniej lub bardziej doświadczonych webmasterów nie ma pojęcia jak łatwo mogą sobie narobić problemów u wujaszka Google. Google na swoim oficjalnym blogu już dawno temu oznajmiło, że nie chce trzymać w swoim indeksie stron internetowych o tej samej treści występujących pod różnymi adresami. Jeżeli Google znajdzie dwie strony internetowe o takiej samej lub bardzo podobnej treści może ich nie zaindeksować lub wybierze sobie jedną z nich, która niekoniecznie nam odpowiada. Ważne jest, żeby mieć świadomość, że takie zagrożenie występuje i zawczasu, czyli prze publikacją strony www w internecie temu zaradzić. Tak ja wspomniałem na samym początku tego artykułu, na blogach postawionych na WordPressie z pomocą przychodzi wtyczka All in One SEO Pack, którą zaraz skonfigurujemy w taki sposób, żeby wyeliminować duplicate content.
Zaczynamy.
Canonical URLs: – preferowany adres url w wynikach wyszukiwania. Tag ten możemy zobaczy analizując sekcję head w kodzie źródłowych strony internetowej. W WordPressie preferowanymi adresami będą: strona główna bloga, strony typu post i page. W panelu admina wtyczki All in One SEO zaznaczamy tę pozycję.
Use noindex for Categories: – po zaznaczeniu tego polecenia, strony typu kategorie nie będą indeksowane przez wyszukiwarkę Google, ale robot dalej będzie mógł się po nich poruszać docierając do stron pozbawionych tego atrybutu.
Use noindex for Archives: – tak jak wyżej, z ta mała różnicą, że robot nie będzie indeksowała stron typu archiwa.
Use noindex for Tag Archives: – robot wyszukiwarki Google nie będzie indeksował stron typu tagi.
Przykładowy PrintScreen panelu zarządzania wtyczką All in One SEO Pack:

Po wyłączeniu indeksacji dla wyżej wymienionych typów stron nasz blog będzie prawie w 100 procentach pozbawiony zduplikowanej treści. W następnym artykule dalej będziemy zajmować się pojęciem duplicate content nadając atrybut „noindex” dla kanałów rss i komentarzy.
