Hindari Duplicate Content dengan 8 Cara untuk Mengecek SEO Ini

hindari-duplicate-content-dengan-8-cara-mengecek-seo-ini

Duplicate content bisa muncul tanpa Anda sadari, bahkan meski Anda telah berusaha sebaik mungkin untuk mencegahnya. Pada artikel ini Anda bisa mengetahui cara untuk mengidentifikasi dan memperbaiki duplicate content.

Anda mungkin sering mendengar istilah “duplicate content”, dan sama seperti savvy webmaster lainnya, Anda tidak pernah berani mempublikasikan konten yang sama dua kali bukan?

Baca Juga: SEO Dasar yang Sering Diabaikan oleh Webmaster

Duplicate content diibaratkan dengan penarikan besar-besaran dengan rekening bank Anda. Bukannya menghasilkan banyak pendapatan, justru Anda akan dipaksa untuk mengeluarkan banyak budget karena hal tersebut. Duplicate content sendiri bisa beraneka ragamnya. Ini bisa jadi masalah yang paling luas dan sulit dipahami, bahkan bisa memengaruhi posisi situs Anda. Bahkan bisa saja hal ini terjadi karena tidak disengaja, dikarenakan adanya keterbatasan CMS.

Sayangnya, tidak ada pengecekan yang sederhana di Google Search Console yang bisa memberikan tanda mengenai duplicate content. Bahkan tool paling canggih pun tidak bisa membantu Anda mencari duplicate content – terutama ketika sumbernya internal.

Berikut ini delapan sumber potensial dari duplicate content yang bisa memengaruhi situs Anda:

1. URL HTTP dan HTTPS

Salah satu cara tercepat untuk mengecek apakah situs Anda punya dua versi live yang terindeks adalah coba kunjungi situs Anda dengan menggunakan baik jalur HTTP dan HTTPS. Jika keduanya ada, jangan khawatir dulu. Bisa saja developer Anda mengubah situs ke HTTPS dan mengabaikan 301 untuk mengarahkan ke versi HTTP.

Hal yang sama terjadi ketika Google belum meminta para webmaster untuk membuat situs-situs mereka menjadi HTTPS, banyak situs memilih untuk menerapkan HTTPS hanya pada halaman-halaman tertentu yang membutuhkan keamanan tambahan – misal, login dan halaman checkout.  Jika developer memilih untuk menggunakan relative linking structure, setiap kali ada crawler yang mengunjungi sebuah halaman yang secure, HTTPS akan muncul pada URL tersebut – yang kemudian membuat adanya dua versi dari situs itu.

Oleh karenanya, pastikan situs Anda tidak memiliki kedua versi; www dan non-www. Anda bisa memperbaiki masalah ini dengan menerapkan pengalihan link 301 dan memilih domain yang akan digunakan di Google Search Console.

2. Situs Pencuri Link

Meskipun kini belum ada kebijakan internet yang bisa membantu Anda mengklaim properti yang dicuri, ada beberapa cara untuk melakukan coding pada situs Anda yang akan menyulitkan bagi para pencuri link untuk melakukan duplikasi konten pada situs Anda menjadi milik mereka. Seperti yang disebutkan di atas, selalu gunakan absolute URL dan jangan gunakan relative URL:

  • Absolute URL: https://www.bestrecipes.com/chocolate-cakes
  • Relative URL: /chocolate-cakes

Kenapa hal ini sangat penting? Ketika Anda menggunakan relative URL, browser Anda akan mengasumsikan bahwa link tersebut mengacu pada halaman yang ada di browser sama dimana Anda berada. Jangan pernah membiarkan Google berasumsi (berpikir bahwa link-link buruk tersebut tidak masuk akal). Beberapa developer memang lebih suka menggunakan relative URL karena proses codingnya lebih sederhana.

Jika  developer Anda tidak mau meng-coding ulang seluruh situsnya, terapkan canonical tags. Ketika ada pencuri link yang menggunakan konten Anda pada situs baru mereka, canonical tag tersebut akan terbawa sehingga menginformasikan pada Google bahwa situs Anda merupakan sumber original dari konten tersebut.

Untuk mengetahui apakah seseorang mencuri situs Anda, cobalah gunakan tools gratis seperti Siteliner atau Copyscape.

3. Subdomain yang telah lama hilang

Anggap saja Anda mengabaikan sub domain dan menggunakan sub directory. Atau ungkin Anda membuat situs baru. Bagaimana pun juga, konten lama yang Anda abaikan bisa jadi masih ada dan baik-baik saja – yang kemudian justru akan menyerang Anda. Cara terbaiknya yaitu dengan menerapkan pengalihan 301 dari subdomain lama yang Anda tinggalkan dan diarahkan ke situs baru Anda. Hal ini sangat penting terutama jika situs lama Anda memiliki traffic yang banyak dari backlinks.

4. Melakukan trik koding rahasia di bagian staging environment

Poin kali ini akan berkaitan dengan crawling dan indexing Google. Anda sedang melakukan coding untuk situs baru? Menyiapkan situs Anda untuk sebuah opening? Jika Anda belum memblock crawler Google, Google bisa saja mengintai apa yang sedang Anda lakukan.

Ini adalah sebuah kesalahpahaman umum karena tidak ada seorang pun yang akan pernah mengetik staging.yoursite.com, itu terlarang. Salah! Google akan mengindeks web secara konstan, termasuk staging environment Anda. Hal ini bisa merusak hasil pencarian Anda dan membingungkan pengguna.

Bukan hanya kesalahan yang menyangkut privasi dan keamanan situs, membiarkan Google untuk mengindeks ketika Anda mengubah coding situs dapat mengakibatkan anggaran Anda meledak. Sederhanakan saja; terapkan noindex tag pada seluruh staging environment dan block staging di bagian robots.txtfile. Maka Google tidak akan mengintai lagi.

Ingat, meskipun – ketika Anda pindah dari staging environment ke situs live, jangan lupa untuk menghilangkan blocking command tersebut dari codingan!

5. Membuat Dynamic Parameter

Sebagian besar parameter ini dihasilkan oleh setup navigasi faceted yang memungkinkan Anda untuk memodifikasi, ini bisa jadi salah satu masalah yang muncul dari struktur situs Anda. Jadi seperti apakah dynamic parameter?

  • URL 1: www.bestrecipes.com/chocolate-recipes/cake/custom_vanilla
  • URL 2: www.bestrecipes.com/chocolate-recipes/cake/custom_vanilla%8in
  • URL3:

bestrecipes.com/chocolate-recipes/cake/custom_vanilla%8in=marble

Ini adalah contoh yang disederhanakan; Namun, CMS Anda bisa saja menghasilkan beragam parameters dan mengakibatkan banyak URL string panjang yang tidak penting, yang semuanya merupakan cara yang adil agar terdeteksi oleh Google.

Di sisi lain, Google bisa saja mendeteksi sendiri melalui navigasi faceted untuk menciptakan dan mengindeks kombinasi URL tanpa batas yang tidak pernah diminta oleh pengguna.

Skenario lain, gunakan canonical tag pada URL yang diinginkan dan lakukan setting parameter controls di Google Search Console. Anda bisa melakukan langkah ini lebih lanjut dan memblock URL tertentu di robots.txt menggunakan wildcard (*) untuk mencegah pengindeksan apapun yang terjadi setelah subdirektori tertentu. Contohnya:

Disallow: /chocolate-recipes/cake/*

6. Subdirektori Mirror

Apakah bisnis Anda berada di dua lokasi atau lebih? Beberapa bisnis lebih suka sebuah landing page utama yang membiarkan pengguna untuk memilih lokasi yang paling dekat dan kemudian mengarahkan mereka pada subdirektori yang tepat. Misalnya:

  • URL 1: www.wonderfullywhisked.com/fr
  • URL 2: wonderfullywhisked.com/de

Mungkin ini terlihat logis, cobalah evaluasi apakah Anda perlu mengatur ulang pilihan ini. Sementara Anda bisa menargetkan audience yang berbeda, jika kedua subdirektori ini menampilkan konten dan produk pilihan yang sama satu dengan lainnya, konten website akan tercampur dan menjadi tidak jelas. Untuk mengatasi masalah ini, masuklah ke Google Search Console dan lakukan setting location targeting.

7. Syndicated content

Sindikasi adalah cara terbaik agar konten Anda ditemukan oleh audience baru; namun, Anda perlu menentukan aturan untuk mereka yang ingin mempublikasi konten Anda.

Idealnya, Anda harus meminta publisher untuk menggunakan rel=canonical tag pada halaman artikel untuk menginformasikan pada mesin pencari bahwa situs Anda merupakan sumber original dari konten tersebut. Mereka juga bisa menerapkan Noindex pada konten sindikasi tersebut, yang bisa memecahkan masalah utama mengenai konten duplikasi pada hasil pencarian.

Dan yang paling penting, publisher harus memberikan link ke artikel asli di situs Anda sebagai bukti atribusi.

8. Konten yang mirip

Mungkin cara ini bisa mengurangi kekhawatiran Anda untuk menghindari konten duplikat, tapi definisi konten duplikat menurut Google juga meliputi konten yang “mirip/serupa”.

Meskipun dua konten bisa memiliki syntax yang beraneka ragam, aturan umum praktisnya adalah jika Anda bisa mengumpulkan informasi yang sama dari kedua artikel, tidak ada alasan untuk membiarkan kedua konten tersebut berada dalam website Anda. Canonical tag adalah pilihan yang paling tepat untuk masalah ini, atau cobalah untuk menggabungkan kedua konten tersebut.

9. Bonus : Copy Paste Product Description Anda ke Google.

Kebanyakan orang mengambil product description dari data supplier tanpa sadar bahwa kalimat tersebut digunakan juga oleh banyak ecommerce lain. Anda harus mencoba copy paste kalimat produk tersebut di Google lalu lihat berapa banyak orang yang menggunakan kalimat yang sama.

Kesimpulan

Dengan mengatasi masalah konten duplikat Anda bisa mencegah tejadinya penurunan crawling pada situs Anda – yang bisa mencegah halaman-halaman baru tidak terindeks oleh mesin pencari. Beberapa tools terbaik untuk mengatasi hal ini meliputi canonical tag, 301 redirects, tag nofollow/noindex dan gunakan control parameter. Anda bisa  mengurangi konten duplikat dengan melakukan 8 cara pengecekan SEO ini secara rutin.

Sumber: searchengineland.com

Baca Juga

Daftar 30 Lebih Tools SEO Gratis untuk Memaksimalkan Website Anda

Inilah 27 Tools SEO Free (Rekomendasi Para Expertise)

Setting URL Cannonicalization www dan non www untuk Toko Online

9 thoughts on “Hindari Duplicate Content dengan 8 Cara untuk Mengecek SEO Ini”

  1. kalau saya ingin ganti url blog apa harus di redirect gan dan kalau tidak di redirect akan terkena duplikat content tidak ya?

  2. Gan aye mau nanya kenapa google webmaster tools saya di bagian fitur hapus url setatusnya pending terus baru baru ini. Sebelumnya cuman 24 jam langsung terhapus tapi sekarang statusnya pending terus sampe 2 Minggu lebih mohon bantu solusinya gan?

Leave a Reply

Your email address will not be published. Required fields are marked *