Sekitar 25-30% konten dalam web adalah konten duplikat.
Meskipun konten duplikat bukanlah faktor utama dalam memperoleh peringkat, akan tetapi konten duplikat bisa memengaruhi serangkaian faktor seperti:
– UX/Pengalaman pengguna
– Crawling Situs Web
– dwel time
Ada baiknya terus memeriksa situs web Anda apakah mengandung konten duplikat atau tidak kemudian memperbaikinya.
Anda dapat menggunakan alat seperti Siteliner atau alat ‘laba-laba’ SEO untuk membantu Anda dalam hal ini.
Apa itu duplikat konten?
Konten duplikat adalah konten yang muncul di Internet di lebih dari satu tempat. “Satu tempat” itu didefinisikan sebagai lokasi dengan alamat situs web (URL) unik – jadi, jika konten yang sama muncul di lebih dari satu alamat web, Anda mendapatkan konten duplikat.
Meskipun secara teknis bukan merupakan hukuman, konten duplikat terkadang masih dapat memengaruhi peringkat mesin telusur. Jika terdapat banyak bagian, seperti yang disebut Google , konten yang “sangat mirip” di lebih dari satu lokasi di Internet, mesin pencari akan sulit memutuskan versi mana yang lebih relevan dengan permintaan pencarian tertentu.
Mengapa duplikat konten berbahaya?
Akibatnya untuk mesin pencari
Konten duplikat dapat menimbulkan tiga masalah utama untuk mesin telusur:
- Mereka tidak tahu versi mana yang akan disertakan / dikecualikan dari indeks mereka.
- Mereka tidak tahu apakah akan mengarahkan metrik tautan (kepercayaan, otoritas, teks tautan ,ekuitas tautan , dll.) ke satu halaman, atau pisahkan di antara beberapa versi.
- Mereka tidak tahu versi mana yang harus diberi peringkat untuk hasil kueri.
Akibatnya untuk pemilik situs
Saat konten duplikat hadir, pemilik situs dapat mengalami kerugian peringkat dan lalu lintas. Kerugian ini sering kali berasal dari dua masalah utama:
- Untuk memberikan pengalaman penelusuran terbaik, mesin telusur jarang menampilkan beberapa versi konten yang sama, sehingga terpaksa memilih versi mana yang kemungkinan besar merupakan hasil terbaik. Ini melemahkan visibilitas masing – masing duplikat.
- Ekuitas tautan dapat lebih terdilusi karena situs lain harus memilih di antara duplikat juga. alih-alih semua tautan masuk yang mengarah ke satu konten, mereka menautkan ke beberapa bagian, menyebarkan ekuitas tautan di antara duplikat. Karena tautan masuk adalah faktor peringkat , hal ini kemudian dapat memengaruhi visibilitas pencarian suatu konten.
Hasilnya?
Sepotong konten duplikat tidak akan mencapai visibilitas pencarian seperti yang seharusnya.
Bagaimana masalah duplikat konten terjadi?
Dalam sebagian besar kasus, pemilik situs web tidak sengaja membuat konten duplikat. Tapi, bukan berarti tidak ada di luar sana. Faktanya, menurut beberapa perkiraan, hingga 29% dari halaman web yang sebenarnya adalah konten duplikat!
Mari kita lihat beberapa cara paling umum konten duplikat dibuat secara tidak sengaja:
1. Variasi URL
Parameter URL, seperti pelacakan klik dan beberapa kode analitik, dapat menyebabkan masalah duplikat konten. Ini bisa menjadi masalah yang disebabkan tidak hanya oleh parameter itu sendiri, tetapi juga urutan kemunculan parameter tersebut di URL itu sendiri.
Sebagai contoh:
- www.widgets.com/blue-widgets?c … adalah duplikat dari www.widgets.com/blue-widgets?c … & cat = 3 “class =” redactor-autoparser-object “> www.widgets. com / blue-widgets adalah duplikat dari www.widgets.com/blue-widgets ? cat = 3 & color = blue
Demikian pula, ID sesi adalah pembuat konten duplikat yang umum. Ini terjadi ketika setiap pengguna yang mengunjungi situs web diberikan ID sesi berbeda yang disimpan di URL.
Versi konten yang ramah printer juga dapat menyebabkan masalah konten duplikat saat beberapa versi halaman diindeks.
Satu pelajaran di sini adalah bahwa jika memungkinkan, sering kali bermanfaat untuk menghindari penambahan parameter URL atau versi alternatif URL (informasi yang terkandung di dalamnya biasanya dapat diteruskan melalui skrip).
2. Halaman HTTP vs. HTTPS atau WWW vs. non-WWW
Jika situs Anda memiliki versi terpisah di “www.site.com” dan “site.com” (dengan dan tanpa awalan “www”), dan konten yang sama ada di kedua versi tersebut, Anda telah secara efektif membuat duplikat dari masing-masing versi tersebut. halaman. Hal yang sama berlaku untuk situs yang mempertahankan versi di http: // dan https: //. Jika kedua versi laman itu aktif dan terlihat oleh mesin telusur, Anda mungkin mengalami masalah konten duplikat.
3. Konten yang disalin atau disalin
Konten tidak hanya mencakup posting blog atau konten editorial, tetapi juga halaman informasi produk. Pengikis yang menerbitkan ulang konten blog Anda di situs mereka sendiri mungkin merupakan sumber konten duplikat yang lebih dikenal, tetapi ada juga masalah umum untuk situs e-niaga: informasi produk. Jika banyak situs web yang berbeda menjual item yang sama, dan semuanya menggunakan deskripsi produsen untuk item tersebut, konten yang sama akan berakhir di beberapa lokasi di seluruh web.
Cara memperbaiki masalah duplikat konten
Memperbaiki masalah duplikat konten semuanya bermuara pada gagasan utama yang sama: menentukan mana dari duplikat yang “benar”.
Setiap kali konten di situs dapat ditemukan di beberapa URL, itu harus dikanonikalisasi untuk mesin telusur. Mari kita bahas tiga cara utama untuk melakukannya: Menggunakan pengalihan 301 ke URL yang benar, atribut rel = canonical, atau menggunakan alat penanganan parameter di Google Search Console.
Pengalihan 301
Dalam banyak kasus, cara terbaik untuk memerangi konten duplikat adalah dengan menyiapkan pengalihan 301 dari halaman “duplikat” ke halaman konten asli.
Saat beberapa halaman dengan potensi peringkat yang baik digabungkan menjadi satu halaman, halaman tersebut tidak hanya berhenti bersaing satu sama lain; mereka juga menciptakan relevansi yang lebih kuat dan sinyal popularitas secara keseluruhan. Ini akan berdampak positif pada kemampuan halaman yang “benar” untuk mendapatkan peringkat yang baik.
Rel = “canonical”
Opsi lain untuk menangani konten duplikat adalah menggunakan atribut rel = canonical. Ini memberi tahu mesin pencari bahwa halaman tertentu harus diperlakukan seolah-olah itu adalah salinan dari URL tertentu, dan semua link, metrik konten, dan “kekuatan peringkat” yang diterapkan mesin pencari ke halaman ini harus benar-benar dikreditkan ke halaman yang ditentukan. URL.
Atribut rel = “canonical” adalah bagian dari kepala HTML halaman web dan terlihat seperti ini:
Format umum:
<head> ... [kode lain yang mungkin ada di head HTML dokumen Anda] ... <link href = "URL OF ORIGINAL PAGE" rel = "canonical" />...[ kode lain yang mungkin ada di dokumen Anda Kepala HTML] ... </head>
Atribut rel = canonical harus ditambahkan ke kepala HTML dari setiap versi duplikat halaman, dengan bagian “URL OF ORIGINAL PAGE” di atas diganti dengan link ke halaman asli (kanonis). (Pastikan Anda tetap menggunakan tanda kutip.)
Atribut melewati jumlah ekuitas tautan (kekuatan peringkat) yang kira-kira sama dengan pengalihan 301, dan, karena diterapkan di tingkat laman (bukan server), sering kali membutuhkan waktu pengembangan yang lebih sedikit untuk melaksanakan.
Di bawah ini adalah contoh bagaimana atribut kanonis bekerja:
Gunakan MozBar untuk mengidentifikasi atribut kanonik.
Di sini, kita dapat melihat website ini menggunakan atribut rel = canonical untuk mengakomodasi penggunaan parameter URL mereka (dalam hal ini, pelacakan klik). Meskipun halaman ini dapat diakses oleh dua URL, atribut rel = canonical memastikan bahwa semua ekuitas link dan metrik konten diberikan ke halaman asli (/ no-one-does-this-lagi).
Meta Robot Noindex
Satu tag meta yang sangat berguna dalam menangani konten duplikat adalah robot meta , jika digunakan dengan nilai “noindex, ikuti”. Umumnya disebut Meta Noindex, Follow dan secara teknis dikenal sebagai content = “noindex, follow” tag meta robot ini dapat ditambahkan ke kepala HTML setiap halaman yang harus dikeluarkan dari indeks mesin pencari.
Format umum:
<head> ... [kode lain yang mungkin ada di head HTML dokumen Anda] ... <meta name = "robots" content = "noindex, follow"> ... [kode lain yang mungkin ada di head HTML dokumen Anda ] ... </head>
Tag meta robot memungkinkan mesin telusur untuk merayapi tautan pada halaman tetapi mencegahnya memasukkan tautan tersebut ke dalam indeksnya.
Halaman duplikat harus tetap dapat dirayapi, meskipun Anda memberi tahu Google untuk tidak mengindeksnya, karena Google secara eksplisit memperingatkan agar tidak membatasi akses perayapan ke konten duplikat di situs web Anda.
Pada dasarnya mesin telusur ingin dapat melihat semuanya jika Anda membuat kesalahan dalam kode Anda. Hal ini memungkinkan mereka untuk membuat “panggilan penilaian” (otomatis) dalam situasi yang ambigu.
Menggunakan robot meta adalah solusi yang sangat baik untuk masalah duplikat konten yang terkait dengan penomoran halaman.
Domain pilihan dan penanganan parameter di Google Search Console
Google Search Console memungkinkan Anda menyetel domain pilihan situs Anda (yaitu http://yoursite.com daripada http://www.yoursite.com) dan menentukan apakah Googlebot harus merayapi berbagai parameter URL secara berbeda (penanganan parameter).
Bergantung pada struktur URL Anda dan penyebab masalah konten duplikat, menyiapkan domain pilihan atau penanganan parameter (atau keduanya!) Dapat memberikan solusi.
Kelemahan utama menggunakan penanganan parameter sebagai metode utama Anda untuk menangani konten duplikat adalah bahwa perubahan yang Anda buat hanya berfungsi untuk Google. Aturan apa pun yang diberlakukan menggunakan Google Search Console tidak akan memengaruhi cara Bing atau crawler mesin pencari lainnya menafsirkan situs Anda; Anda harus menggunakan alat webmaster untuk mesin telusur lain selain menyesuaikan setelan di Search Console.
Metode tambahan untuk menangani konten duplikat
- Pertahankan konsistensi saat menautkan secara internal ke seluruh situs web. Misalnya, jika webmaster menentukan bahwa versi kanonik dari sebuah domain adalah www.example.com/, maka semua tautan internal harus menuju ke http: // www. example.co … daripada http: // example.com/pa … (perhatikan tidak adanya www).
- Saat melakukan sindikasi konten, pastikan situs web sindikasi menambahkan link kembali ke konten asli dan bukan variasi pada URL. (Lihat episode Whiteboard Friday kami tentang menangani konten duplikat untuk informasi lebih lanjut.)
- Untuk menambahkan perlindungan ekstra terhadap pengikis konten yang mencuri kredit SEO untuk konten Anda, sebaiknya tambahkan tautan rel = canonical referensi sendiri ke halaman Anda yang sudah ada. Ini adalah atribut kanonik yang menunjuk ke URL yang sudah ada, intinya untuk menggagalkan upaya beberapa pencakar.
Link rel = canonical referensi sendiri: URL yang ditentukan di tag rel = canonical sama dengan URL halaman saat ini.
Meskipun tidak semua pengikis akan mem-porting kode HTML lengkap dari materi sumbernya, beberapa akan melakukannya. Bagi mereka yang melakukannya, tag rel = canonical merujuk diri sendiri akan memastikan versi situs Anda mendapatkan kredit sebagai bagian konten “asli”.
Masih butuh bantuan?
Tools yang digunakan | Pendalaman Materi |
---|---|
– WordPress | – Cukup jelas |