محتوای تکراری یا Duplicate Content به محتوایی گفته میشود که بسیار مشابه یا دقیقا مشابه صفحات دیگر است. این نوع محتوا نه تنها برای کاربران ارزشی ایجاد نمیکند، بلکه میتواند باعث سردرگمی موتورهای جستجو شود و تاثیرات منفی بر سئو سایت شما داشته باشد. در این مقاله، به تعریف محتوای تکراری و ارائه راهکارهایی برای رفع این مشکل میپردازیم تا بتوانید بهبود رتبه سایت خود را تضمین کنید.
تعریف محتوای تکراری
Duplicate Content به محتوایی که بسیار مشابه محتوای سایر صفحات وبسایت شما یا سایر وبسایتها باشد یا این که به صورت دقیق از روی آنها کپی شده باشد محتوای تکراری گفته میشود. به طور کلی میتوان گفت این نوع محتوا، محتوایی است که هیچ ارزشی برای کاربرانی که از سایت شما دیدن میکنند ندارد و برای سایت شما ارزشی را تولید نمیکند.
بنابراین صفحاتی از وبسایت شما که دارای محتوای بسیار کوتاهی هستند را نیز میتوان جزو این نوع از محتواها قرار داد.
نکات مهم در مورد محتوای تکراری
- ارزش کم برای بازدیدکنندگان:
- محتوای تکراری برای بازدیدکنندگان شما هیچ ارزشی ندارد و میتواند باعث سردرگمی آنها شود.
- تاثیر منفی بر سئو:
- از داشتن محتوای مشابه در سایت خود خودداری کنید چرا که ممکن است به میزان بسیار زیادی به سئو سایت شما آسیب بزند.
- دلایل ایجاد محتوای تکراری:
- این نوع محتوا ممکن است به علت خطاهای فنی یا کپی کردن دستی محتواهای دیگر به وجود بیاید.
راهکارهای مختلفی برای جلوگیری از مسئلهساز شدن این نوع محتواها برای سایت وجود دارد. در ادامه به بررسی این راهکارها و نحوه رفع مشکل محتوای تکراری میپردازیم تا اطلاعات مفیدی را به شما ارائه دهیم.
راهکارهای رفع مشکل محتوای تکراری
-
استفاده از تگهای کنونیکال (Canonical Tags):
- تگ کنونیکال به موتورهای جستجو اعلام میکند که کدام نسخه از یک صفحه باید ایندکس شود. با استفاده از این تگ میتوانید از ایندکس شدن نسخههای تکراری جلوگیری کنید.
1 |
<link rel="canonical" href="https://example.com/original-page"> |
- اگر محتوای تکراری به علت وجود URLهای مختلف برای یک صفحه به وجود آمده است، میتوانید از ریدایرکت 301 استفاده کنید تا کاربران و موتورهای جستجو به نسخه اصلی هدایت شوند.
1 |
Redirect 301 /old-page https://example.com/new-page |
-
بهینهسازی ساختار URL:
- اطمینان حاصل کنید که ساختار URLهای سایت شما منظم و بدون تکرار است. از استفاده از پارامترهای غیرضروری در URLها خودداری کنید.
-
بررسی محتوای سایت به صورت دورهای:
- به صورت منظم محتوای سایت خود را بررسی کنید و صفحات تکراری را شناسایی و اصلاح کنید.
-
استفاده از ابزارهای آنالیز سئو:
- از ابزارهای مختلف سئو مانند Google Search Console، Screaming Frog و Ahrefs برای شناسایی محتوای تکراری استفاده کنید.
چرا محتوای تکراری به سئو سایت آسیب میرساند؟
محتوای تکراری یا Duplicate Content به دلیل تأثیر منفی که بر رتبهبندی و عملکرد سایت در موتورهای جستجو دارد، برای سئو سایت نامناسب است. دو دلیل اصلی برای این موضوع وجود دارد:
1. کاهش عملکرد موتورهای جستجو
زمانی که چندین نسخه از محتوای شما در دسترس باشد، برای موتورهای جستجو سخت است که تشخیص دهند باید کدام یک از نسخهها را ایندکس کرده و در لیست جستجوی خود نمایش دهند. در نتیجه، عملکرد موتورهای جستجو برای تمامی محتواهای تکراری شما کاهش پیدا میکند. این صفحات در واقع در حال رقابت با یکدیگر هستند.
مثال: فرض کنید شما یک مقاله با محتوای مشابه در دو URL مختلف دارید:
در این حالت، موتورهای جستجو نمیدانند کدام نسخه را به کاربران نمایش دهند و ممکن است هر دو نسخه را ایندکس کنند، که این موضوع باعث کاهش تمرکز و اعتبار هر دو صفحه میشود.
2. مشکلات تلفیق معیارهای لینک
موتورهای جستجو برای تلفیق معیارهای لینک وب سایت شما مانند آتوریتی (Authority) و اعتبار، مرتبط بودن و اعتماد کاربران با مشکل رو به رو خواهند شد. این موضوع زمانی که وبسایتهای دیگر به بیش از یک نسخه از محتوای تکراری لینک داده باشند، بیشتر خود را نشان خواهد داد.
مثال: فرض کنید شما دو نسخه از یک محتوا دارید و دو سایت مختلف به این دو نسخه لینک دادهاند:
- سایت A به https://example.com/page1 لینک داده است.
- سایت B به https://example.com/page2 لینک داده است.
در این حالت، موتورهای جستجو نمیتوانند به درستی تشخیص دهند که کدام نسخه باید بیشترین اعتبار را دریافت کند و این موضوع باعث کاهش تأثیر لینکها و در نتیجه کاهش رتبهبندی کلی سایت میشود.
محتوای تکراری به دلایل زیر به سئو سایت آسیب میرساند:
- کاهش عملکرد موتورهای جستجو: چندین نسخه از محتوا باعث میشود که موتورهای جستجو نتوانند به درستی تشخیص دهند کدام نسخه را ایندکس و نمایش دهند، که این موضوع باعث کاهش تمرکز و اعتبار صفحات میشود.
- مشکلات تلفیق معیارهای لینک: موتورهای جستجو نمیتوانند به درستی معیارهای لینک مانند آتوریتی و اعتبار را بین نسخههای مختلف محتوای تکراری تقسیم کنند، که این موضوع باعث کاهش تأثیر لینکها و رتبهبندی سایت میشود.
برای جلوگیری از این مشکلات، بهتر است از راهکارهای مختلفی مانند استفاده از تگهای کنونیکال، ریدایرکت 301، بهینهسازی ساختار URL و بررسی منظم محتوای سایت استفاده کنید. با این اقدامات، میتوانید محتوای تکراری را مدیریت کرده و تأثیرات منفی آن بر سئو سایت خود را کاهش دهید.
آیا ممکن است برای انتشار محتوای تکراری از موتورهای جستجو جریمه دریافت کنیم؟
داشتن محتوای تکراری در سایت میتواند باعث آسیب رسیدن به سئو سایت شما شود، اما تا زمانی که به صورت عمدی محتوای وبسایت دیگری را کپی نکرده باشید، باعث دریافت جریمه از جانب گوگل نخواهد شد.
شرایط جریمه برای محتوای تکراری
اگر شما یک شخص صادق هستید که مالک وبسایت خود میباشید و با برخی از چالشهای فنی مربوط به وبسایت درگیر هستید و سعی در فریب دادن گوگل ندارید، نیازی نیست که نگرانی خاصی درباره دریافت جریمه از جانب گوگل داشته باشید.
گوگل در این خصوص اعلام کرده است:
“محتوای تکراری در یک سایت تا زمانی که تشخیص داده نشود که هدف فریب دادن کاربران و موتورهای جستجو نبوده است، یک اقدام فریبکارانه برای وبسایت شناخته نمیشود. اگر سایت شما از مشکلات مربوط به محتواهای تکراری رنج میبرد، تنها کاری که میتوانیم برای وبسایت شما انجام دهیم این است که یک نسخه از محتواهای تکراری سایت شما را در لیست جستجوی خود منتشر کنیم.”
چه زمانی نگرانی درباره جریمه وجود دارد؟
اگر مقادیر زیادی از محتوای وبسایتهای دیگر را در سایت خود کپی کرده باشید، بهتر است این مطلب که گوگل در این خصوص منتشر کرده است را با دقت مطالعه کنید. در این صورت، ممکن است سایت شما به دلیل تخلفات کپیرایت و فریب موتورهای جستجو جریمه شود.
بهترین کاری که برای محتوای تکراری در سایت میتوانیم انجام دهیم چیست؟
در بیشتر مواقع، بهترین کاری که میتوانید برای محتوای تکراری سایت خود انجام دهید این است که از ریدایرکت 301 استفاده کنید تا URLهای اضافی را به URL اصلی هدایت کنید.
راهکارهای مقابله با محتوای تکراری:
ریدایرکت 301:
-
- زمانی که URLها باید در دسترس کاربران باقی بمانند و نمیتوانید از ریدایرکت استفاده کنید، از راهکارهای زیر استفاده کنید:
1 |
Redirect 301 /duplicate-page https://example.com/original-page |
استفاده از تگ کنونیکال (Canonical URL):
- تگ کنونیکال به موتورهای جستجو اعلام میکند که کدام نسخه از یک صفحه باید ایندکس شود. این روش به شما اجازه میدهد تا برخی از سیگنالها را برای موتورهای جستجو ارسال کنید.
1 |
<link rel="canonical" href="https://example.com/original-page"> |
استفاده از متا تگ robots noindex:
- این روش به موتورهای جستجو اعلام میکند که یک صفحه خاص نباید ایندکس شود.
1 |
<meta name="robots" content="noindex"> |
مزایا و معایب روشها:
-
ریدایرکت 301:
- مزایا: هدایت کاربران و موتورهای جستجو به URL اصلی، حفظ اعتبار و آتوریتی صفحه.
- معایب: در صورتی که نیاز به دسترسی مستقیم به URLهای تکراری باشد، ممکن است مشکلساز شود.
-
تگ کنونیکال:
- مزایا: ارسال سیگنالهای قوی به موتورهای جستجو درباره نسخه اصلی محتوا.
- معایب: ممکن است کاربران همچنان به URLهای تکراری دسترسی داشته باشند.
-
متا تگ robots noindex:
- مزایا: جلوگیری از ایندکس شدن صفحات تکراری.
- معایب: سیگنالهای مربوط به آتوریتی و اعتبار به URL اصلی منتقل نمیشود.
بهترین روش برای جلوگیری از انتشار محتوای تکراری بستگی به شرایط خاص وبسایت شما دارد. استفاده از ریدایرکت 301، تگ کنونیکال و متا تگ robots noindex هر یک دارای مزایا و معایب خاص خود هستند. با توجه به نیازها و محدودیتهای وبسایت خود، میتوانید روش مناسب را انتخاب کنید تا از تاثیرات منفی محتوای تکراری بر سئو سایت خود جلوگیری کنید.
مهمترین دلایل انتشار محتوای تکراری
دلایل فنی
محتوای تکراری گاهی اوقات به علت عدم تنظیمات درست وب سرور یا وب سایت به وجود میآید. این دلیل برای انتشار محتواهای تکراری در سایت از جمله دلایل فنی است که کاملاً طبیعی است و به هیچ وجه باعث جریمه شدن وب سایت شما توسط گوگل نمیشود. البته باید توجه داشته باشید که با وجود عدم جریمه شدن، این تنظیمات نادرست میتوانند به میزان زیادی به رتبهبندی سایت شما در لیست موتورهای جستجو آسیب برسانند. بنابراین بسیار مهم است که بتوانید این تنظیمات نادرست را شناسایی کرده و آنها را ویرایش کنید.
مثالهای دلایل فنی:
-
URLهای مختلف برای یک صفحه:
- وجود URLهای مختلف برای دسترسی به یک محتوای واحد میتواند باعث ایجاد محتوای تکراری شود.
- مثال: http://example.com/page و http://www.example.com/page.
-
پارامترهای URL:
- استفاده از پارامترهای مختلف در URLها که به یک محتوای واحد اشاره دارند.
- مثال: http://example.com/page?id=1 و http://example.com/page?sessionid=123.
-
نسخههای مختلف سایت (HTTP و HTTPS):
- دسترسی به سایت از طریق پروتکلهای مختلف HTTP و HTTPS بدون ریدایرکت مناسب.
- مثال: http://example.com و https://example.com.
دلایل انسانی
علاوه بر دلایل فنی، برخی از دلایل انسانی نیز وجود دارند که میتوانند باعث به وجود آمدن این نوع محتوا در سایت شما شوند. محتوایی که به صورت عمدی از یک سایت دیگر کپی شده و در سایت شما قرار داده شود، باعث به وجود آمدن این نوع محتوا خواهد شد که در نهایت جریمه گوگل را نیز برای شما به همراه خواهد داشت.
مثالهای دلایل انسانی:
-
کپیبرداری عمدی:
- کپی کردن محتوای یک سایت دیگر و قرار دادن آن در سایت شما بدون ایجاد تغییرات.
- این نوع کپیبرداری نه تنها به سئو سایت شما آسیب میرساند بلکه میتواند منجر به جریمه گوگل شود.
-
محتوای تکراری در خود سایت:
- ایجاد محتوای مشابه در صفحات مختلف سایت خود.
- مثال: داشتن توضیحات محصول مشابه در چندین صفحه محصول مختلف.
راهکارهای شناسایی و رفع مشکلات محتوای تکراری
شناسایی مشکلات
-
استفاده از ابزارهای آنالیز سئو:
- ابزارهایی مانند Google Search Console، Screaming Frog و Ahrefs برای شناسایی محتوای تکراری در سایت.
- این ابزارها میتوانند به شما کمک کنند تا مشکلات فنی و انسانی را شناسایی کنید.
-
بررسی دستی:
- بررسی دستی صفحات سایت برای شناسایی و اصلاح محتوای تکراری.
- اطمینان حاصل کنید که هیچ صفحهای به صورت عمدی یا سهوی محتوای تکراری ندارد.
رفع مشکلات
-
تنظیمات صحیح وب سرور و سایت:
- اطمینان حاصل کنید که وب سرور و سایت شما به درستی تنظیم شدهاند تا از ایجاد محتوای تکراری جلوگیری شود.
- استفاده از ریدایرکت 301 برای هدایت URLهای تکراری به URL اصلی.
-
استفاده از تگهای کنونیکال:
- استفاده از تگ کنونیکال برای اعلام نسخه اصلی محتوا به موتورهای جستجو.
- این تگ به موتورهای جستجو کمک میکند تا نسخه درست محتوا را ایندکس کنند.
-
تولید محتوای اصیل و منحصر به فرد:
- ایجاد محتوای اصیل و با کیفیت که به ارزش سایت شما افزوده و از ایجاد محتوای تکراری جلوگیری کند.
محتوای تکراری میتواند به دلایل فنی و انسانی به وجود بیاید و تاثیر منفی بر سئو سایت شما داشته باشد. با شناسایی و رفع مشکلات فنی، ایجاد محتوای اصیل و منحصر به فرد، و استفاده از ابزارهای مناسب، میتوانید از تاثیرات منفی محتوای تکراری جلوگیری کرده و رتبهبندی سایت خود را بهبود بخشید.
مقایسه Non-www و www و همچنین HTTP در مقابل HTTPs
استفاده از زیردامنه www و پروتکل HTTPS میتواند به بهبود امنیت و ساختار سایت شما کمک کند. برای مثال، اگر روش دلخواه شما برای ارائه محتوا به کاربران https://www.example.com است، باید اطمینان حاصل کنید که وب سرور شما به درستی پیکربندی شده باشد تا محتوای شما از طریق لینکهای مختلف به درستی هدایت شود.
مثالهای دسترسی نادرست:
- http://example.com
- https://example.com
- http://www.example.com
- https://www.example.com
برای بهینهسازی، باید روشی را که برای ارائه محتوای خود ترجیح میدهید انتخاب کرده و ریدایرکت 301 را برای روشهای دیگر پیادهسازی کنید.
راهکارهای بهینهسازی دسترسی:
-
انتخاب روش دلخواه:
- تعیین کنید که کدام روش (مثلاً https://www.example.com) برای شما اولویت دارد.
-
پیادهسازی ریدایرکت 301:
- ریدایرکت 301 را برای هدایت URLهای غیرمطلوب به URL دلخواه پیادهسازی کنید.
مثال:
1 2 3 |
RewriteEngine On RewriteCond %{HTTP_HOST} ^example\.com [NC] RewriteRule ^(.*)$ https://www.example.com/$1 [L,R=301] |
ساختار URL: حروف بزرگ و کوچک و استفاده از اسلش
حروف بزرگ و کوچک
موتور جستجوی گوگل به بزرگی و کوچکی حروف در URLها حساس است. این بدان معناست که دو لینک https://example.com/url-a/ و https://example.com/url-A/ به عنوان دو URL متفاوت در نظر گرفته میشوند. در حالی که موتور جستجوی بینگ این حساسیت را ندارد.
اسلش انتهایی
قرار گرفتن علامت اسلش در انتهای URLها اهمیت دارد. برای مثال، https://example.com/page/ و https://example.com/page ممکن است به عنوان دو URL متفاوت در نظر گرفته شوند.
راهکارهای بهینهسازی ساختار URL:
-
استفاده از ساختار ثابت:
- یک ساختار ثابت برای URLهای خود انتخاب کنید (مانند استفاده یا عدم استفاده از اسلش انتهایی).
-
پیادهسازی ریدایرکت 301:
- برای ساختارهای ترجیحی، از ریدایرکت 301 استفاده کنید تا مطمئن شوید که تمامی دسترسیها به URL اصلی هدایت میشوند.
مثال:
1 2 3 |
RewriteEngine On RewriteCond %{REQUEST_URI} !/$ RewriteRule ^(.*)$ https://www.example.com/$1/ [L,R=301] |
پیکربندی صحیح وب سرور و انتخاب یک ساختار ثابت برای URLها از اهمیت بالایی برخوردار است. با استفاده از ریدایرکت 301، میتوانید مطمئن شوید که کاربران و موتورهای جستجو به نسخه دلخواه و صحیح URLهای شما هدایت میشوند. این کار به بهبود رتبهبندی سایت شما در موتورهای جستجو و بهینهسازی تجربه کاربری کمک میکند.
صفحات ایندکس و اهمیت آنها برای جلوگیری از انتشار محتوای تکراری
گاهی اوقات ممکن است بدون اطلاع شما صفحه اصلی وب سایتتان از طریق URLهای مختلف در دسترس باشد و دلیل این موضوع نیز میتواند پیکربندی اشتباه وب سرور شما باشد. به عنوان مثال، به جز لینک https://www.example.com ممکن است صفحه اصلی وب سایت شما از طریق URLهای زیر نیز در دسترس باشد:
- https://www.example.com/index.html
- https://www.example.com/index.asp
- https://www.example.com/index.aspx
- https://www.example.com/index.php
اهمیت ریدایرکت 301 و تگ کنونیکال
برای جلوگیری از ایجاد محتوای تکراری و بهبود سئو سایت، باید روش دلخواه خود برای ارائه صفحه اصلی وبسایت را انتخاب کنید و ریدایرکت 301 را برای باقی روشها پیادهسازی کنید. این کار به موتورهای جستجو و کاربران کمک میکند تا همیشه به نسخه اصلی و دلخواه صفحه دسترسی داشته باشند.
مثال ریدایرکت 301 در فایل .htaccess:
1 2 3 |
RewriteEngine On RewriteCond %{THE_REQUEST} /index\.(html|asp|aspx|php) [NC] RewriteRule ^(.*)index\.(html|asp|aspx|php)$ https://www.example.com/$1 [R=301,L] |
استفاده از تگ کنونیکال
در صورتی که وبسایت شما از هر یک از این URLها برای ارائه محتوا به کاربران استفاده میکند، اطمینان حاصل کنید که این صفحات canonicalize شده باشند. تگ کنونیکال به موتورهای جستجو اعلام میکند که نسخه اصلی محتوا کدام است، و از ایجاد محتوای تکراری جلوگیری میکند.
مثال تگ کنونیکال:
1 |
<link rel="canonical" href="https://www.example.com/"> |
پیکربندی صحیح وب سرور و استفاده از ریدایرکت 301 و تگ کنونیکال برای جلوگیری از دسترسی به صفحه اصلی از طریق URLهای مختلف، اهمیت زیادی در جلوگیری از انتشار محتوای تکراری و بهبود سئو سایت دارد. با پیادهسازی این روشها، میتوانید اطمینان حاصل کنید که کاربران و موتورهای جستجو همیشه به نسخه اصلی و دلخواه محتوای شما دسترسی دارند، که این موضوع به بهبود رتبهبندی سایت شما در نتایج جستجو کمک خواهد کرد.
نکاتی درباره پارامترهای مربوط به فیلترها
گاهی اوقات ممکن است در URLهای مربوط به وبسایت خود از پارامترهایی استفاده کنید که این پارامترها معمولاً برای فیلتر کردن اطلاعات مورد استفاده قرار میگیرند. به عنوان مثال، URL زیر را در نظر بگیرید:
https://www.example.com/toys/cars?colour=black
این صفحه تمامی ماشینهای اسباببازی که دارای رنگ مشکی هستند را نمایش میدهد. اگرچه این مسئله میتواند برای کاربران وبسایت شما جذاب باشد، اما ممکن است موتورهای جستجو را با مشکلات اساسی مواجه کند.
مشکلات پارامترهای فیلتر
در اغلب مواقع زمانی که بیش از یک گزینه فیلتر وجود داشته باشد، این گزینهها میتوانند ترکیبهای بینهایتی را ایجاد کنند، چرا که میتوان آنها را به شکلهای مختلف مرتب کرد. به عنوان مثال، دو URL زیر میتوانند برای نمایش دادن یک محتوای مشابه مورد استفاده قرار گیرند:
- https://www.example.com/toys/cars?colour=black&type=racing
- https://www.example.com/toys/cars?type=racing&colour=black
راهکارهای جلوگیری از محتوای تکراری
1. استفاده از تگهای کنونیکال (Canonical Tags)
پیادهسازی URLهای کنونیکال (که یکی از آنها برای هر صفحه اصلی بدون فیلتر مورد نیاز است) میتواند از انتشار محتوای تکراری جلوگیری کند.
مثال تگ کنونیکال:
1 |
<link rel="canonical" href="https://www.example.com/toys/cars"> |
2. مدیریت پارامترها در کنسول جستجوی گوگل
روش دیگری که برای جلوگیری از انتشار محتوای تکراری از این طریق وجود دارد، این است که از قابلیت مدیریت پارامترها در کنسول جستجوی گوگل یا ابزارهای وبمستر بینگ استفاده کنید تا نحوه برخورد با پارامترها را به رباتهای خزنده موتورهای جستجو آموزش دهید.
-
ورود به کنسول جستجوی گوگل:
- به حساب کنسول جستجوی گوگل خود وارد شوید.
-
انتخاب سایت:
- وبسایت مورد نظر خود را انتخاب کنید.
-
رفتن به بخش URL Parameters:
- از منوی سمت چپ به بخش “Legacy tools and reports” بروید و “URL Parameters” را انتخاب کنید.
-
اضافه کردن پارامتر:
- روی دکمه “Add Parameter” کلیک کنید و پارامتر مورد نظر (مانند colour یا type) را اضافه کنید.
- تنظیمات مناسب را برای هر پارامتر انتخاب کنید (مانند “Doesn’t affect page content” یا “Narrows page content”).
طبقه بندی های سایت و محتوای تکراری
طبقهبندی یک مکانیزم فوقالعاده برای دستهبندی انواع محتوا در وبسایت است. این مکانیزمها در اغلب مواقع در سیستمهای مدیریت محتوا مورد استفاده قرار میگیرند تا از دستهبندیها و تگهای محتوا پشتیبانی کنند.
مشکل محتوای تکراری در طبقهبندیها
فرض کنید که شما یک پست وبلاگ دارید که به سه دسته مختلف تعلق دارد. بنابراین این پست ممکن است از طریق هر یک از دستهبندیهای مختلف در دسترس باشد:
- https://www.example.com/category-a/topic/
- https://www.example.com/category-b/topic/
- https://www.example.com/category-c/topic/
در چنین شرایطی، برای جلوگیری از ایجاد محتوای تکراری، باید اطمینان حاصل کنید که یکی از دستهبندیها را به عنوان دستهبندی اصلی انتخاب کرده و اقدام به canonicalize کردن سایر آنها با استفاده از URLهای کنونیکال کنید.
راهکارهای جلوگیری از محتوای تکراری در طبقهبندیها
1. انتخاب دستهبندی اصلی
یکی از دستهبندیها را به عنوان دستهبندی اصلی برای پست خود انتخاب کنید و سایر دستهبندیها را به آن دستهبندی اصلی کنونیکال کنید.
مثال:
- دستهبندی اصلی: https://www.example.com/category-a/topic/
2. استفاده از تگ کنونیکال
از تگ کنونیکال برای اشاره به دستهبندی اصلی استفاده کنید. این تگ به موتورهای جستجو اعلام میکند که نسخه اصلی محتوا کدام است.
مثال تگ کنونیکال:
در صفحات category-b و category-c از تگ کنونیکال زیر استفاده کنید:
1 |
<link rel="canonical" href="https://www.example.com/category-a/topic/"> |
3. استفاده از ریدایرکت 301
میتوانید از ریدایرکت 301 برای هدایت کاربران و موتورهای جستجو از URLهای فرعی به URL اصلی استفاده کنید.
مثال ریدایرکت 301 در فایل .htaccess:
1 2 3 4 |
RewriteEngine On RewriteCond %{REQUEST_URI} ^/category-b/topic/$ [NC,OR] RewriteCond %{REQUEST_URI} ^/category-c/topic/$ [NC] RewriteRule ^(.*)$ https://www.example.com/category-a/topic/ [R=301,L] |
طبقهبندیهای سایت میتوانند به بهبود سازماندهی و دسترسی به محتوای وبسایت کمک کنند. با این حال، اگر به درستی مدیریت نشوند، ممکن است باعث ایجاد محتوای تکراری شوند. با انتخاب دستهبندی اصلی، استفاده از تگهای کنونیکال و پیادهسازی ریدایرکت 301، میتوانید از ایجاد محتوای تکراری جلوگیری کرده و تجربه بهتری برای کاربران و موتورهای جستجو فراهم کنید. این اقدامات نه تنها به بهبود سئو سایت کمک میکنند بلکه به موتورهای جستجو کمک میکنند تا به درستی محتوای سایت شما را ایندکس کنند و رتبهبندی بهتری برای سایت شما فراهم شود.
صفحات اختصاصی برای تصاویر
برخی از سیستمهای مدیریت محتوا برای هر تصویر یک صفحه جداگانه در نظر میگیرند. این صفحه در اغلب مواقع فقط تصویر را در یک صفحه خالی نمایش میدهد. از آنجایی که این صفحه محتوای دیگری ندارد، بسیار شبیه به سایر صفحات مربوط به تصاویر مختلف سایت است و بنابراین توسط موتورهای جستجو به عنوان محتوای تکراری در نظر گرفته میشود. برای جلوگیری از انتشار این محتوای تکراری میتوانید از روشهای زیر استفاده کنید:
1. غیرفعال کردن صفحات اختصاصی برای تصاویر
یکی از بهترین راهکارها این است که تا جای ممکن ویژگی مربوط به ساخت صفحه اختصاصی برای تصاویر را غیرفعال کنید. این کار باعث میشود تا موتورهای جستجو به جای صفحات خالی، به صفحات اصلی و محتوای کامل دسترسی داشته باشند.
2. استفاده از ویژگی noindex
در صورتی که امکان غیرفعال کردن صفحات اختصاصی برای تصاویر وجود ندارد، بهترین کاری که میتوانید انجام دهید این است که ویژگی noindex را به صفحه خود اضافه کنید تا موتورهای جستجو این صفحات را ایندکس نکنند.
مثال:
در تگ <head> صفحه مربوط به تصویر، تگ زیر را اضافه کنید:
1 |
<meta name="robots" content="noindex"> |
محتوای تکراری در صفحات مربوط به کامنتها
اگر شما بخش نظرات و کامنتها را در وبسایت خود فعال کردهاید، ممکن است بعد از گذشت مدت زمان مشخصی آنها به صورت خودکار صفحهبندی شوند. در این صفحات محتوای یکسانی وجود دارد و تنها نظراتی که در بخش پایین هر صفحه وجود دارد متفاوت است. بنابراین شما باز هم با مشکل محتوای تکراری در وبسایت خود مواجه خواهید شد.
مثال:
- URL مقالهای که کامنتهای شماره 1 تا 20 را نمایش میدهد: https://www.example.com/category/topic/
- صفحه کامنتهای بین 21 تا 40: https://www.example.com/category/topic/comments-2/
- صفحه کامنتهای بین 41 تا 60: https://www.example.com/category/topic/comments-3/
راهکارهای جلوگیری از انتشار محتوای تکراری در صفحات کامنتها
1. استفاده از روابط لینکهای صفحهبندی (Rel=“prev” و Rel=“next”)
برای جلوگیری از انتشار محتوای تکراری در سایت خود میتوانید از روابط لینکهای صفحهبندی استفاده کنید تا به موتورهای جستجو نشان دهید که این صفحات در واقع متعلق به یک صفحه خاص هستند.
مثال:
در <head> صفحات نظرات، از تگهای زیر استفاده کنید:
در صفحه اصلی:
1 |
<link rel="next" href="https://www.example.com/category/topic/comments-2/"> |
در صفحه نظرات 2:
1 2 |
<link rel="prev" href="https://www.example.com/category/topic/"> <link rel="next" href="https://www.example.com/category/topic/comments-3/"> |
در صفحه نظرات 3:
1 |
<link rel="prev" href="https://www.example.com/category/topic/comments-2/"> |
2. استفاده از تگ کنونیکال
میتوانید از تگ کنونیکال برای اشاره به نسخه اصلی محتوا استفاده کنید. این تگ به موتورهای جستجو اعلام میکند که نسخه اصلی محتوا کدام است و از ایجاد محتوای تکراری جلوگیری میکند.
مثال:
در صفحات نظرات، از تگ زیر استفاده کنید:
1 |
<link rel="canonical" href="https://www.example.com/category/topic/"> |
مدیریت صحیح صفحات اختصاصی برای تصاویر و صفحات کامنتها میتواند به جلوگیری از ایجاد محتوای تکراری و بهبود سئو سایت کمک کند. با استفاده از ویژگی noindex، روابط لینکهای صفحهبندی و تگهای کنونیکال، میتوانید از تاثیرات منفی محتوای تکراری بر روی رتبهبندی سایت خود جلوگیری کنید و تجربه بهتری برای کاربران و موتورهای جستجو فراهم کنید.
محلی سازی و hreflang و ارتباط آن با محتوای تکراری
زمانی که صحبت از محلیسازی میشود، باید دقت داشته باشید که قرار دادن محتوای یکسان در محلهای مختلفی از سایت برای کاربرانی که دقیقا با یک زبان صحبت میکنند، میتواند باعث به وجود آمدن مشکلات مربوط به محتوای تکراری شود.
مثال:
فرض کنید که شما یک وبسایت اختصاصی برای بازار ایران و همینطور برای بازار امارات دارید که هر دو به زبان انگلیسی هستند. به احتمال زیاد مجبور میشوید که محتوای تکراری زیادی را در سایت خود منتشر کنید. گوگل تبحر خاصی در تشخیص این مسئله دارد و معمولا نتایج مربوط به این دو صفحه را در کنار یکدیگر قرار میدهد.
راهکار استفاده از hreflang
ویژگی hreflang به شما کمک میکند تا از انتشار این نوع محتوا در وبسایت خود خودداری کنید. این ویژگی به موتورهای جستجو اعلام میکند که نسخههای مختلفی از یک صفحه برای زبانها یا مناطق جغرافیایی مختلف وجود دارد.
نحوه استفاده از تگ hreflang
برای استفاده از تگ hreflang، باید کدهای HTML مناسب را در هدر هر صفحه قرار دهید. این تگها به موتورهای جستجو کمک میکنند تا نسخههای مختلف یک صفحه را برای زبانها و مناطق جغرافیایی مختلف شناسایی و ایندکس کنند.
مثال:
فرض کنید شما دو نسخه از یک صفحه دارید:
- یکی برای کاربران در ایران: https://www.example.com/ir/page
- دیگری برای کاربران در امارات: https://www.example.com/ae/page
در هدر هر صفحه، تگهای hreflang زیر را اضافه کنید:
صفحه ایران:
1 2 |
<link rel="alternate" hreflang="en-IR" href="https://www.example.com/ir/page" /> <link rel="alternate" hreflang="en-AE" href="https://www.example.com/ae/page" /> |
صفحه امارات:
1 2 |
<link rel="alternate" hreflang="en-IR" href="https://www.example.com/ir/page" /> <link rel="alternate" hreflang="en-AE" href="https://www.example.com/ae/page" /> |
نکات کلیدی
-
استفاده از کد زبان و منطقه صحیح:
- مطمئن شوید که از کد زبان و منطقه صحیح استفاده میکنید. برای مثال، برای انگلیسی در ایران از en-IR و برای انگلیسی در امارات از en-AE استفاده کنید.
-
هماهنگی و یکپارچگی تگها:
- اطمینان حاصل کنید که تگهای hreflang در تمامی نسخههای یک صفحه هماهنگ و یکپارچه هستند تا از مشکلات خزش و ایندکس شدن جلوگیری شود.
صفحات نتایج جستجو قابل ایندکس شدن
بسیاری از وبسایتها دارای قابلیت جستجو هستند و به کاربران خود این اجازه را میدهند تا در میان محتوای آنها به دنبال یک محتوای خاص باشند. صفحاتی که نتایج جستجو را به کاربران نمایش میدهند بسیار شبیه به یکدیگر هستند و در اکثر مواقع هیچ ارزشی برای موتورهای جستجو ندارند. به همین علت، احتمالا شما هم علاقهای به ایندکس شدن آنها ندارید.
جلوگیری از ایندکس شدن صفحات نتایج جستجو
با بهینهسازی و استفاده از ویژگی noindex میتوانید به راحتی از ایندکس شدن این صفحات جستجو جلوگیری کنید. علاوه بر این، باید دقت داشته باشید که بهترین کاری که در این شرایط میتوانید انجام دهید این است که در هیچ صفحهای لینک صفحات جستجو خود را قرار ندهید.
مثال استفاده از ویژگی noindex:
برای جلوگیری از ایندکس شدن صفحات نتایج جستجو، میتوانید تگ زیر را در <head> صفحات نتایج جستجو قرار دهید:
1 |
<meta name="robots" content="noindex"> |
غیر فعال کردن دسترسی موتورهای جستجو به فایل robots.txt
در صورتی که شما هم در وبسایت خود تعداد زیادی صفحه نتایج جستجو دارید که تمامی آنها توسط رباتهای موتورهای جستجو خزیده میشوند، پیشنهاد میشود دسترسی موتورهای جستجو به این صفحات را با استفاده از فایل robots.txt غیر فعال کنید.
مثال فایل robots.txt:
در فایل robots.txt میتوانید دستورات زیر را اضافه کنید تا از خزش و ایندکس شدن صفحات نتایج جستجو جلوگیری کنید:
1 2 |
User-agent: * Disallow: /search |
نکات کلیدی:
-
استفاده از noindex:
- حتماً از تگ noindex در صفحات نتایج جستجو استفاده کنید تا از ایندکس شدن آنها توسط موتورهای جستجو جلوگیری شود.
-
عدم لینکدهی به صفحات جستجو:
- از لینکدهی به صفحات نتایج جستجو در سایر صفحات وبسایت خودداری کنید تا این صفحات از دید موتورهای جستجو مخفی بمانند.
-
استفاده از فایل robots.txt:
- دسترسی رباتهای موتورهای جستجو به صفحات نتایج جستجو را با استفاده از فایل robots.txt محدود کنید.
محیط های تست و آماده سازی قابل ایندکس شدن
استفاده از محیطهای آمادهسازی و تست میتواند بهترین روش برای امتحان کردن ویژگیهای جدید روی سایت باشد، اما گاهی اوقات این صفحات به صورت اشتباه در دسترس موتورهای جستجو قرار گرفته و قابل ایندکس شدن میشوند. این موضوع میتواند مشکلاتی برای سئو سایت شما ایجاد کند.
جلوگیری از ایندکس شدن محیطهای تست و آمادهسازی
برای جلوگیری از دسترسی موتورهای جستجو به محیطهای آمادهسازی و تست، میتوانید از روشهای مختلفی استفاده کنید. یکی از مهمترین روشها، استفاده از قابلیت احراز هویت HTTP است. این کار نه تنها از دسترسی موتورهای جستجو به این محیطها جلوگیری میکند، بلکه مانع از دسترسی افراد غیرمجاز به این محیطها نیز میشود.
استفاده از احراز هویت HTTP
برای تنظیم احراز هویت HTTP، میتوانید از فایل .htaccess در سرور آپاچی استفاده کنید. در اینجا نمونهای از تنظیمات لازم برای احراز هویت HTTP آورده شده است:
-
ایجاد فایل .htpasswd:
- ابتدا یک فایل با نام .htpasswd ایجاد کنید و اطلاعات کاربری مورد نظر خود را در آن قرار دهید.
مثال:
1 |
user:$apr1$randomsalt$hashedpassword |
-
میتوانید از ابزارهای آنلاین برای ایجاد این فایل استفاده کنید.
-
تنظیمات فایل .htaccess:
- سپس فایل .htaccess را در دایرکتوری مورد نظر ایجاد کنید و تنظیمات زیر را در آن قرار دهید:
1 2 3 4 |
AuthType Basic AuthName "Restricted Area" AuthUserFile /path/to/.htpasswd Require valid-user |
-
در اینجا، AuthUserFile باید به مسیر کامل فایل .htpasswd اشاره کند.
استفاده از robots.txt
اگر نمیخواهید از احراز هویت HTTP استفاده کنید، میتوانید با استفاده از فایل robots.txt دسترسی موتورهای جستجو به محیطهای تست و آمادهسازی را محدود کنید.
مثال فایل robots.txt:
1 2 3 |
User-agent: * Disallow: /staging/ Disallow: /test/ |
استفاده از تگ noindex
یکی دیگر از روشهای جلوگیری از ایندکس شدن صفحات تست و آمادهسازی، استفاده از تگ noindex در صفحات مورد نظر است. این کار باعث میشود تا موتورهای جستجو این صفحات را ایندکس نکنند.
مثال:
در تگ <head> صفحات تست و آمادهسازی، تگ زیر را اضافه کنید:
1 |
<meta name="robots" content="noindex"> |
برای جلوگیری از ایندکس شدن محیطهای تست و آمادهسازی و محافظت از این محیطها در برابر دسترسی غیرمجاز، میتوانید از روشهای مختلفی مانند احراز هویت HTTP، فایل robots.txt و تگ noindex استفاده کنید. این اقدامات به شما کمک میکنند تا از مشکلات سئو و دسترسی غیرمجاز به محیطهای تست و آمادهسازی جلوگیری کنید. در صورت نیاز به ایندکس شدن این محیطها، میتوانید به سرعت تنظیمات را تغییر دهید و محیطها را قابل ایندکس کنید.
جلوگیری از انتشار محتوایی که در حال انجام است
زمانی که شما یک صفحه جدید در وبسایت خود میسازید که تنها شامل یک محتوای کوچک است، سعی کنید آن را بدون منتشر کردن ذخیره کنید. این صفحه معمولاً هیچ ارزشی ندارد و شما ابتدا باید محتوای آن را تکمیل کنید. به این ترتیب، میتوانید به میزان بسیار زیادی از انتشار محتوای تکراری در وبسایت خود جلوگیری کنید.
نکته مهم دیگری که برای جلوگیری از انتشار محتوای تکراری باید به آن دقت کنید، این است که صفحات ناتمام را به عنوان پیشنویس در سایت خود ذخیره کنید. اگر لازم است تا صفحاتی با محتوای محدود را منتشر کنید، سعی کنید از ایندکس شدن آنها توسط موتورهای جستجو جلوگیری کنید. برای انجام این کار میتوانید از ویژگی noindex استفاده کنید که به طور خاص برای انجام این کار طراحی شده است.
پارامترهایی که برای مسیریابی استفاده میشوند و تأثیر آنها در انتشار محتوای تکراری در سایت
یکی دیگر از کاربردهای بسیار مهم پارامترها، این است که میتوان از آنها برای مسیریابی استفاده کرد. به عنوان مثال، زمانی که شما یک لینک را در توییتر به اشتراک میگذارید، منبع نیز به لینک شما اضافه میشود. این منبع میتواند یکی دیگر از انواع محتوای تکراری باشد که ممکن است در وبسایت شما وجود داشته باشد.
بهترین روشی که برای جلوگیری از انتشار این نوع محتوای تکراری در سایت وجود دارد، این است که URLهای کنونیکال خود ارجاع را در صفحات خود پیادهسازی کنید. اگر قبلاً این کار را انجام دادهاید، باید بدانید که دیگر مشکلی در این خصوص وجود ندارد و شما با خیال راحت میتوانید لینکهای خود را به اشتراک بگذارید.
توجه داشته باشید که تمامی URLهایی که دارای این پارامترها هستند باید به صورت پیشفرض کنونیکال شده و تبدیل به نسخه بدون پارامتر شوند تا شما بتوانید بدون انتشار محتوای تکراری در سایت خود از این URLها استفاده کنید.
محتوای تکراری در آیدی نشستها
نشستها (Sessions) ممکن است اطلاعات کاربران را برای تجزیه و تحلیل در محیط وب ذخیره کنند. اگر هر لینکی که کاربر درخواست میکند، یک آیدی نشست را اضافه کند، ممکن است باعث به وجود آمدن تعداد زیادی محتوای تکراری در سایت شود؛ چرا که محتوای این URLها دقیقاً یکسان است و در نتیجه موتورهای جستجو آنها را به عنوان محتوای تکراری شناسایی میکنند.
به عنوان مثال، زمانی که شما روی نسخه محلیسازی شده یک وبسایت کلیک میکنید، ممکن است یک متغیر مربوط به نشست گوگل آنالیتیکس به آن اضافه شود که نشان میدهد همین صفحه با همین محتوا باید در یک URL دیگر نمایش داده شود. مجدداً یکی از بهترین روشهایی که برای جلوگیری از انتشار محتوای تکراری در سایت از این طریق وجود دارد، استفاده از URLهای کنونیکال در صفحات سایت میباشد.
نسخه قابل پرینت یک صفحه
زمانی که شما در صفحه وبسایت خود URL قابل چاپ را نیز قرار میدهید، ممکن است باعث به وجود آمدن محتوای تکراری در سایت خود شوید. به عنوان مثال، دو لینک زیر را در نظر بگیرید:
- https://www.example.com/some-page
- https://www.example.com/print/some-page
یکی از بهترین راهکارهایی که برای حل این مشکل وجود دارد، این است که یک کنونیکال URL را از نسخه قابل چاپ صفحه به نسخه معمولی پیادهسازی کنید.
محتوای تکراری که به وسیله کپی محتوا به وجود میآید
در بخشهای قبلی درباره دلایل فنی برای به وجود آمدن این نوع محتوا صحبت کردیم و راهکارهای مناسبی را نیز برای حل این مشکلات در اختیار شما قرار دادیم. در ادامه درباره قرار دادن محتوای تکراری در سایت نیز صحبت خواهیم کرد و نکات جذابی را در این زمینه در اختیار شما قرار خواهیم داد.
صفحات لندینگ برای جستجوی پولی
جستجوی پولی نیازمند صفحات لندینگ اختصاصی است که کلمات کلیدی خاصی را مد نظر قرار میدهند. صفحات کلیدی اغلب یک کپی از صفحه اصلی میباشند که برای هدف قرار دادن برخی از کلمات کلیدی خاص تنظیم شدهاند. بنابراین این صفحات نیز بسیار مشابه یکدیگر میباشند و میتوان آنها را به عنوان محتوای تکراری در سایت شناسایی کرد و در نتیجه موتورهای جستجو نیز حساسیتهای زیادی روی این صفحات دارند.
برای جلوگیری از ایندکس شدن صفحات لندینگ توسط موتورهای جستجو، میتوانید از ویژگی noindex استفاده کنید. به طور کلی، بهترین کاری که میتوانید در برخورد با صفحات لندینگ وبسایت خود انجام دهید، این است که از صفحات دیگر به این صفحات لینک دهید، نه اینکه آنها را در نقشه XML سایت خود قرار دهید.
سایر سایتها محتوای شما را کپی کردهاند
محتوای تکراری به دلایل مختلف ممکن است در وبسایت شما شناسایی شود که یکی از مهمترین این دلایل این است که ممکن است سایر وبسایتها محتوای سایت شما را کپی کرده و آن را در وبسایت خود منتشر کردهاند.
مشکلات ناشی از کپی شدن محتوا
این مسئله مخصوصاً زمانی که اعتبار دامنه وبسایت شما کم است و وبسایتی که محتوای شما را کپی کرده است دارای اعتبار دامنه بیشتری نسبت به وبسایت شما است، میتواند مشکلات بیشتری را برای وبسایت شما ایجاد کند.
وبسایتهایی که دارای اعتبار دامنه بالاتری هستند اغلب بیشتر توسط موتورهای جستجو مورد بررسی قرار میگیرند و در نتیجه اگر این وبسایتها محتوای شما را کپی کرده باشند، ممکن است رباتهای موتورهای جستجو سریعتر آنها را تشخیص داده و مرجع اصلی محتوا را به این سایتها اختصاص دهند.
راهکارهای مقابله با کپی شدن محتوا
1. لینکسازی و استفاده از تگ کنونیکال
برای جلوگیری از بروز چنین مشکلی اطمینان حاصل کنید که سایر وبسایتها با لینکسازی و ساخت canonical URL برای وبسایت شما، اعتبار شما را افزایش دهند و در عین حال از محتوای شما نیز استفاده کنند.
مثال تگ کنونیکال:
1 |
<link rel="canonical" href="https://www.example.com/original-page"> |
2. درخواست DMCA
در صورتی که این وبسایتها علاقهای به انجام این کار نداشتند، شما میتوانید یک درخواست DMCA را برای گوگل ارسال کنید و اقدامات قانونی را در این زمینه انجام دهید.
نحوه ارسال درخواست DMCA به گوگل:
-
ورود به صفحه گزارش نقض حقوق مولف:
- به صفحه Google Copyright Removal بروید.
-
تکمیل فرم درخواست:
- فرم را با دقت تکمیل کنید و اطلاعات دقیق مربوط به محتوای کپی شده و لینکهای مربوطه را وارد کنید.
-
ارسال درخواست:
- درخواست خود را ارسال کنید و منتظر پاسخ گوگل بمانید. گوگل بررسیهای لازم را انجام داده و در صورت تایید، محتوای کپی شده را از نتایج جستجو حذف خواهد کرد.
3. استفاده از ابزارهای مانیتورینگ محتوا
برای شناسایی سریعتر محتوای کپی شده و اقدام به موقع، میتوانید از ابزارهای مانیتورینگ محتوا استفاده کنید. برخی از این ابزارها عبارتند از:
- Copyscape: این ابزار به شما کمک میکند تا محتوای کپی شده را در اینترنت پیدا کنید.
- Google Alerts: با تنظیم هشدارهای گوگل میتوانید از هرگونه کپیبرداری از محتوای خود مطلع شوید.
برای جلوگیری از بروز مشکلات ناشی از کپی شدن محتوا، از لینکسازی و استفاده از تگهای کنونیکال بهره ببرید و در صورت لزوم از درخواستهای DMCA و ابزارهای مانیتورینگ محتوا استفاده کنید. این اقدامات نه تنها به حفاظت از محتوای شما کمک میکنند بلکه اعتبار دامنه شما را نیز افزایش میدهند و بهبود سئو سایت شما را تضمین میکنند.
کپی کردن محتوا از سایر سایتها
کپی کردن محتوا از وبسایتهای دیگر یکی دیگر از انواع محتوای تکراری در سئو سایت به شمار میآید که گوگل آن را در مستندات مربوط به سئو منتشر کرده است. از نظر موتور جستجوی گوگل، یکی از بهترین روشهایی که برای حل این مشکل وجود دارد این است که شما در محتوایی که کپی کردهاید، لینک منبع را نیز وارد کنید.
راهکارهای جلوگیری از مشکلات محتوای تکراری در کپی کردن محتوا
-
وارد کردن لینک منبع:
- زمانی که محتوای یک وبسایت دیگر را کپی میکنید، حتماً لینک منبع را در محتوای خود قرار دهید. این کار باعث میشود که منبع اصلی محتوا مشخص باشد و موتورهای جستجو بتوانند به درستی محتوای شما را تفسیر کنند.
مثال:
1 |
<p>این محتوا از <a href="https://www.originalsource.com">منبع اصلی</a> کپی شده است.</p> |
استفاده از تگ کنونیکال (Canonical):
- استفاده از تگ کنونیکال میتواند به موتورهای جستجو کمک کند تا نسخه اصلی محتوا را شناسایی کنند و از ایجاد محتوای تکراری جلوگیری کنند.
مثال:
1 |
<link rel="canonical" href="https://www.originalsource.com/original-article"> |
استفاده از تگ noindex:
- اگر میخواهید محتوای کپی شده ایندکس نشود، میتوانید از تگ noindex استفاده کنید. این کار باعث میشود که موتورهای جستجو محتوای کپی شده را ایندکس نکنند و از ایجاد محتوای تکراری جلوگیری شود.
مثال:
1 |
<meta name="robots" content="noindex"> |
نکات مهم
-
اجازه گرفتن از صاحب وبسایت: به خاطر داشته باشید که همه صاحبان وبسایتها از این که شما محتوای آنها را به این شکل مورد استفاده قرار دهید، راضی نخواهند بود. بنابراین، توصیه من به شما این است که برای انتشار محتوای آنها به این شکل حتماً اجازه بگیرید.
-
ترکیب روشها: برای جلوگیری از انتشار محتوای تکراری، میتوانید از ترکیب URLهای کنونیکال و تگ noindex استفاده کنید تا نتیجه بهتری بدست بیاورید.
راههای پیدا کردن محتوای تکراری در سایت
یکی از بهترین ابزارهایی که امروزه برای پیدا کردن محتوای تکراری در سایت مورد استفاده قرار میگیرد، گزارش Index Coverage کنسول جستجوی گوگل است که میتواند در این مسیر به میزان زیادی کمک کننده باشد.
استفاده از گزارش Index Coverage
برای استفاده از این ابزار، باید به نکات زیر دقت داشته باشید:
-
پیدا کردن URLها و محتوای تکراری:
- گوگل میتواند URLها و محتوای تکراری که به یک نسخه ترجیح دادهشده canonicalized نشدهاند را پیدا کند.
-
انتخاب canonical توسط گوگل:
- گوگل ممکن است canonical متفاوتی را نسبت به کاربران انتخاب کند. این بدان معناست که گوگل معمولاً canonicalهای شما روی URLها را نادیده گرفته و در عوض canonicalهایی که خود ترجیح میدهد را انتخاب میکند.
-
نادیده گرفتن canonicalهای تعریفشده توسط شما:
- گوگل ترجیح میدهد که canonicalهایی که برای URLها تعریف کردهاید و آنها را از طریق نقشه سایت ثبت کردهاید را نادیده بگیرد.
مراحل استفاده از گزارش Index Coverage
-
ورود به کنسول جستجوی گوگل:
- به حساب کنسول جستجوی گوگل خود وارد شوید.
-
انتخاب سایت:
- وبسایت مورد نظر خود را انتخاب کنید.
-
دسترسی به گزارش Index Coverage:
- از منوی سمت چپ به بخش “Index” بروید و “Coverage” را انتخاب کنید.
-
بررسی خطاها و هشدارها:
- در این بخش میتوانید خطاها و هشدارهایی که مربوط به URLهای تکراری و مشکلات canonical هستند را مشاهده کنید.
-
اقدام برای اصلاح مشکلات:
- بر اساس خطاها و هشدارهایی که مشاهده میکنید، میتوانید اقدامات لازم را برای اصلاح مشکلات محتوای تکراری انجام دهید.
ابزارهای دیگر برای پیدا کردن محتوای تکراری
علاوه بر گزارش Index Coverage کنسول جستجوی گوگل، میتوانید از ابزارهای دیگری نیز برای پیدا کردن محتوای تکراری در سایت خود استفاده کنید:
-
Screaming Frog:
- Screaming Frog یک ابزار خزش سایت است که میتواند به شما کمک کند تا محتوای تکراری در سایت خود را شناسایی کنید.
-
Copyscape:
- Copyscape یک ابزار آنلاین است که به شما امکان میدهد محتوای کپی شده در سایت خود را پیدا کنید.
-
SiteLiner:
- SiteLiner یک ابزار آنلاین دیگر است که میتواند به شما کمک کند تا محتوای تکراری در سایت خود را شناسایی کنید.
صحبت پایانی
من در این مطلب از وب آنجل به طور کامل درباره انتشار محتوای تکراری در سایت صحبت کردم و سعی کردم اطلاعات کاملی را در این زمینه در اختیار شما قرار دهم. عدم انتشار این نوع محتوا در سایت میتواند به میزان بسیار زیادی روی سئو سایت شما تاثیر مثبت بگذارد و باعث شود تا شما رتبه بهتری را در لیست موتورهای جستجو بدست بیاورید.
محتوای تکراری میتواند به دلیل مشکلات فنی، کپیبرداری از سایر سایتها یا حتی ساختار نامناسب URLها به وجود بیاید. با استفاده از ابزارهای موجود مانند گزارش Index Coverage کنسول جستجوی گوگل، Screaming Frog، Copyscape و SiteLiner میتوانید محتوای تکراری را شناسایی و اصلاح کنید. همچنین، پیادهسازی تگهای کنونیکال و ویژگی noindex و جلوگیری از ایندکس شدن صفحات کمارزش و محیطهای تست، نقش مهمی در بهبود سئو سایت دارد.
با رعایت نکات و توصیههای مطرحشده در این مقاله که فکر میکنم جامع ترین مقاله در دنیا باشه، میتوانید از ایجاد محتوای تکراری جلوگیری کنید و تجربه بهتری برای کاربران و موتورهای جستجو فراهم کنید. این اقدامات نه تنها به بهبود رتبهبندی سایت شما کمک میکنند، بلکه باعث افزایش ترافیک سایت شما نیز خواهند شد.
برای مشاوره و خدمات سئو همین حالا تماس بگیرید
آژانس دیجیتال مارکتینگ وب آنجل بیش از یک دهه سابقه در زمینه آموزش، مشاوره، و خدمات سئو دارد. برای بهرهمندی از این خدمات، میتوانید از طریق لینکهای زیر اقدام کنید.
سلام
محتوای سایت من قسمت بلاگ قبلا با chatgpt نوشته شده بود همشون حدود ۱۰۰تا مقاله و بازدید هم داشتن و بعضی هاشون رتبه هم داشتن اما یه مدته که رتبه ها خیلی افت کرده می خواستم ببینم به نظرتون مقالاتو پاک کنم و مقالات جدید انتشار بدم یا نه اونها باشن؟ یا همونا رو ادیت کنم؟ ممنون میشم راهنماییم کنید.
سلام رضا جان، خیلی خوشحالم که به سایت ما اومدی و سوالت رو مطرح کردی. در مورد مقالات بلاگت، باید بگم که چند تا راه حل برات دارم:
ادیت مقالات فعلی: اگر مقالات فعلیات بازدید و رتبه خوبی داشتن، بهتره اونا رو پاک نکنی. به جای این کار، میتونی مقالات رو ادیت کنی و محتوای جدید و بهروزتری اضافه کنی. این کار میتونه به بهبود رتبهها کمک کنه.
افزایش کیفیت محتوا: گوگل و سایر موتورهای جستجو به کیفیت محتوا اهمیت زیادی میدن. سعی کن محتوای تولیدیات اصیل، منحصر به فرد و با ارزش باشه. استفاده از دادههای واقعی، تصاویر مرتبط و منابع معتبر میتونه به بهبود رتبه کمک کنه.
بررسی الگوریتمهای جدید گوگل: ممکنه افت رتبهها به خاطر تغییرات الگوریتمهای گوگل باشه. پیگیری تغییرات جدید و تطبیق سایت با اونا میتونه مفید باشه.
تولید محتوای جدید: علاوه بر ادیت مقالات قبلی، تولید محتوای جدید و بهروز میتونه به جذب بازدیدکنندههای بیشتر کمک کنه.
پیشنهاد میکنم ابتدا مقالات فعلی رو با محتوای جدید و بهروزتر بهبود بدی و در کنار اون، محتوای تازه و منحصر به فرد هم تولید کنی. اگر سوال دیگهای داشتی یا نیاز به راهنمایی بیشتری داشتی، خوشحال میشم کمکت کنم.
موفق باشی!