September 6th, 2010Премахване на сайтмап от индекса на Гугъл от Пацо
След като Гугъл е индексирал всичките ви сайтмапове (когато са 1 или 2, не е проблем, но при повече бройки е кофти), ги забранявате. Няма значение дали през robots.txt, meta tags или през htaccess. Имайте предвид, че забраната ще направи сайтмаповете недостъпни, но това е малка жертва в името на успеха.
През robots.txt става така:
Във файла добавяте
User-agent: *
Disallow: /sitemap.xml
а ако са в една директория, именована sitemap
User-agent: *
Disallow: /sitemap/*
Чрез meta tags би трябвало да стане чрез добавяне на долния ред във файла:
<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
макар че не знам дали Гугъл биха разпознали този мета таг в сайтмапа и затова минаваме към третия вариант и той е забрана
Чрез .htaccess:
Някъде в началото на файла добавяте:
<Files ~ "\.xml$"> Header append X-Robots-Tag "noindex, noarchive" </Files>
Ако сайтмапът ви е .php файл, сменете \.xml с sitemap\.php
След това отивате в URL removal tool на Webmaster Tools и ако сайтмаповете са в една или няколко директории (по-лесният вариант), искате премахване на директорията/директориите. Ако сайтмаповете са разположени на различни места, ги добавяте едно по едно.
След като гугъл премахне сайтмаповете от индекса си, премахвате и забраната за индексирането на сайтмаповете.
- SEOПрограмиране Cloaking Cloaking най-просто казано е начин, по който се представя едно съдържание на потребителя и друго на
- SEO Какво знам за СЕО/SEO Често ми задават този въпрос, но досега не съм систематизирал знанията си и сега ше се опитам да го
- SEOПрограмиране Създаване на Google sitemap PHP script Възможно най-простия скрипт за създаване на Google sitemap. Разбира се, директно не може да го ползв
- SEO Redirect 301/302 = meta refresh? Грешка! Като за начало да разясним какво представлят Redirect 301, 302 и meta refresh. Машините, върху които
- SEO robots.txt – ефективен SEO инструмент Според едно от последните изследвания в интернет за ползването на robots.txt файла, само 38% от сайт
- SEOПрограмиране Създаване на Yahoo sitemap PHP script Макар и по-рядко ползвана, търсачката Yahoo не трябва да се пренебрегва. За разлика от Google sitema
- SEOПрограмиране Избягване на duplicate content на начална страница Както може би знаете, или не знаете, www.site.com/, www.site.com/index.php, site.com/ и site.com/ind
- SEO Sitelinks вече и на български Всъщност заглавието е малко подвеждащо, защото и досега имаше доста сайтове със сайтлинкс на българс
- SEOПрограмиране Избягване на duplicate content във вътрешни страници Тук ще стане въпрос не как да избегнем duplicate content на вече съществуващи страници, а как да го
- SEOПрограмиране Домейн и поддомейн на различни хостинги Първата мисъл, която може да ви мине през ума е, че е невъзможно. Е, не е съвсем така. Само, че си и
- SEO Sitelinks в резултатите на Гугъл Нa много места срещам въпроси на различни уебмастъри как се получава така, че при определено търсене
- Ad(Sense|Words)SEO Adwords Keyword Tool вече показва реалния трафик Една добра новина за SEO гурутата и за SEM такивата. Keyword Tool на Adwords вече ще показва реалния
- SEO Завърши avtorentacar състезанието След шест месеца мъчителна битка завърши второто у нас SEO състезание с награден фонд и първото, кое
- SEO Какво е SEO (СЕО), оптимизация за търсачки SEO означава "Сурва, сурва, весела, година" ;). Разбира се, че не означава това. Но каквото и опреде
September 6th, 2010 at 2:21 pm
Просто преименуване на .xm не върши ли същата работа?
September 6th, 2010 at 2:26 pm
Ако говорим сериозно – при мен ползвам .php за такива случаи който генерира само списък от url и не съм забелязал да индексирва скрипта
September 6th, 2010 at 3:49 pm
@Иванчо, кое точно да преименуваме на .xm и с каква цел?
@Тихомир, става дума, когато имаме множество сайтмапове, напр, phpBB има един мод, който създава толкова сайтмапове, колкото са форумите на сайта. И никак не е приятно да видиш 30 сайтмапа индексирани.
September 7th, 2010 at 1:45 am
Този мод ако прави статичен файл/ове сайтмапче, кофти. php скриптовете които ползвам не правят файлове а направо ги генерират при поискване – може би това е разликата – проверих с inurl:iметонаскриптами.php – нема го в индекса и това на доста мои сайтове е така.
September 7th, 2010 at 12:45 pm
Сайта ти не дава да пиша код, но според мен трябва да е нещо такова в .htaccess-а:
Files ~ “\.xml$”
Order allow,deny
Deny from all
Satisfy all
/Files
September 7th, 2010 at 11:53 pm
@Тихомир Ипоталиев, те файловете са статични, но се обновяват на колкото време му зададеш, така че няма грижи с опресняването.
@3D Уеб дизайн, моят код е напълно работещ и е съобразен с x-robots изискванията. А твоят код ще забрани изобщо достъпа до xml файловете. Но от друга страна и това ще свърши работа.
September 8th, 2010 at 9:09 am
Да, ще ги забрани, няма да може да се отварят и през браузер. Имах предвид точно това – този htaccess да се сложи в директорията в която ти е нужно, защото в противен случай ще доведе до недостъпност на всички xml файлове в сайта. Това работи само за карти на сайт с файлов тип .xml, ако картата ти се генерира динамично от php, в повечето случаи урл адреса не завършва на .xml и тогава не е приложимо.
September 8th, 2010 at 9:51 pm
Ами пробвай тогава да ги смениш на php но само само ако са списък от url а не xmap формат.
September 10th, 2010 at 9:25 pm
@Тихомир, явно не се разбираме. За какво ми е да сменям типа на сайтмапа? Така или иначе ще се индексира. Или имаш друго предвид?