<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Relevância &#187; robots.txt</title>
	<atom:link href="http://relevancia.com.br/tag/robotstxt/feed/" rel="self" type="application/rss+xml" />
	<link>http://relevancia.com.br</link>
	<description>O que importa em Marketing Online.</description>
	<lastBuildDate>Thu, 18 Feb 2010 02:43:38 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Robots.txt &#8211; Bloqueando conteúdos aos buscadores</title>
		<link>http://relevancia.com.br/robots-txt-bloqueando-conteudos-aos-buscadores/</link>
		<comments>http://relevancia.com.br/robots-txt-bloqueando-conteudos-aos-buscadores/#comments</comments>
		<pubDate>Mon, 19 Nov 2007 03:54:26 +0000</pubDate>
		<dc:creator>Gabriel Oyarzabal</dc:creator>
				<category><![CDATA[SEO]]></category>
		<category><![CDATA[Googlebot]]></category>
		<category><![CDATA[robots.txt]]></category>

		<guid isPermaLink="false">http://www.sudsocialmedia.com/robotstxt-bloqueando-conteudos-aos-buscadores</guid>
		<description><![CDATA[Um robot, também chamado de spider ou crawler é um software que percorre a web automaticamente, seguindo links de site em site e indexando os conteúdos. Esses conteúdos serão depois listados nos resultados de buscadores como Google, Yahoo, MSN etc.
O que freqüentemente ocorre, é que temos conteúdos ou arquivos que não queremos que apareçam nos [...]


No related posts.

Posts relacionados trazidos a você pelo <a href='http://mitcho.com/code/yarpp/'>Yet Another Related Posts Plugin</a>.]]></description>
			<content:encoded><![CDATA[<p align="justify">Um robot, também chamado de spider ou crawler é um software que percorre a web automaticamente, seguindo links de site em site e indexando os conteúdos. Esses conteúdos serão depois listados nos resultados de buscadores como Google, Yahoo, MSN etc.</p>
<p align="justify">O que freqüentemente ocorre, é que temos conteúdos ou arquivos que não queremos que apareçam nos resultados de busca. São páginas de login, pastas de sistemas ou imagens, ou simplesmente algum  conteúdo que não queremos que seja listado mesmo. Pode ser também que os bots usem muito os recursos do servidor e você tenha sido advertido pela sua empresa de hosting. Ou ainda, você não quer ser listado em alguns buscadores específicos ou receber visitas de <a title="Lista de bad bots" href="http://www.invision-graphics.com/robotstxt_badbots.html" target="_blank">bad bots</a>.</p>
<p align="justify">A forma de fazer com que os buscadores ignorem certas páginas ou diretórios é através do protocolo <a title="Robots.txt " href="http://www.robotstxt.org/" target="_blank"><strong>Robots.txt</strong></a>, que nada mais é que um <strong>arquivo de texto</strong> colocado na <strong>raíz do site</strong> com informações para os bots.</p>
<p align="justify">A base do Robots.txt é:</p>
<blockquote>
<pre>User-agent:</pre>
<pre>Disallow:</pre>
</blockquote>
<p align="justify"><strong>User-agent</strong> é o  o nome do bot que você deseja bloquear. Para bloquear todos os bots se usa um asterisco (*). <strong>Disallow </strong>onde é especificado o arquivo ou diretório que deve ser ignorado.</p>
<p>Exemplos de uso:</p>
<p>Bloquear todos os bots a todo site:</p>
<blockquote>
<pre>User-agent: *</pre>
<pre>Disallow: /</pre>
</blockquote>
<p>Bloquear somente um bot a todo site:</p>
<blockquote>
<pre>User-agent: Googlebot</pre>
<pre>Disallow: /</pre>
</blockquote>
<p>Bloquear diretórios ou arquivos:</p>
<blockquote>
<pre>User-agent: *</pre>
<pre>Disallow: /arquivos</pre>
<pre>Disallow: /login.php</pre>
</blockquote>
<p align="justify">Alguns bots são compatíveis com uma configuração estendida do Robots.txt para criar exceções de diretórios, incluir sitemap, definir horários de visita dos bots etc.</p>


<!-- Begin SexyBookmarks Menu Code -->
<div class="sexy-bookmarks sexy-bookmarks-expand sexy-bookmarks-bg-enjoy">
<ul class="socials">
		<li class="sexy-twitter">
			<a href="http://twitter.com/home?status=Robots.txt+-+Bloqueando+conte%C3%BAdos+aos+buscadores+-+http://bit.ly/avCl7G+(via+@Relevancia)" rel="" class="external" title="Tweet This!">Tweet This!</a>
		</li>
		<li class="sexy-facebook">
			<a href="http://www.facebook.com/share.php?v=4&amp;src=bm&amp;u=http://relevancia.com.br/robots-txt-bloqueando-conteudos-aos-buscadores/&amp;t=Robots.txt+-+Bloqueando+conte%C3%BAdos+aos+buscadores" rel="" class="external" title="Share this on Facebook">Share this on Facebook</a>
		</li>
		<li class="sexy-delicious">
			<a href="http://del.icio.us/post?url=http://relevancia.com.br/robots-txt-bloqueando-conteudos-aos-buscadores/&amp;title=Robots.txt+-+Bloqueando+conte%C3%BAdos+aos+buscadores" rel="" class="external" title="Share this on del.icio.us">Share this on del.icio.us</a>
		</li>
</ul>
<div style="clear:both;"></div>
</div>
<!-- End SexyBookmarks Menu Code -->



<p>No related posts.</p>
<p>Posts relacionados trazidos a você pelo <a href='http://mitcho.com/code/yarpp/'>Yet Another Related Posts Plugin</a>.</p>]]></content:encoded>
			<wfw:commentRss>http://relevancia.com.br/robots-txt-bloqueando-conteudos-aos-buscadores/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
