Proposta Google para indexação de conteúdos AJAX
A Google propõe captar conteúdos com AJAX. Isto será uma revolução incrível e voltará a encorajar os Webmasters e SEO’s a utilizar AJAX e assim enriquecer os websites, podendo os seus conteúdos passar a estarem acessíveis para a Google.
Acredito eu também que esta será uma evolução importante para os conteúdos Web e respectiva indexação.
A Google afirma que 70% dos websites utilizam javascript em qualquer que seja o seu método. Claro está que este valor não se refere apenas ao AJAX, mas uma parte destes 70% serão realmente em AJAX.
Seguem os objectivos que a Google pretende alcançar com esta melhoria:
·
Utilizadores e motores de busca vêem o mesmo conteúdo
·
Os motores de busca podem enviar os usuários directamente para o URL AJAX (e não a uma cópia estática)
·
Criar uma forma de validação do AJAX para os webmasters e SEO’s (se o spider ler todo o conteúdo inserido então está bem programado )
Como é que os motores de busca irão indexar conteúdos com AJAX?
Alterar ligeiramente os fragmentos de URL para páginas AJAX
As páginas com AJAX exibem o mesmo conteúdo sempre que o acesso seja directo. Estas são as páginas que poderão ser referidas nos resultados da pesquisa.
Em vez de um URL semelhante a:
http://example.com/page?query#state
A Google direccionar um token para tornar possível a reconhecer os URL’s:
http://example.com/page?query#[FRAGMENTTOKEN]state
Baseado numa revisão dos URL’s na web, propõe ainda a utilização de "!" (ponto de exclamação), como o token ideal para o efeito. A proposta de URL que pode ser demonstrado nos resultados da pesquisa seria então:
http://example.com/page?query#!state
Use um headless browser que gere um HTML instântaneo no servidor
O headless browser é usado para aceder às páginas com AJAX e gerarem imediatamente um código HTML com base no estado final no browser.
Apenas e só URL’s com tag’s são passados para o headless browser para processamento.. Ao fazer isso, do lado do servidor, o webmaster controla o código HTML do site que é gerado e pode facilmente verificar que todos os scirpt’s JavaScript são executados na perfeição.
Um exemplo é o browser HtmlUnit, um código aberto "GUI-less navegador para programas Java. Muito interessante!
Permitir que os indexadores de motores de busca acedão a estes URLs
Como os fragmentos do URL nunca são enviados nos pedidos ao servidor, é necessário alterar ligeiramente o URL usado para aceder à página.
Ao mesmo tempo, diz ao servidor para usar o headless browser para gerar o código HTML em vez de devolver uma página com JavaScript, sendo que outros URL’s continuarão sem chamar o headless browser.
A Google propõe retratar a informação do estado e adicioná-la aos parâmetros de consulta com um token. Aplicando o exemplo acima descrito, uma URL que seria
http://example.com/page?query&[QUERYTOKEN]=state
Com base na análise de URLs corrente na Web ainda propõe o uso de um "_escaped_fragment_" como o token.
A proposta seria então:
http://example.com/page?query&_escaped_fragment_=state
Mostrar a URL original para os utilizadores nos resultados da pesquisa
Para melhorar a experiência de interacção, faz sentido para os utilizadores referenciarem directamente as páginas baseadas em AJAX.
Isto pode ser conseguido, por exemplo, para uma URL original como: http://example.com/page?query#!state
Para um URL de estado, como por exemplo:
http://example.com/dictionary.html # AJAX
que poderia estar disponível para indexadores e utilizadores como por exemplo:
http://example.com/dictionary.html #! AJAX
que poderá ser indexado como
http://example.com/dictionary.html?_escaped_fragment_=AJAX
que por sua vez seria apresentado aos utilizadores como
http://example.com/dictionary.html#!AJAX