Todo webmaster sabe que para que las personas comiencen a visitar su recurso desde los motores de búsqueda, es necesario indexarlo. Acerca de qué es la indexación de sitios, cómo se lleva a cabo y cuál es su significado, lo diremos en este artículo.
¿Qué es indexar?
Entonces, la palabra "indexar" en sí misma significa ingresar algo en el registro, un censo de materiales que están disponibles. El mismo principio se aplica a la indexación de sitios. De hecho, este proceso también puede llamarse ingreso de información sobre recursos de Internet en la base de datos de los motores de búsqueda.
Así, tan pronto como el usuario ingrese otra frase en el campo de búsqueda de Google, el script le devolverá un resultado, incluido el título de su sitio y su breve descripción, que vemos a continuación.
¿Cómo se realiza la indexación?
La indexación en sí misma ("Yandex" es, o Google - no juega ningún papel) es bastante simple. Toda la web de Internet, centrándose en la base de datos de direcciones IP que tienen los motores de búsqueda, es escaneada por poderosos robots, "arañas" que recopilaninformación sobre su sitio. Cada uno de los motores de búsqueda tiene una gran cantidad de ellos y funcionan automáticamente las 24 horas del día. Su tarea es ir a su sitio y "leer" todo el contenido mientras ingresan los datos en la base de datos.
En consecuencia, en teoría, la indexación del sitio no depende mucho del propietario del recurso. El factor decisivo aquí es el robot de búsqueda que llega al sitio y lo explora. Esto es lo que afecta la rapidez con la que su sitio aparece en los resultados de búsqueda.
¿Términos de indexación?
Por supuesto, es beneficioso para todos los webmasters que su recurso aparezca en los resultados de búsqueda lo más rápido posible. Esto afectará, en primer lugar, a los plazos para llevar el sitio a las primeras posiciones y, en segundo lugar, cuando comiencen las primeras etapas de monetización del sitio. Por lo tanto, cuanto antes el robot de búsqueda "coma" todas las páginas de su recurso, mejor.
Cada motor de búsqueda tiene su propio algoritmo para ingresar datos del sitio en su base de datos. Por ejemplo, la indexación de páginas en Yandex se lleva a cabo por etapas: los robots escanean los sitios constantemente, luego organizan la información, después de lo cual se lleva a cabo la llamada "actualización", cuando todos los cambios surten efecto. La empresa no establece la regularidad de tales eventos: se llevan a cabo una vez cada 5-7 días (por regla general), sin embargo, pueden tener lugar con 2 y 15 días de anticipación.
Al mismo tiempo, la indexación del sitio en Google sigue un modelo diferente. En este motor de búsqueda, tales "actualizaciones" (actualizaciones de la base) se realizan regularmente, por lo tanto, espere cada vez hasta que los robots ingresen la información en la base de datos, y luegose ordenará cada pocos días, no es necesario.
Basándonos en lo anterior, podemos sacar la siguiente conclusión: las páginas en Yandex se agregan después de 1 o 2 "actualizaciones" (es decir, en un promedio de 7 a 20 días), y en Google esto puede suceder mucho más rápido - literalmente en el día.
Al mismo tiempo, por supuesto, cada motor de búsqueda tiene sus propias peculiaridades de cómo se lleva a cabo la indexación. Yandex, por ejemplo, tiene el llamado "bot rápido", un robot que puede ingresar datos en el problema en unas pocas horas. Es cierto que no es fácil hacer que visite su recurso: esto se refiere principalmente a noticias y varios eventos de alto perfil que se desarrollan en tiempo real.
¿Cómo acceder al índice?
La respuesta a la pregunta de cómo indexar su sitio en los motores de búsqueda es simple y compleja. La indexación de páginas es un fenómeno natural, y si ni siquiera piensas en ello, sino que, por ejemplo, mantienes tu blog, llenándolo gradualmente de información, los motores de búsqueda "tragarán" tu contenido perfectamente con el tiempo.
Otra cosa es cuando necesitas acelerar la indexación de páginas, por ejemplo, si tienes una red de los llamados "satélites" (sitios diseñados para vender enlaces o colocar anuncios, cuya calidad suele ser peor). En este caso, debe tomar medidas para que los robots noten su sitio. Los siguientes se consideran comunes: agregar la URL del sitio a un formulario especial (se llama "AddUrl"); ejecutar la dirección del recurso a través de los directorios de enlace; añadir dirección a directoriosmarcadores y más. Hay numerosas discusiones en los foros de SEO sobre cómo funciona cada uno de estos métodos. Como muestra la práctica, cada caso es único y es difícil encontrar con mayor precisión las razones por las que un sitio se indexó en 10 días y el otro en 2 meses.
¿Cómo acelerar el acceso al índice?
Sin embargo, la lógica detrás de colocar un sitio en el índice más rápido se basa en vincularlo. En particular, estamos hablando de establecer URL en sitios públicos y gratuitos (marcadores, directorios, blogs, foros); sobre la compra de enlaces en sitios grandes y populares (usando el intercambio Sape, por ejemplo); así como agregar un mapa del sitio al formulario addURL. Quizás haya otros métodos, pero los que ya se han enumerado pueden llamarse con seguridad los más populares. Recuerde, en general, todo depende del sitio y de la suerte de su dueño.
¿Qué sitios están indexados?
Según la posición oficial de todos los motores de búsqueda, los sitios que pasan por una serie de filtros entran en el índice. Nadie sabe qué requisitos contienen estos últimos. Solo se sabe que con el tiempo todos mejoran de tal manera que filtran los pseudositios creados para ganar dinero vendiendo enlaces y otros recursos que no llevan información útil para el usuario. Por supuesto, para los creadores de estos sitios, la tarea principal es indexar las páginas tanto como sea posible (para atraer visitantes, vender enlaces, etc.).siguiente).
¿Qué recursos prohíben los motores de búsqueda?
Basándonos en la información anterior, podemos concluir qué sitios tienen más probabilidades de no entrar en las SERP. La misma información es expresada por representantes oficiales de motores de búsqueda. En primer lugar, estos son sitios que contienen contenido no único generado automáticamente que no es útil para los visitantes. Le siguen recursos en los que hay un mínimo de información, creados para vender enlaces, etc.
Cierto, si analizas los resultados de los motores de búsqueda, puedes encontrar todos estos sitios en él. Por lo tanto, si hablamos de sitios que no estarán presentes en los resultados de búsqueda, debemos tener en cuenta no solo el contenido no único, sino también una serie de otros factores: muchos enlaces, estructura mal organizada, etc.
Ocultar contenido. ¿Cómo deshabilitar la indexación de páginas?
Los motores de búsqueda rastrean todo el contenido del sitio. Sin embargo, existe una técnica mediante la cual puede restringir el acceso de los robots de búsqueda a una sección en particular. Esto se hace utilizando el archivo robots.txt, al que reaccionan las "arañas" de los motores de búsqueda.
Si este archivo se coloca en la raíz del sitio, la indexación de las páginas procederá de acuerdo con el script que está escrito en él. En particular, puede deshabilitar la indexación con un solo comando: No permitir. Además, el archivo también puede especificar secciones del sitio a las que se aplicará esta prohibición. Por ejemplo, para prohibir el índice de todo el sitio, basta con especificaruna barra "/"; y para excluir la sección “tienda” de los resultados de búsqueda, basta con especificar la siguiente característica en su ficha: “/tienda”. Como puede ver, todo es lógico y extremadamente simple. La indexación de páginas se cierra muy fácilmente. Al mismo tiempo, los robots de búsqueda visitan su página, leen robots.txt y no ingresan datos en la base de datos. Así que puedes manipular fácilmente para ver ciertas características de los sitios en la búsqueda. Ahora hablemos de cómo se comprueba el índice.
¿Cómo puedo comprobar la indexación de páginas?
Hay varias formas de averiguar cuántas y qué páginas están presentes en la base de datos de Yandex o Google. El primero, el más simple, es establecer la solicitud correspondiente en el formulario de búsqueda. Se ve así: site:domen.ru, donde en lugar de domen.ru escribes, respectivamente, la dirección de tu sitio. Cuando realiza una solicitud de este tipo, el motor de búsqueda mostrará todos los resultados (páginas) ubicados en la URL especificada. Además, además de enumerar todas las páginas, también puede ver el número total de material indexado (a la derecha de la frase "Número de resultados").
La segunda forma es verificar la indexación de la página utilizando servicios especializados. Ahora hay una gran cantidad de ellos, de improviso pueden llamarse xseo.in y cy-pr.com. En dichos recursos, no solo puede ver el número total de páginas, sino también determinar la calidad de algunas de ellas. Sin embargo, solo necesita esto si tiene una comprensión más profunda de este tema. Por regla general, se trata de herramientas SEO profesionales.
Acerca de la indexación "forzada"
También me gustaría escribir un poco sobre los llamadosIndexación "forzada", cuando una persona intenta llevar su sitio al índice utilizando varios métodos "agresivos". Los optimizadores no recomiendan hacer esto.
Los motores de búsqueda, al menos, al notar una actividad excesiva asociada con un nuevo recurso, pueden imponer algún tipo de sanciones que afecten negativamente el estado del sitio. Por lo tanto, es mejor hacer todo lo posible para que la indexación de las páginas se vea lo más orgánica, gradual y fluida posible.