Imagina la situación: estás creando un sitio web. Contrate a un webmaster o hágalo usted mismo, gastando mucho dinero y tiempo personal en ello. Alojas tu creación y la llenas con amor de información, sin pensar en la necesidad de guardar una copia del sitio para no perder datos.
Un día, no tan bueno para ti, vas a tu sitio, pero no funciona. Empiezas a descubrir cuál es el problema y, oh horror, el centro de datos se quemó o el alojamiento despegó. O tal vez entró un virus y destruyó sus datos. La pérdida de información en un sitio web es comparable a la pérdida de información en una computadora. Entonces, ¿cómo se guarda una copia del sitio?
Veamos primero la definición. El proceso de archivado de sitios web es la preservación de la versión actual de una página o sitio en un archivo para trabajar con ella más tarde. Para estos fines, se utiliza un software especializado. La empresa más grande del mundo es Internet Archive, de la que hablaremos más adelante.
Para un archivo privado, puede usar navegadores sin conexión que han sido especialmente diseñados para funcionar sin conexión. Ellos ayudarán a crearcopias locales de páginas web individuales o sitios completos. Estos incluyen, por ejemplo:
- Un navegador HTTrack multiplataforma que admite 29 idiomas del mundo y puede reanudar descargas interrumpidas, actualice el espejo del sitio.
- Offline Explorer compartido y gratuito, que le permite descargar no solo archivos o páginas, sino también sitios completos de Internet a través de FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
- Administrador de descargas Administrador de descargas gratuito. Se integra con todos los navegadores, tiene un FTP integrado, es compatible con el protocolo BitTorrent, puede crear archivos torrent, interceptar enlaces desde el portapapeles.
- Teleport Pro de código cerrado para Windows. El programa le permite descargar sitios completos.
- Un programa gratuito no interactivo basado en consola para descargar archivos y sitios de Internet Wget. El programa es compatible con los protocolos HTTPS, HTTP, FTP y también puede funcionar a través de un servidor proxy HTTP. Adecuado para Linux.
Creando una copia de seguridad en el hosting
Puede configurar una copia de seguridad del sitio en su proveedor de alojamiento. Para hacer esto, debe ir al panel de administración, a la sección para crear copias de seguridad. Cada alojamiento tiene su propio panel de administración, y es difícil decir exactamente dónde el tuyo aloja esta sección. Si no puede resolverlo, escriba al soporte técnico.
Crear una copia de seguridad con complementos
Si su sitio está alojado en una plataforma CMS como, por ejemplo,WordPress, puede guardar una copia de su sitio instalando el complemento wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) o similar. Al configurar correctamente el complemento, recibirá una copia de seguridad del sitio todos los días o todas las semanas, como desee.
Cómo guardar una copia del sitio en su computadora
Puedes guardar el sitio en tu computadora usando un cliente FTP. Si usa el programa FileZilla, cree una carpeta de "Copia de seguridad" en su computadora (el nombre de la carpeta puede ser cualquier cosa). Conéctese al servidor a través de un cliente FTP y simplemente arrastre y suelte para hacer una copia de seguridad completa del sitio en la carpeta "Copia de seguridad".
Además, puede usar el servicio Site2ZIP (archivar el sitio), un programa para descargar WinHTTrack WebSite Copier. ¿Cómo ver la copia guardada del sitio? Para hacer esto, abra la carpeta donde se guardó el sitio y haga clic en el archivo index.html.
Archivo de Internet
En San Farncisco, en 1996, Brewster Cale fundó Internet Archive, una organización sin fines de lucro. Recopila copias de todas las páginas web, grabaciones de audio y video, archivos gráficos y programas. Los archivos del material recopilado se almacenan aquí durante mucho tiempo y hay acceso gratuito a sus bases de datos para todos.
Si se pregunta cómo abrir una copia guardada de un sitio, vaya a archive.org/web/ e ingrese la dirección del sitio o página en el campo correspondiente. A fines de 2012, Internet Archive tenía 10 petabytes, ¡eso es 10,000 terabytes! Y a mediados de 2016 había acumulado 502 mil millones de copias.páginas web.
Almacenamiento en caché del sitio por motores de búsqueda
Una copia guardada del sitio de Google no es más que un caché de las páginas del sitio creadas por el motor de búsqueda. Cualquier usuario puede utilizar una copia de la página para sus necesidades en cualquier momento. Almacenarlos en los servidores de los motores de búsqueda requiere muchos recursos, y se asigna mucho dinero para esto, pero esa ayuda se paga sola, ya que todavía vamos a los motores de búsqueda. Es cierto que este método solo es adecuado para sitios existentes o para aquellos que se han eliminado recientemente. Si esto sucedió hace mucho tiempo, entonces el motor de búsqueda borra los datos.
Motor de búsqueda especializado
Además de que puede buscar manualmente páginas almacenadas en caché en Google o Yandex, puede utilizar el motor de búsqueda especializado cachedview.com. Tiene un análogo: cachedpages.com.
Si desea guardar una copia del sitio o de su página individual, puede hacerlo usted mismo y de forma gratuita en archive.is. Además, también existe una búsqueda global de versiones que el usuario haya guardado alguna vez.
Creación de un archivo web en bibliotecas nacionales
Hoy las bibliotecas nacionales se enfrentan a la tarea de crear archivos de documentos de Internet que forman parte del patrimonio científico, cultural e histórico de la humanidad. Pero esto es muy problemático.
Los estudios han demostrado que la cantidad de documentos web en la Web está creciendo exponencialmente y, en promedio, un documento vivede uno a cuatro meses. Es más conveniente utilizar un sitio web como unidad de cuenta para un archivo de documentos web. El proceso de creación de un fondo consiste en crear una copia o "espejo" del sitio. Dado que la información que contiene cambia con el tiempo, la biblioteca necesita crear réplicas del mismo sitio web a intervalos regulares.
Por lo tanto, hay 60.000 sitios web en Suecia, que es 20 veces el número de publicaciones impresas tradicionales. Las copias de documentos impresos en la biblioteca de Suecia ocupan 1,7 km de estantes por año. ¡Un archivo web llenaría 25 km de estantes! Ahora su archivo contiene 138 millones de archivos con un peso total de 4,5 gigabytes.
Internet crece cada día. Hay muchas empresas y sitios que se encargan de mantener copias de las páginas web en sus archivos. Pero no confíes solo en ellos. Realice copias de seguridad oportunas y nunca perderá su sitio.