Wayback Machine para niños
Datos para niños Wayback Machine |
||
---|---|---|
Información general | ||
Dominio | https://web.archive.org | |
Tipo | Archivo | |
Comercial | No | |
Registro | No | |
Idiomas disponibles | Inglés | |
En español | No | |
Estado actual | en línea | |
Gestión | ||
Desarrollador | Brewster Kahle Bruce Gilliat |
|
Propietario | Internet Archive | |
Operador | Internet Archive | |
Lanzamiento | 1996 | |
Estadísticas | ||
Ranking Alexa | 211 (19 de enero de 2021) | |
Wayback Machine (pronunciado [ˈwejbak maˈʃin]) es un servicio y una base de datos que contiene copias de una gran cantidad de páginas o sitios de Internet. Como consecuencia de este proyecto, también se puede consultar la historia o modificaciones de las páginas a través del tiempo.
Características
El servicio Wayback Machine funciona de una manera simple: basta teclear la dirección (URL) de una página web para ver cuál es la última copia que hay guardada en el archivo. Si queremos ver cómo era hace un tiempo una página en cuestión, entonces Wayback Machine nos pedirá en qué fecha y año queremos visitar la página. Existe un calendario en la parte superior de la pantalla, que permite ver gráficamente las capturas a lo largo del tiempo. La longitud de las barras del gráfico indica en qué meses se hicieron más copias.
Lo que hace este sitio para almacenar todo el contenido de la página web es muy simple pero ingenioso: almacena solo el contenido html del código fuente y no guarda las imágenes sino solo el código; por eso, cuando un servidor de imágenes elimina alguna imagen del sitio web original, esta no es reproducida, sino que se marca como un error 404. En 2012 contenía 10 petabytes de información y crecía en torno a 20 terabytes por mes, en octubre de 2019 su almacenamiento sobrepasó los 20 petabytes. En diciembre de 2020 su almacenamiento superó los 70 petabytes.
Sin embargo Wayback Machine está lejos de ser una copia completa de internet pues varios sitios evitan su indexación y grabación de información, como por ejemplo usando el archivo robots.txt con: User-agent: ia_archiver Disallow: /
Wayback CDX Server API
Desde noviembre de 2015 Wayback Machine cuenta con un servicio de indización de capturas de páginas que permite, rápidamente, conocer el historial de grabado para cada URL tanto en formato propio como en formato JSON. Dicho servicio es un proyecto en fase beta denominado Wayback CDX Server API y cuyo código fuente y manual de uso está alojado en GitHub.
Incidencias
A lo largo de su historia la Wayback Machine, ha presentado una serie de incidencias, de las cuales las más importantes han sido las siguientes:
- En enero de 2017 desarrollaron un complemento, tanto para el navegador Chromium como Google Chrome, que permite guardar la página web que se está visualizando, buscar si esa página ha sido guardada anteriormente en la Wayback Machine e incluso permite hacer una búsqueda rápida en Twitter, entre otras funcionalidades. El complemento está debidamente catalogado en la Chrome Web Store.
- En octubre de 2020, el sitio Wayback dejó de funcionar.
Véase también
En inglés: Wayback Machine Facts for Kids