Las diez bases de datos más grandes del mundo

En www.elmodem.com/ publicaron la traducción de interesante artículo de Business Intelligence Lowdown:

Las bases de datos más grandes del mundo


Estas son las 10 bases de datos más grandes del mundo. Increíble que se pueda almacenar tanta información:

10. Biblioteca del Congreso de EEUU. Esta biblioteca almacena cosas tan variadas como libros de cocina, tarjetas de beisbol o periódicos de la época colonial. La base de datos incluye el catálogo y material digitalizado. Lamentablemente no hay planes de digitalizar todos los ítemes, pero se puede acceder a gran cantidad de ellos. Link.

Cifras:

* 130 millones de ítemes (libro, fotografías, mapas)
* 29 millones de libros.
* 10 mil nuevos ítemes agregados cada día.
* 530 millas de estanterías.
* 5 millones de documentos digitales.
* 20 terabytes de texto.

9. Agencia Central de Inteligencia de EEUU (CIA). Encargada de recolectar información sobre personas, cosas y lugares. No se sabe mucho sobre esta base de datos, pero hay algunas partes a las que el público común puede acceder, como la Sala de Lectura de la FOIA (Free Of Information Act)

Cifras:

* 100 artículos añadidos cada mes a la FOIA.
* Estadísitcas amplias de más de 250 países y entidades.

8. Amazon. Amazon es la tienda más grande del mundo. Empezaron vendiendo libros y ahora se puede encontrar hasta llantas para autos. Su base de datos incluye información personal (direcciones, tarjetas de crédito, etc.) de más de 59 millones de clientes, recetas, listas compras, y páginas que los clientes pueden revisar de más de 250 mil libros. Además almacena millones de ítemes de su inventario y del inventario de sus tiendas asociadas.

Cifras:

* 59 millones de clientes activos.
* Más de 42 terabytes de datos.

7. YouTube. En menos de dos años, YouTube ha conseguido tener la biblioteca de video más grande del mundo (lo que lleva a tener una de las bases de datos más grandes del mundo). Actualmente sus visitantes ven más de 100 millones de videos diariamente. Se calcula que si cada video subido tiene en promedio unos 10 MB, mensualmente su base de datos crece unos 18.6 TB (ya que diariamente se suben unos 65 mil videos).

Cifras:

* 100 millones de videos vistos diariamente.
* 65 mil videos agregados diariamente.
* Más de 45 terabytes de videos.

6. ChoicePoint. El negocio de ChoicePoint es recolectar información sobre la población de EEUU (direcciones, números telefónicos, historial de manejo, antecedentes criminales, datos de ADN, etc. La mayor parte de su información la vende al gobierno de EEUU y a grandes corporaciones (todo regulado por la ley federal). Imagínense un directorio telefónico de mil millones de páginas, eso es ChoicePoint. Cuando un empleado de ChoicePoint quiere saber algo acerca de algún estadounidense, simplemente tiene que buscar el número telefónico. Un dato: en el 2001 ChoicePoint ayudó a identificar víctimas del World Trade Center cruzando información del ADN de fragmentos de hueso encontrados, datos proporcionados por los familiares e información que se encontraban en su base de datos.

Cifras:

* 250 terabytes de datos personales.
* Información de 250 millones de personas.

5. Sprint. Sprint es una de las compañías de telecomunicaciones más grandes del mundo (tiene unos 53 millones de clientes). Las grandes compañías de telecomunicaciones se caracterizan por tener inmensas bases de datos para poder llevar el control de las llamadas que se hacen desde y hacia su red.

Cifras:

* 2.85 billones de filas en su base de datos.
* 365 millones de detalles de llamadas procesados diariamente.
* 70 mil inserciones de detalles de llamadas por segundo en sus horas pico.

4. Google. No se sabe mucho sobre el verdadero tamaño de la base de datos de Google (guarda celosamente esta información). Pero se sabe bastante sobre las cifras que maneja. Aproximadamente recibe unos 91 millones de consultas al día, y Google almacena absolutamente todas las consultas que sus usuarios realizan. En todos estos años, eso debe de dar como resultado unos 33 billones de entradas en la base de datos. Dependiendo de su arquitectura, esto puede significar cientos de terabytes de información. A eso hay que sumarle la información guardada de cada usuario (por las cookies), Google Video, YouTube (que fue comprado por Google), Gmail, la publicidad (Ad Sense) y más.

Cifras:

* 91 millones de consultas diarias.
* Maneja el 50% de las búsquedas por internet.
* Perfiles virtuales de un numero gigantesco de usuarios.

3. AT&T. Es también una de las compañías de telecomunicaciones del mundo, tal como Sprint, pero es la más antigua de EEUU. AT&T almacena datos sobre el número marcado, la duración de la llamada, facturación, etc. Almacenan datos de llamadas realizadas hace décadas.

Cifras:

* 323 terabytes de información.
* 1.9 billones de registros de llamadas.

2. El National Energy Research Scientific Computing Center. El NERSC es manejado en parte por el Departamento de Energía de EEUU. Almacena información sobre investigación en energía atómica, experimentos de física de alta energía, simulaciones de incios del universo y más. Las supercomputadoras con las que cuenta son simplemente alucinantes: sistema distribuido IBM de 6,80 procesadores y cosas así. Su base de datos tiene 2.8 Petabytes (1 petabyte es 1024 terabytes) y 53 millones de filas.

Cifras:

* 2.8 Petabytes de data.
* Capacidad de crecimiento a 22 PB.
* Transfiere en promedio más de 100 Megabytes por segundo, 24 horas al día. Llegando a picos de450 MB/s.
* Operado por 2 mil científicos de la computación.

1. Centro Mundial de Datos para el Clima. La base de datos del World Data Centre for Climate es la más grande del mundo. Realiza una extensa investigación científica sobre el clima, modelamiento y predicción de fenómenos climatológicos a nivel mundial. Se puede acceder vía internet.

Cifras:

* 220 terabytes de data en la web.
* 6 petabytes de data adicional.

No hay comentarios.:

Publicar un comentario