Dependiendo de la industria, se estima que cada organización hoy en día posee entre uno y 12 millones de gigabytes de datos. Además, la mayoría de estos datos (entre el 80-90%) no están estructurados o se encuentran mal organizados en una red de correos electrónicos, documentos en papel, unidades de red, entre otros.