Big Data vs Open Data

Big Data vs Open Data - Cartografía de él hacia fuera
08 de noviembre de 2013

Siga este sitio en Twitter y suscribirse a cada dos semanas Open Data Ahora Insights
Como he trabajado en mi próximo libro, Open Data Ahora - que será publicado por
McGraw-Hill el 10 de enero - he tenido que pensar y explicar cómo Open Data, Big Data y
Open Government están relacionados entre sí. Últimamente he visto un número de otros,
como los autores del nuevo informe de McKinsey Open Data (ver página 4), tratar de
mapear el territorio de manera similar. La comunidad Open Data está produciendo una gran
cantidad de diagramas de Venn en estos días, con una gran cantidad de círculos que se
superponen colores. (Algunos también se ocupan de la utilización de los datos personales,
pero eso es un círculo demasiado para mí.)
Por mi propia contribución a la discusión, que estoy proponiendo el modelo que se muestra
aquí. Para todos los expertos 'Abrir datos: Por favor, eche un vistazo, comentar, y añadir sus
propias ideas. Estamos en una etapa en la que necesitamos para definir con mayor precisión
lo que estamos hablando. Esto puede ayudar.

Mi punto de partida es la comprensión de la evolución de estas tres áreas. Big Data describe
esencialmente de datos muy grandes, pero eso es un juicio un tanto subjetivo que depende
de la tecnología: los grandes datos de hoy en día puede no parecer tan grande dentro de
unos años, cuando el análisis de datos y la tecnología de la computación mejoran. Gobierno

Abierto es una combinación de ideas: que incluye estrategias de colaboración para incluir a
los ciudadanos en el gobierno; gobierno de la liberación de datos sobre sus propias
operaciones, al igual que los datos de gasto federal; y el gobierno la liberación de los datos
que recoge sobre temas de interés público, como la salud, el medio ambiente, y de
diferentes industrias.
Mientras que otros han producido descripciones reflexivos y completa de los datos
abiertos , algunos se refieren en gran parte a abrir los datos del gobierno , que creo que
como una categoría de Open Data (aunque tal vez el más importante). He descrito Datos no
como datos de acceso público que las personas, las empresas y organizaciones pueden
utilizar para poner en marcha nuevas empresas, analizar patrones y tendencias, tomar
decisiones basadas en datos, y resolver problemas complejos Todas las definiciones de
Datos no incluyen dos características básicas.: los datos deben estar a disposición del
público para que cualquiera lo use, y deben tener una licencia de una manera que permite
su reutilización. Datos no debería ser relativamente fácil de usar, aunque aquí hay
gradaciones de "apertura". Y no hay acuerdo general en que debe ser abierta de datos de
forma gratuita o costar sólo una cantidad mínima.
A partir de estas descripciones básicas, la intersección de estos tres conceptos se definen los
seis subtipos de datos que se muestran en el diagrama. (No hay ninguna categoría separada
para la intersección de grandes volúmenes de datos y Gobierno Abierto -. Nada en esa
categoría también es Open Data) Éstos son ejemplos característicos de cada uno, en

referencia a los números anteriores.
1. Big Data que no es Open Data. Una gran cantidad de datos grande cae en esta
categoría, entre ellos algunos grandes volúmenes de datos que tiene un gran valor
comercial. Todos los datos que sostienen la gran distribución en los hábitos de compra de
los clientes, que los hospitales tienen sobre sus pacientes, o que los bancos mantienen sobre
sus titulares de tarjetas de crédito, cae aquí. Es una información que los datos de los
titulares de propiedad, y pueden utilizar con fines comerciales. los datos de seguridad
nacional, al igual que los datos recogidos por la NSA, es también en esta categoría.
2. El trabajo de gobierno abierto que no está abierta de datos. Esta es la parte del
Gobierno Abierto que se centra exclusivamente en la participación de los ciudadanos. Por
ejemplo, la Casa Blanca ha comenzado un sitio web petición, llamada Nosotros, el Pueblo ,
de abrirse a la participación de los ciudadanos. Mientras que el sitio hace que sus datos
disponibles, la publicación abierta de datos - más allá del número de firmas - no es su
principal objetivo.
3. grande, abierto, de datos no gubernamental. Aquí nos encontramos con proyectos de
ciencia de intercambio de datos y ciudadanos científicos como Zooniverse . Grandes datos
de observaciones astronómicas, desde grandes proyectos biomédicos como el Proyecto
Genoma Humano, o de otras fuentes se da cuenta de su mayor valor a través de un enfoque

abierto y compartido. Si bien algunas de estas investigaciones puede ser financiada por el

gobierno, no es "datos del Gobierno" porque no se llevó a cabo por lo general, mantiene, o
analizada por los organismos gubernamentales. Esta categoría también incluye un tipo muy
diferente de Open Data: los datos que pueden ser analizados desde Twitter y otras formas
de medios de comunicación social.
4. Los datos de Gobierno Abierto que no es Big Data. Los datos del gobierno no tiene
por qué ser grandes volúmenes de datos a ser valiosa. Modestas cantidades de datos de
estados, ciudades , y el gobierno federal pueden tener un impacto importante cuando salga
al mercado. Este tipo de combustibles de datos del movimiento de presupuesto
participativo, donde las ciudades de todo el mundo invitan a sus residentes a mirar el
presupuesto de la ciudad y ayudar a decidir cómo gastarlo. Es también el combustible para
aplicaciones que ayudan a las personas utilizan servicios de la ciudad como los autobuses
públicos o clínicas de salud.
5. Datos no -. No es grande, no del Gobierno Esto incluye los datos del sector privado
que las empresas optan por compartir para sus propios fines - por ejemplo, para satisfacer a
sus potenciales inversores o para mejorar su reputación. Ambientales, sociales y de
gobierno (ESG) métricas caen aquí. Además, los datos de reputación, como los datos de
quejas de los consumidores , es de gran importancia para los negocios y cae en esta
categoría.
6. grande, abierto, datos del sector público (la trifecta). Estos conjuntos de datos pueden
tener el mayor impacto de cualquier categoría. Las agencias gubernamentales tienen la

capacidad y los fondos para recopilar grandes cantidades de datos, y hacer que dichas bases
de datos abierta puede tener importantes beneficios económicos. los datos nacionales de
datos tiempo y GPS son los ejemplos más citados con frecuencia. Los datos del censo de
Estados Unidos, y los datos recogidos por la Comisión de Valores y el Departamento de
Salud y Servicios Humanos, son otros. Con la nueva política de datos abiertos , esta
categoría es probable que ser más grande, más robusto, y aún más significativa.
El mapa está todavía en evolución, pero esto es un comienzo. Vamos a la discusión en
marcha. Quedo al pendiente de tus pensamientos.
- Joel Gurin, fundador y editor, OpenDataNow.com