martes, 28 de junio de 2016

Big Data (Datos masivos)

Big Data o Datos masivos es un término que hace referencia a una cantidad de datos tal que supera la capacidad del software convencional para ser capturados, administrados y procesados en un tiempo razonable. El volumen de los datos masivos crece constantemente. Además del gran volumen de información, esta existe en una gran variedad de datos que pueden ser representados de diversas maneras en todo el mundo, por ejemplo de dispositivos móviles, audio, video, sistemas GPS, incontables sensores digitales en equipos industriales, automóviles, medidores eléctricos, veletas, anemómetros, etc., los cuales pueden medir y comunicar el posicionamiento, movimiento, vibración, temperatura,
humedad y hasta los cambios químicos que sufre el aire, de tal forma que las aplicaciones que analizan estos datos requieren que la velocidad de respuesta sea lo demasiado rápida para lograr obtener la información correcta en el momento preciso. Estas son las características principales de una oportunidad para Big Data. 
Es importante entender que las bases de datos convencionales son una parte importante y relevante para una solución analítica. De hecho, se vuelve mucho más vital cuando se usa en conjunto con la plataforma de Big Data. Pensemos en nuestras manos izquierda y derecha, cada una ofrece fortalezas individuales para cada tarea en específico. Por ejemplo, un beisbolista sabe que una de sus manos es mejor para lanzar la pelota y la otra para atraparla; puede ser que cada mano intente hacer la actividad de la otra, mas sin embargo, el resultado no será el más óptimo.

¿Qué tipos de datos debo explorar?
Muchas organizaciones se enfrentan a la pregunta sobre ¿qué información es la que se debe analizar?, sin embargo, el cuestionamiento debería estar enfocado hacia ¿qué problema es el que se está tratando de resolver?. Si bien sabemos que existe una amplia variedad de tipos de datos a analizar, una buena clasificación nos ayudaría a entender mejor su representación, aunque es muy probable que estas categorías puedan extenderse con el avance tecnológico.
  1. Web and Social Media: Incluye contenido web e información que es obtenida de las redes sociales como Facebook, Twitter, LinkedIn, blogs, etc.
  2. Machine-to-Machine (M2M): se refiere a las tecnologías que permiten conectarse a otros dispositivos. M2M utiliza dispositivos como sensores o medidores que capturan algún evento en particular (velocidad, temperatura, presión, variables meteorológicas, variables químicas como: la salinidad, etc.) los cuales transmiten a través de redes alámbricas, inalámbricas o híbridas a otras aplicaciones que traducen estos eventos en información significativa.
  3. Big Transaction Data: Incluye registros de facturación, en telecomunicaciones registros detallados de las llamadas (CDR), etc. Estos datos transaccionales están disponibles en formatos tanto semi estructurados como no estructurados.
  4. Biometrics: Información biométrica en la que se incluye huellas digitales, escaneo de la retina, reconocimiento facial, genética, etc. En el área de seguridad e inteligencia, los datos biométricos han sido información importante para las agencias de investigación.
  5. Human Generated: Las personas generamos diversas cantidades de datos como la información que guarda un ''call center'' al establecer una llamada telefónica, notas de voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.

Georreferenciación

Es la técnica de posicionamiento espacial de una entidad en una localización geográfica única y bien definida en un sistema de coordenadas y datum específicos (se aplica en varias áreas de estudio y trabajo específicamente cuando se hace una relación hacia alguna geometría de referencia importante, sea esta una línea, un plano o una superficie). Se emplea habitualmente dentro de los Sistemas de Información Geográfica, tanto para objetos ráster como para objetos vectoriales.

La correcta descripción de la ubicación y la forma de entidades requiere un marco para definir ubicaciones del mundo real. Un sistema de coordenadas geográficas se utiliza para asignar ubicaciones geográficas a los objetos. Un sistema de coordenadas de latitud-longitud global es uno de esos marcos. Otro marco es un sistema de coordenadas cartesianas o planas que surge a partir del marco global.

Latitud y Longitud:
Un método para describir la posición de una ubicación geográfica en la superficie de la Tierra consiste en utilizar mediciones esféricas de latitud y longitud. Estas son mediciones de los ángulos (en grados) desde el centro de la Tierra hasta un punto en su superficie. Este tipo de sistema de referencia de coordenadas generalmente se denomina sistema de coordenadas geográficas.


La longitud mide ángulos en una dirección este-oeste. Las mediciones de longitud comúnmente se basan en el meridiano de Greenwich, que es una línea imaginaria que realiza un recorrido desde el Polo Norte, a través de Greenwich, Inglaterra, hasta el Polo Sur. Este ángulo es de longitud 0. El oeste del meridiano de Greenwich por lo general se registra como longitud negativa y el este, como longitud positiva.

Si bien la longitud y la latitud se pueden ubicar en posiciones exactas de la superficie de la Tierra, no proporcionan unidades de medición uniformes de longitud y distancia. Sólo a lo largo del ecuador la distancia que representa un grado de longitud se aproxima a la distancia que representa un grado de latitud. Esto se debe a que el ecuador es la única línea paralela que es tan extensa como el meridiano. Los círculos con el mismo radio que la Tierra esférica se denominan círculos grandes. El ecuador y todos los meridianos conforman círculos grandes.
Por encima y por debajo del ecuador, los círculos que definen las líneas paralelas de latitud se vuelven gradualmente más pequeños hasta que se convierten en un solo punto en los Polos Norte y Sur donde convergen los meridianos. Mientras los meridianos convergen hacia los polos, la distancia que representa un grado de longitud disminuye a cero.

Sistemas de Información Geográfica

¿Qué es un SIG?


Es una integración organizada de hardware, software y El SIG funciona como una base de datos con información geográfica (datos alfanuméricos) que se encuentra asociada por un identificador común a los objetos gráficos de un mapa digital. De esta forma, señalando un objeto se conocen sus atributos e, inversamente, preguntando por un registro de la base de datos se puede saber su localización en la cartografía.

La razón fundamental para utilizar un SIG es la gestión de información espacial. El sistema permite separar la información en diferentes capas temáticas y las almacena independientemente, permitiendo trabajar con ellas de manera rápida y sencilla, y facilitando al profesional la posibilidad de relacionar la información existente a través de la topología de los objetos, con el fin de generar otra nueva que no podríamos obtener de otra forma.

Las principales cuestiones que puede resolver un Sistema de Información Geográfica, ordenadas de menor a mayor complejidad, son:
  1. Localización: preguntar por las características de un lugar concreto.
  2. Condición: el cumplimiento o no de unas condiciones impuestas al sistema.
  3. Tendencia: comparación entre situaciones temporales o espaciales distintas de alguna característica.
  4. Rutas: cálculo de rutas óptimas entre dos o más puntos.
  5. Pautas: detección de pautas espaciales.
  6. Modelos: generación de modelos a partir de fenómenos o actuaciones simuladas.

Por ser tan versátiles, el campo de aplicación de los Sistemas de Información Geográfica es muy amplio, pudiendo utilizarse en la mayoría de las actividades con un componente espacial. La profunda revolución que han provocado las nuevas tecnologías ha incidido de manera decisiva en su evolución.datos geográficos diseñada para capturar, almacenar, manipular, analizar y desplegar en todas sus formas la información geográficamente referenciada con el fin de resolver problemas complejos de planificación y de gestión.

Creación de datos:

Las modernas tecnologías SIG trabajan con información digital, para la cual existen varios métodos utilizados en la creación de datos digitales. El método más utilizado es la digitalización, donde a partir de un mapa impreso o con información tomada en campo se transfiere a un medio digital por el empleo de un programa de Diseño Asistido por Ordenador (DAO o CAD) con capacidades de georreferenciación.

Dada la amplia disponibilidad de imágenes orto-rectificadas (tanto de satélite y como aéreas), la digitalización por esta vía se está convirtiendo en la principal fuente de extracción de datos geográficos. Esta forma de digitalización implica la búsqueda de datos geográficos directamente en las imágenes aéreas en lugar del método tradicional de la localización de formas geográficas sobre un tablero de digitalización.

La representación de los datos:



Los datos SIG representan los objetos del mundo real (carreteras, el uso del suelo, altitudes, etc). Los objetos del mundo real se pueden dividir en dos conceptos: objetos discretos (una casa) y continuos (cantidad de lluvia caída, una elevación). Existen dos formas de almacenar los datos en un SIG: raster y vectorial.

Los SIG que se centran en el manejo de datos en formato vectorial son más populares en el mercado. No obstante, los SIG raster son muy utilizados en estudios que requieran la generación de capas continuas, necesarias en fenómenos no discretos; también en estudios medioambientales donde no se requiere una excesiva precisión espacial (contaminación atmosférica, distribución de temperaturas, localización de especies marinas, análisis geológicos, etc).



Teoría de Errores

El objetivo de la Teoría de Errores es identificar las diversas fuentes que generan error en la medición y así determinar el verdadero valor de las magnitudes físicas medidas de forma directa e indirecta; este se define como la diferencia entre el valor medido y el valor verdadero. Una medida nunca puede ser exacta, es decir, siempre cometemos un error, por lo que nuestra medida no será completa sin la estimación del error cometido.
Los errores pueden ser producidos, por la imprecisión de los aparatos de medida, llamado errores sistemáticos, o causa de agentes externos o del propio ejecutante, llamado errores accidentales. Mientras que en el primer caso de error, se repiten en el mismo sentido, siempre y cuando se utilice el mismo aparato de medida, el segundo caso varía tanto el valor como el signo, también dependerá de la experiencia del trabajador. Debido a la existencia de errores es imposible conocer el valor real de la magnitud a medir. Si somos cuidadosos podemos controlar los errores sistemáticos y en cuanto a los errores accidentales podemos reducirlos si tomamos un conjunto de medidas y calculamos su valor medio.
Clases de errores:

  • Error Absoluto: diferencia que tenemos entre el valor obtenido y el verdadero. Así llamamos x a la medición y X al valor absoluto, el error absoluto será: 
Ea = x - X
  • Error Relativo: definido por el cociente entre el valor absoluto y el valor real, dado por la fórmula:
Er = Ea/X

Disciplinas de la Geomática

Como mencionaba anteriormente, la Geomática es un término que abarca disciplinas base. Es reconocida y cada vez más utilizada, ya que, por figurar en las normas de estandarización ISO, cada país ha ido adaptándose a ella y cada uno presentó una respuesta diferente.

Estas son:

  • Fotogrametría: podemos medir sobre fotografías y así obtener la geometría del objeto, es decir, información bidimensional, ya sea a corta o larga distancia. Es la técnica de medición de coordenadas en 3D, también llamada captura de movimiento, ya que si se trabaja con dos fotografías obtendremos dicha información.


Cartografía: esta ciencia se encarga de reunir y analizar medidas y datos de regiones para realizar una representación plana de la tierra y graficar a escalas reducidas. Es de gran utilidad para la ubicación geográfica y espacial del ser humano. La cartografía trabaja sobre la representación plana de la Tierra que facilita su exhibición completa y que permite poner sobre una misma superficie todos los continentes, mares y océanos. 



  • Percepción Remota: nos ayuda a desarrollar información a pequeña y gran escala, ya sea utilizando instrumentos de grabación o de escaneo de tiempo real inalámbricos o que no están en contacto real con el objeto (ejemplo: aviones, satélites, astronave, boyas o barcos), esta ciencia pone en práctica la tecnología de sensores para recoger información de un área en concreto, a través de imágenes, haciendo posible tener acceso a áreas peligrosas o inaccesibles.



Geodesia: una de las ciencias de la Tierra y una ingeniería, de suma importancia; trata del levantamiento y de la representación de la forma y superficie de la Tierra, global y parcial, con sus formas naturales y artificiales. La geodesia proporciona, con sus teorías y resultados de mediciones y cálculos, la referencia geométrica para las demás geociencias, como también para la Geomática, los Sistemas de Información Geográfica (SIG), el Catastro, la planificación, la construcción, Urbanización, navegación aérea, marina y terrestre e incluso para aplicaciones militares y programas espaciales.

La Geodesia se divide en dos partes:
  1. Geodesia superior: determina y representa la figura de la tierra en términos globales y consta de dos subdivisiones; la geodesia física y Geodesia matemática.
  2. Geodesia inferior: también llamada topografía, levanta y representa partes menores de la tierra, donde, la superficie puede ser considerada plana. Aquí, esta división trabaja junto a ciencias auxiliares como la cartografía, fotogrametría, cálculo de compensación y de la Teoría de Errores de observación.

  • Topografía: estudia el conjunto de principios y procedimientos que tienen por objetivo, la representación gráfica de la superficie terrestre, con sus formas y detalles, ya sea, naturales o artificiales; donde esta representación tiene lugar sobre superficies planas, limitándose a pequeñas extensiones de terreno; su tope es la medición o levantamiento de un país, al acceder este límite, se denomina geodesia. La diferencia es que para la topografía, la Tierra es plana (geométricamente),  mientras que para la geodesia no lo es. La topografía utiliza un sistema de coordenadas tridimensional, siendo X e Y competencia de la planimetría, y la Z, de la altimetría.

¿Qué es la Geomática?


Es un término científico que abarca a un conjunto de ciencias y tecnologías. La GEOMÁTICA se agrupa en dos ramas: ‘’GEO’’ Tierra y ‘’MÁTICA’’ por informática, es decir, estudio o análisis de la superficie terrestre a través de la informática.
Esta nueva ciencia busca integrar la medición, análisis, manejo, almacenamiento y despliegue de descripciones y localización de datos terrestres, conocidos también como datos espaciales.

Algunas disciplinas base incluidas en esta ciencia son:
  1. Cartografía: trazado y estudio de mapas geográficos.
  2. Fotogrametría: obtener mapas y planos de grandes extensiones de terreno por medio de la fotografía aérea.
  3. Sistema de Posicionamiento Global (GPS): ubicación, medición y localización precisa de objetos sobre la superficie de la tierra.
  4. Percepción Remota: recuperación de información cualitativa y cuantitativa y modelado de escenarios a partir de imágenes.
  5. Sistema de Información Geográfica (SIG): diseñada para capturar, analizar, almacenar y desplegar información geográfica, con el fin de resolver problemas de planificación y gestión.

Este término nació en Canadá y ya es parte de las normas de estandarización ISO, y está siendo reconocido por varios países como una nueva disciplina de la era geoespacial.

La Geomática está direccionada a resolver problemas globales y de la comunidad, mejorando así la calidad de vida de las personas. Aplicando los criterios de colección, administración y representación de la data geoespacial se sirve al bien común en diferentes niveles de la sociedad: Estados, gobiernos provinciales, municipalidades, instituciones; a las personas directa e indirectamente. Contar con la información geoespacial completa, al día y en un mismo sistema de referencia es hoy de extrema importancia para la economía y el desarrollo social.

Video: ''Ingeniería Geomática''

Bibliografía: