El poder de las relaciones entre los datos
- Por Werner Vogels, CTO, Amazon.com
¿Has recibido alguna vez una llamada de tu banco porque sospechaban acerca de actividad fraudulenta? La mayoría de los bancos pueden identificar automáticamente los casos en que los patrones o lugares de ejecución de los gastos difieren de los habituales, incluso antes de que las víctimas se den cuenta de que algo no va bien. Como resultado, el efecto de la suplantación de identidad en la cuenta bancaria y en la vida de una persona puede gestionarse antes de que sea tan siquiera un problema.
Tabla de Contenidos
Tener un profundo conocimiento de las relaciones entre tus datos es así de poderoso. Piensa en las relaciones entre las enfermedades y las interacciones genómicas. Al entender estas conexiones, se pueden buscar patrones en las vías de proteínas para identificar otros genes que puedan estar vinculados a una enfermedad. Este tipo de información podría ayudar a realizar avances en la investigación de enfermedades.
Cuanto más entendamos las relaciones, más potentes serán las percepciones. Con suficientes puntos de datos de relación, incluso pueden hacerse predicciones a futuro (como con un motor de recomendación). Pero a medida que se conectan más datos, y el tamaño y la complejidad de los datos conectados aumenta, las relaciones se tornan más complicadas de almacenar y consultar.
Últimamente, venimos hablando mucho sobre el desarrollo de aplicaciones modernas y el valor de separar las bases de datos monolíticas polivalentes en bases de datos específicas. Las bases de datos estructuradas específicas soportan diversos modelos de datos y permiten a los clientes elaborar aplicaciones distribuidas, orientadas a usos específicos y muy adaptables. Navegar por las relaciones entre los datos es un ejemplo perfecto de por qué es importante contar con la herramienta adecuada para un trabajo. Y una base de datos gráficos es la herramienta perfecta para procesar datos con un elevado grado de conexión.
Modelos de datos gráficos
En un modelo de datos gráficos, las relaciones son una parte fundamental del modelo de datos, lo que implica que se puede establecer directamente una relación en lugar de utilizar claves externas o unir tablas. Los datos se modelan como nodos (vértices) y enlaces (bordes). Dicho de otro modo, no se pone el foco en los datos en sí mismos sino en cómo se relacionan entre sí. Los gráficos son una opción natural para desarrollar aplicaciones que procesan relaciones porque se pueden representar y cruzar las relaciones entre los datos con mayor facilidad. Los nodos suelen ser una persona, un lugar o una cosa, y los vínculos son la forma en que todos ellos están conectados.
Aplicaciones que procesan relaciones
Un gráfico es una buena opción cuando se han de establecer relaciones entre los datos y consultarlas rápidamente. Un buen ejemplo de caso práctico es el gráfico de conocimientos. A continuación, encontrarás algunos más:
Redes sociales
Las aplicaciones de redes sociales poseen grandes conjuntos de perfiles de usuarios e interacciones que rastrear. Por ejemplo, podrías estar construyendo un hilo de redes sociales en tu aplicación. Utiliza un gráfico para facilitar resultados que prioricen mostrar a los usuarios las últimas actualizaciones de sus familiares, de amigos cuyas actualizaciones tienen «Me gusta» y de los amigos que viven cerca de ellos.
Motores de recomendación
Los motores de recomendación almacenan las relaciones entre la información, como los intereses de los clientes, los amigos y el historial de compras. Con un gráfico, puedes consultarlo rápidamente para efectuar recomendaciones personalizadas y relevantes a tus usuarios.
Detección de fraudes
Si estás desarrollando una aplicación para detectar casos de fraude en distribución, un gráfico te ayuda a elaborar consultas para detectar fácilmente los patrones de relación. Un ejemplo podría ser que varias personas se asocien a una dirección de correo electrónico personal, o que varias personas compartan la misma dirección IP pero residan en diferentes direcciones físicas.
Los desafíos de almacenar un gráfico
Los gráficos pueden almacenarse de muchas maneras diferentes: una base de datos de relaciones, un espacio de valores clave o una base de datos gráficos. Mucha gente empieza a usar gráficos con un prototipo a pequeña escala. Esto suele comenzar bien, pero se complica a medida que la escala de datos aumenta.
Las bases de datos gráficos están construidas con el objetivo de almacenar gráficos y permitir que los datos de los nodos estén directamente vinculados y que las relaciones puedan consultarse directamente. Esto facilita la creación de nuevas relaciones sin la desnormalización de los datos y, a los desarrolladores, la actualización de sus modelos de datos para las aplicaciones que deben consultar datos con un elevado grado de conexión. Mejora drásticamente el rendimiento de las consultas para navegar por las relaciones entre datos.
Una base de datos gráficos con una finalidad específica
El año pasado, AWS lanzó Amazon Neptune una base de datos gráfica rápida, fiable y específica, optimizada para procesar las relaciones entre datos altamente conectados.
Más tarde anunciamos el Amazon Neptune Workbench para crear un cuaderno de notas Jupyter, una aplicación web de código abierto que permite generar y compartir documentos que contienen códigos, ecuaciones, visualizaciones y texto narrativo en vivo, desde la Consola de gestión de AWS.
Ha sido fascinante ver cómo nuestros clientes utilizan Neptune. Esperábamos que construyeran soluciones en redes sociales, de detección de fraudes y de tipo recomendación a través de Neptune, y clientes como Nike, Activision y NBC Universal están en fase de producción con estas aplicaciones en Neptune hoy en día.
Sin embargo, sucede algo muy interesante cuando facilitamos a los desarrolladores herramientas de alto rendimiento y especializadas para un trabajo concreto: empiezan a encontrar posibilidades nuevas y emocionantes. Thomson Reuters está utilizando el gráfico para entender los complejos modelos regulatorios. Netflix ha mejorado la fiabilidad de la infraestructura de datos utilizando un sistema basado en gráficos para construir y escalar el linaje de datos.
Reunir los componentes
Las innovadoras formas en que nuestros clientes utilizan Neptune son excelentes ejemplos de lo que ocurre cuando los desarrolladores tienen la herramienta adecuada para llevar a cabo un trabajo. La razón por la que AWS cuenta con las mayores bases de datos específicas de cualquier proveedor de servicios en la nube es para que los clientes tengan más opciones y libertad. Además de los gráficos, puede que tengas otros conjuntos de datos que funcionen mejor en otro tipo de bases de datos, como relacionales, de series temporales o en memoria. Eso también vale; se trata del desarrollo de aplicaciones modernas.
Por ejemplo, Neptune forma parte del conjunto de herramientas que usamos para expandir continuamente el gráfico de conocimientos de Alexa para decenas de millones de clientes. Alexa también utiliza otras bases de datos, como Amazon DynamiDB para datos documentales y Amazon Aurora para datos relacionales. Los diferentes tipos de datos conllevan desafíos distintos, y la elección de la base de datos adecuada para cada caso práctico específico posibilita mayor velocidad y flexibilidad.
Para los datos altamente conectados, una base de datos gráficos facilita la comprensión de las relaciones entre tus datos para obtener nuevas percepciones. Al utilizar un modelo de datos gráfico, los desarrolladores pueden crear rápidamente aplicaciones que deben consultar datos altamente conectados. Y una base de datos gráficos específica mejora drásticamente el rendimiento de las consultas para navegar entre las relaciones.
El poder de las relaciones entre los datos https://t.co/jpBE0yHAMn https://t.co/zY0vGGNg35
El poder de las relaciones entre los datos https://t.co/PuFX8dLQxq https://t.co/NM4zr9cvvt
El poder de las relaciones entre los datos https://t.co/i43qnmT2JJ https://t.co/Kk8La4v5RQ
El poder de las relaciones entre los datos: Por Werner Vogels, CTO, https://t.co/jiQvB8Bqj6 ¿Has recibido alguna ve… https://t.co/G3mPxD883N
El poder de las relaciones entre los datos https://t.co/J7iHkkaHZa
El poder de las relaciones entre los datos @revistacloud https://t.co/OeOUQGS96E