Comunicando microservicios con Apache Kafka

13 enero, 2021

1,421

Comunicando microservicios con Apache Kafka

Por Víctor Manuel Valle, Desarrollador Backend J2EE en Paradigma Digital.

En los últimos años el número de aplicaciones a desarrollar por las empresas ha aumentado considerablemente con la llegada de las arquitecturas basadas en microservicios. Uno de los aspectos más relevantes es la comunicación entre ellos, o la necesidad de tener que integrarse con otros sistemas enviando o recibiendo información. En estos casos, estas comunicaciones deberán ser rápidas, seguras y fiables con una alta disponibilidad.

Una de las soluciones para solventar este tipo de casos han supuesto el uso de tecnologías basadas en colas de mensajes, las cuales permiten la comunicación asíncrona, lo que significa que los puntos de conexión que producen y consumen los mensajes interactúan con la cola, no entre sí.

Además, ayudan a simplificar de forma significativa la escritura de código para aplicaciones desacopladas, mejorando el rendimiento, la fiabilidad y la escalabilidad.

A la hora de utilizar un sistema de colas de mensajes, se ha hecho muy popular el uso de ActiveMQ y RabbitMQ. Sin embargo, a la hora de enfrentarnos a sistemas que requieren la transmisión de datos a tiempo real encontramos Apache Kafka como una de nuestras mejores soluciones.

Tabla de Contenidos

¿Qué es Apache Kafka?

Apache Kafka es un sistema de transmisión de datos distribuido con capacidad de escalado horizontal y tolerante a fallos. Gracias a su alto rendimiento nos permite transmitir datos en tiempo real utilizando el patrón de mensajería publish/subscribe.

Kafka fue creado por LinkedIn y actualmente es un proyecto open source mantenido por Confluent, empresa que está bajo la administración de Apache. Sus principales funcionalidades son:

Publicar y suscribirse a flujos de datos (streams), actuando de forma similar a un sistema de colas de mensajes pero con un alto rendimiento obteniendo latencias muy bajas en la transmisión de mensajes. Nos ofrece la posibilidad de dividir el procesamiento de datos en múltiples instancias de consumidores, lo que le permite escalar su procesamiento.
Permite almacenar streams y se replican para ofrecer una tolerancia a fallos. Kafka permite a los productores esperar el reconocimiento para que una escritura no se considere completa hasta que esté completamente replicada y se garantice que persiste.
Facilita el procesamiento de streams en tiempo real, pudiendo transformar los datos que se almacenan en Kafka.

Desde Apache recomiendan el uso de Kafka generalmente en dos tipos de aplicaciones:

En sistemas o aplicaciones que requieren una transmisión de streams entre ellas de manera fiable.
En sistemas de procesamiento a tiempo real que transforman o reaccionan a los streams.

Estructura

Topics, mensajes y particiones

Un topic es un flujo de datos sobre un tema en particular. Podemos crear tantos topics como queramos y estos serán identificados por su nombre. Los topics pueden dividirse en particiones en el momento de su creación.

Cada elemento que se almacena en un topic se denomina mensaje. Los mensajes son inmutables y son añadidos a una partición determinada (específica definida por la clave del mensaje o mediante round-robin en el caso de ser nula) en el orden el que fueron enviados, es decir, se garantiza el orden dentro de una partición pero no entre ellas.

Cada mensaje dentro de una partición tiene un identificador numérico incremental llamado offset. Aunque los mensajes se guarden en los topics por un tiempo limitado (una semana por defecto) y sean eliminados, el offset seguirá incrementando su valor.

Brokers y Topics

Un clúster de Kafka consiste en uno o más servidores denominados Kafka brokers. Cada broker es identificado por un ID (integer) y contiene ciertas particiones de un topic, no necesariamente todas.

Además, permite replicar y particionar dichos topics balanceando la carga de almacenamiento entre los brokers. Esta característica permite que Kafka sea tolerante a fallos y escalable.

Zookeeper

Se trata de un servicio centralizado imprescindible para el funcionamiento de Kafka, al cual envía notificaciones en caso de cambios como: creación de un nuevo topic, caída de un broker, levantamiento de un broker, borrado de topics, etc.

Su labor principal es gestionar los brokers de Kafka, manteniendo una listado con sus respectivos metadatos y facilitar mecanismos para health checking. Además, ayuda en la selección del broker líder para las distintas particiones de los topics.

Topic replication

Los topics deberán tener un factor de replicación > 1 (normalmente 2 y 3), de esta forma si un broker se cae, otro broker puede servir los datos.

En cada momento sólo puede haber un broker líder para cada partición de un topic. Sólo el líder puede recibir y servir datos de una partición, mientras tanto los otros brokers sincronizarán sus datos. Si este se cae, se cambia el líder.

API

Una vez comentada la estructura de Apache Kafka, vamos a ver cómo se interactúa con él mediante cuatro API’s:

API de Apache Kafka. Imagen recuperada de la documentación de Kafka.

Producers

Permite que una aplicación pueda publicar mensajes de un topic de Kafka de forma asíncrona. Los productores automáticamente saben a qué broker y a qué partición deben escribir.

En el caso de que un broker se caiga, el productor sabe cómo recuperarse y seguirá escribiendo en el resto. Los productores envían los mensajes con clave (string, número, etc) o sin ella.

Si la clave es nula se enviarán en round robin entre los brokers. Si no es nula, todos los mensajes con esa clave se enviarán siempre a la misma partición.

Además, para confirmar que los mensajes han sido correctamente escritos en Kafka se podrá configurar la recepción de un ack, ya sea por la recepción del mensaje por parte broker líder o por todos los brokers réplica.

Consumers

Con su uso podemos suscribirnos a un topic de Kafka y consumir sus mensajes para poder tratarlos en nuestra aplicación. Podemos crear un consumidor o un grupo de consumidores.

La diferencia entre ellos es que el grupo de consumidores permite el consumo de mensaje de forma paralela, es decir, si un nodo de ese grupo consume un mensaje el resto no lo hará.

Esto es útil a la hora de tener más de una instancia de un microservicio corriendo en nuestro sistema. Cada consumidor del grupo de consumidores leerá de una partición exclusiva.

Si hay más consumidores que particiones, algunos de los consumidores estarán inactivos, para solucionar esto es recomendable tener el mismo número de particiones que de consumidores dentro de un grupo.

En el caso de que un broker de los que está leyendo se caiga, los consumidores saben cómo recuperarse. Los datos son leídos en orden dentro de cada partición pero no entre ellas. Kafka almacena los offsets de los grupos de consumidores cuando estos leen los datos.

Los offsets son almacenados en un topic de Kafka denominado “_consumer_offsets”. Cuando un consumidor de un grupo lee datos de Kafka, se actualiza el offset. Si un consumidor se cae, cuando vuelva a ser levantado seguirá leyendo datos desde donde se quedó anteriormente.

Stream Processors

Se trata de una librería para crear aplicaciones que nos permite consumir un stream de datos de un topic para poder realizar modificaciones sobre los mensajes y escribir en otro topic actuando como productor, es decir, la entrada y la salida de datos son almacenados en el cluster de Kafka.

Combina la simplicidad del desarrollo de aplicaciones en lenguaje Java o Scala con los beneficios de la integración con el cluster de Kafka. Entre sus características destacan su alta capacidad de procesamiento de mensajes por segundo, su escalabilidad y una alta tolerancia a fallos.

Connectors

Se tratan de componentes listos para usar que nos permiten simplificar la integración entre sistemas externos y el cluster de Kafka. Podemos crear y ejecutar productores o consumidores reutilizables que conectan los topics de Kafka a las aplicaciones o sistemas externos, como por ejemplo una base datos.

Además, algunos permiten realizar modificaciones simples sobre los mensajes que irán a los topics de Kafka. Se configuran mediante ficheros properties o a través de su API REST y entre sus características destacan ser distribuidos y escalables.

Existen muchos conectores para distintos sistemas, en este link podéis encontrar más información.

Conclusiones

En este post hemos realizado una introducción de los aspectos principales de Apache Kafka, así como una explicación de sus principales componentes para una comprensión rápida del producto.

Además, hemos podido comprobar cómo el proceso de integración con nuestros proyectos con Spring es algo sencillo y nos ofrece una gran variedad de opciones a la hora de configurarlo.

Actualmente lo estamos utilizando en nuestro proyecto, siendo una pieza clave en la evolución del mismo, convirtiéndose en uno de los principales mecanismos de comunicación entre nuestros microservicios.

Referencias

Revista Cloud Computing

Noticias de la Nube o Cloud Computing, Big Data, Blockchain, Fintech, Inteligencia Artificial, Móvil, Inversión, Soluciones, Tecnología, Ciberseguridad, Opinión, etc.

5 Comentarios

CloudComputing Spain (@cloud_spain) says:

4 años ago

Comunicando microservicios con Apache Kafka https://t.co/NIa4N97i09 #cloudcomputing https://t.co/rJrju5P43B

Responder
Sergi Llopis Asencio (@sergillopisasen) says:

4 años ago

Comunicando microservicios con Apache Kafka https://t.co/OWD9VaNvJQ https://t.co/5LKuT857vh

Responder
Jairo Iglesias (@Jairo_Church) says:

4 años ago

Comunicando microservicios con Apache Kafka https://t.co/OObrRWz1DQ https://t.co/po9knqpEq8

Responder
Transform. Digital (@revistatdigital) says:

4 años ago

RT @prosinet: Comunicando microservicios con Apache Kafka https://t.co/yCYIonZEH4

Responder
StackedCloud (@StackedCloud) says:

4 años ago

Comunicando microservicios con Apache Kafka: Por Víctor Manuel Valle, Desarrollador Backend J2EE en Paradigma Digit… https://t.co/UXD12XjERC

Responder

Dejar un Comentario Cancel Reply

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

NOMBRAMIENTOS

Daniel Brown

Celonis

Daniel Brown nombrado Chief Product Officer de Celonis

Brown trabajará en estrecha colaboración con los equipos de ingeniería, ventas y marketing para seguir ofreciendo soluciones que permitan a las empresas ser más productivas, eficientes y sostenibles, así como sacar el máximo partido de tecnologías revolucionarias como la IA. Antes de unirse a Celonis, Brown trabajó como director de Producto en Certinia durante más de seis años, donde dirigió la gestión de productos y la ingeniería de la organización global de desarrollo de productos de la empresa. Previamente, Daniel estuvo 15 años en Microsoft, donde ocupó varios puestos de liderazgo, entre ellos el de director general de Estrategia y Desarrollo Corporativo, director general de I+D de Aplicaciones Dynamics AX y director general de I+D de Dynamics NAV. Daniel también fue cofundador y vicepresidente de Producto e Ingeniería en Netabacus, una start-up de comercio electrónico B2B centrada en pequeñas y medianas empresas que fue adquirida por Rivio.

Manuel Lavín

GFT

Manuel Lavín nombrado nuevo CEO para Europa Central y Occidental del grupo alemán GFT

Manuel Lavín, CEO de GFT en España desde 2021, ha sido nombrado nuevo CEO de Europa Central y Occidental del grupo alemán GFT. Este nombramiento, efectivo desde el 1 de enero de 2025, otorga a Lavín la responsabilidad de liderar la región más importante de la consultora tecnológica, que incluye mercados clave como España, Alemania, Austria, Bélgica, Francia, Italia y Suiza. La expansión de su rol busca impulsar la colaboración entre los mercados europeos y reforzar la oferta de GFT para clientes españoles que deseen internacionalizar sus estrategias digitales.

Enrique García

Ericsson

Enrique García nombrado nuevo responsable de Redes Privadas y de Misión Crítica de Ericsson para el Sudeste Asiático, Oceanía e India

Enrique asumirá la responsabilidad sobre el desarrollo del negocio de las industrias y sectores de infraestructura crítica y las redes privadas, uno de los pilares de la estrategia de futuro de Ericsson. Infraestructuras de transporte como ferrocarriles, puertos, aeropuertos o autopistas, el sector de la energía, seguridad pública y emergencias o el ámbito de la defensa son áreas de crecimiento donde la tecnología 5G es fundamental para la imprescindible conectividad de alto rendimiento, resiliente y segura.

Mar Vieiro

Orisha Commerce

Mar Vieiro nombrada nueva Directora Ejecutiva para Iberia de Orisha Commerce

Mar Vieiro ha liderado la estrategia comercial de Openbravo desde su llegada en 2022, fortaleciendo su presencia en el Sur de Europa y Latinoamérica. Bajo su dirección comercial, la compañía ha impulsado el crecimiento, especialmente en el mercado ibérico, con la incorporación de nuevos clientes como Leroy Merlin y Obramat en España y Portugal (Grupo Adeo), ToysRUs y Prenatal (Grupo PRG), Sabor a España, Equivalenza y Naulover entre otros, y el fortalecimiento de su colaboración con clientes existentes como Deporvillage, Rolcar, La Europa y el desarrollo de su red de partners.

Gema Fernández

Coface

Gema Fernández nombrada nueva directora de Recursos Humanos de Coface en España y Portugal

En su trayectoria profesional, destaca que estuvo más de una década en Metlife, ocupando los últimos 3 años la posición de directora de Recursos Humanos para España, Italia, Portugal y Chipre. Asimismo, ha ocupado cargos de responsabilidad en empresas como Holmen Paper o Avon. Licenciada en Psicología por la Universidad Complutense de Madrid y especializada en Psicología Industrial por la UNED, cuenta con un máster en Recursos Humanos y Organización por ESIC Business & Marketing School.

Alejandro Romero

Fundación ESYS

Alejandro Romero nombrado Presidente del Consejo Asesor de la Fundación ESYS

Alejandro Romero es fundador y CEO de Alto Intelligence, firma internacional en Riesgos Digitales y Ciberinteligencia, y cofundador de Ciberseguridad Constella, ambas empresas líderes mundiales en sus respectivos campos de ciberinteligencia y ciberseguridad. También, es Limited Partner de Ballistic Ventures, un fondo de riesgo de ciberseguridad en etapa "semilla" con sede en San Francisco, centrado en abordar las crecientes amenazas a la infraestructura digital de la sociedad. Además, Romero tiene un amplio bagaje y experiencia en diferentes empresas y sectores, asentadas en el enorme rigor de una sólida formación académica y profesional. Como experto en ciberseguridad y riesgos digitales es miembro de los consejos de Telefónica (Filial Telefónica Tech, Madrid), Cyber Peace Institute (Ginebra), ECFR (Madrid, Bruselas) y el Real Instituto Elcano (Madrid). También apoya y forma parte de las juntas directivas de varias organizaciones sin fines de lucro como Endeavor, The Conversation y Hermes Foundation.

Ignacio Cea

Kyndryl

Ignacio Cea nombrado nuevo director de Core Enterprise y zCloud en España y Portugal

La empresa de servicios tecnológicos Kyndryl ha anunciado la incorporación de Ignacio Cea como nuevo director de Core Enterprise y zCloud en España y Portugal. Cea, que reportará a Enrique Cortés, vicepresidente de Prácticas y Consultoría de Kyndryl España y Portugal, se encargará de liderar las iniciativas de la compañía para ayudar y acompañar a las empresas en su transformación y evolución en el ámbito tecnológico. Ignacio Cea cuenta con una dilatada experiencia profesional en la industria y es un alto ejecutivo especializado en la transformación de organizaciones en sectores como banca o consultoría. Previamente a su incorporación a Kyndryl, trabajó en empresas como Bankia, IBM, Barclays, Banco Santander, Cecabank e Iberdrola, liderando equipos tecnológicos en entornos multiculturales.

David López

Sisteplant

David López nombrado nuevo CEO de Sisteplant

David López era, hasta ahora, director de Innovación de Sisteplant, cargo que asumió en 2021 y que desde entonces ha compaginado con el de director de la Oficina de Gestión de Proyectos de Operaciones. Previo a ello, desarrolló una larga carrera en Sisteplant desempeñando diversas funciones en la compañía, desde Dirección de Proyectos y Desarrollo de Negocio hasta la Industrialización de Nuevos Servicios. Bajo su dirección, en estos años se han desarrollado algunos de los proyectos de innovación más ambiciosos de Sisteplant, centrados en la aplicación de Inteligencia Artificial y Robótica en el ámbito de las operaciones industriales, así como su integración con los sistemas MES (Captor®) y CMMS (Prisma®) de Sisteplant, para dotarlos de capacidades diferenciadoras en el mercado. La supervisión de David en estos proyectos ha situado a Sisteplant en el mapa de las empresas más innovadoras en el sector industrial.

Josef Ming

Grupo Schindler

Josef Ming nombrado nuevo Presidente del Grupo Schindler

Josef Ming (suizo, nacido en 1958) es socio asesor en Bain & Company, Switzerland Inc., y cuenta con más de 30 años de experiencia en consultoría de gestión e industria, incluidos importantes proyectos con el Grupo Schindler. Josef Ming ha formado parte del Comité Global de Promoción y Compensación de Bain y ha sido miembro de largo plazo del Consejo Global de Directores de Bain. Posee una amplia experiencia en programas de transformación global, desarrollo de estrategias de crecimiento, programas de mejora operativa, desarrollo organizacional, fusiones y adquisiciones (M&A) y desinversiones. En este contexto, Josef Ming asumirá un mandato del 40% por un período limitado de dos años. Posteriormente, la compañía planea restablecer un Presidente o Presidenta interno/a a largo plazo y a tiempo completo.

Cristina Chamás

Huspy España

Cristina Chamás nombrada General Manager para Huspy España

Licenciada en Business Administration por el IE Business School, Cristina comenzó su trayectoria profesional en Loewe en la división de Global Media. Posteriormente, amplió su experiencia en Business Analytics en Accenture, y más tarde desempeñó el rol de Business Strategy Consultant en NTT DATA hasta 2022. Después se unió a Huspy, convirtiéndose en la empleada número 1 en España, encargada de lanzar al mercado la sede en Madrid y más tarde asumió el cargo de Head of Strategy & Expansión de Huspy en Europa, con la misión de liderar y desarrollar las estrategias comerciales de Huspy a nivel europeo, así como de dirigir los esfuerzos de expansión para fortalecer la presencia de la compañía en Europa.

Ángel Escribano

Indra Group

Ángel Escribano nombrado nuevo presidente ejecutivo de Indra Group

Fundador junto a su padre y su hermano de la compañía Mecanizados Escribano en el año 1989, Ángel Escribano era hasta ahora el presidente de EM&E Group. Junto a su hermano Javier, es el artífice de la conversión de una compañía que ha pasado de fabricar piezas mecánicas bajo especificación de terceros a diseñar, desarrollar y fabricar sistemas complejos de defensa, como son las estaciones de armas de control remoto, sistemas electroópticos y kits de munición guiada. Ángel Escribano ha trabajado en casi todas las áreas operativas de esta empresa, completando su formación en diferentes departamentos de la misma, desde la operación de máquinas CNC, hasta la gestión comercial de la compañía pasando por diferentes labores de planificación de operaciones y de gestión de calidad. Forma parte de los consejos de administración de las empresas TESS DEFENCE y SMS.