Apache Cloudberry 2.1.0: nueva versión de base de datos MPP basada en PostgreSQL para analítica e inteligencia artificial
La comunidad de Apache Cloudberry (Incubating) se complace en anunciar el lanzamiento de Apache Cloudberry 2.1.0, la versión más reciente de su base de datos de procesamiento masivo en paralelo (MPP), diseñada para analítica a gran escala y cargas de trabajo de inteligencia artificial.
Tras la versión 2.0.0, que marcó el primer lanzamiento oficial del proyecto después de ingresar en el Apache Incubator, la versión 2.1.0 continúa mejorando el núcleo de la base de datos, el motor de ejecución y los componentes del ecosistema.
Principales mejoras en la versión 2.1.0
Esta versión introduce varias mejoras en la ejecución de consultas, el almacenamiento y la integración del ecosistema:
- Ejecución distribuida mejorada: Un nuevo protocolo de interconexión UDP2 mejora la comunicación entre segmentos, lo que incrementa el rendimiento y la escalabilidad de las consultas distribuidas.
- Mejoras en el optimizador: El optimizador ORCA incorpora ahora poda de CTE, pushdown parcial de agregaciones y diversas correcciones relacionadas con la precisión y el uso de memoria.
- Optimización de almacenamiento y rendimiento: El formato de almacenamiento PAX ahora incluye soporte para compresión LZ4, junto con mejoras en la gestión de entrada/salida y memoria.
- Recolección de estadísticas más rápida: Una nueva funcionalidad de ANALYZE rápido para tablas optimizadas para append soluciona un cuello de botella frecuente en entornos de gran escala.
- Mejor integración con flujos de datos modernos: La incorporación del servidor MCP facilita la integración con herramientas basadas en modelos de lenguaje (LLM) y flujos de trabajo impulsados por inteligencia artificial.
Apache Cloudberry 2.1.0 también presenta mejoras en sus componentes del ecosistema:
- Cloudberry PXF: Base de código modernizada, dependencias actualizadas y alineación con los estándares de proyectos Apache.
- Cloudberry Backup: Consolidación de herramientas de respaldo con mayor facilidad de mantenimiento, incluyendo la integración del plugin S3 en el repositorio principal.
El proyecto continúa avanzando en la actualización del kernel de PostgreSQL (de la versión 14.x a la 16.x) y en su integración con el ecosistema PostgreSQL.
Descarga
Apache Cloudberry 2.1.0 puede descargarse en: https://cloudberry.apache.org/releases.
Enlaces útiles
La comunidad da la bienvenida a contribuidores y usuarios interesados en los sistemas de análisis distribuidos basados en PostgreSQL.
- Página web: https://cloudberry.apache.org
- GitHub: https://github.com/apache/cloudberry
- Seguimiento de incidencias: https://github.com/apache/cloudberry/issues
- Lista de correo: https://lists.apache.org/list.html?dev@cloudberry.apache.org
Sobre Apache Cloudberry
Apache Cloudberry (Incubating) es una base de datos de código abierto para el procesamiento masivo en paralelo (MPP) destinada al análisis de datos a gran escala. Se basa en PostgreSQL y en la última versión de código abierto de Greenplum Database. Ha sido diseñada para funcionar tanto en entornos locales como en la nube, proporcionando una base escalable para el almacenamiento de datos y el análisis avanzado. El proyecto se encuentra actualmente en fase de incubación en la Apache Software Foundation.

