pgEdge presenta ColdFront para PostgreSQL, que integra de manera transparente cargas de trabajo de IA, análisis y OLTP

Permite leer y escribir tanto en almacenamiento en caliente y en frío sin modificar las aplicaciones, reduciendo los costes de almacenamiento hasta en un 90 %.

ALEXANDRIA, Virginia, 18 de junio de 2026 — pgEdge, empresa líder en soluciones empresariales de código abierto basadas en Postgres, anunció hoy pgEdge ColdFront, una solución de gestión inteligente de niveles de almacenamiento (data tiering) para PostgreSQL. Frente a las alternativas existentes, ColdFront introduce un nivel en frío totalmente operativo para escritura, permitiendo ejecutar operaciones UPDATE y DELETE directamente sobre registros archivados mediante las mismas consultas SQL utilizadas actualmente por las aplicaciones, sin necesidad de realizar cambios en el software ni procesos de rehidratación de datos. Los datos de menor frecuencia de acceso se trasladan automáticamente a Apache Iceberg utilizando el formato columnar Apache Parquet, sobre cualquier almacenamiento de objetos compatible con S3, ofreciendo una reducción de hasta el 90 % en los costes de almacenamiento. Al mismo tiempo, el conjunto completo de datos permanece legible y escribible mediante un único nombre de tabla de Postgres, y las consultas sobre el nivel en frío se ejecutan a velocidad analítica gracias al motor columnar vectorizado de DuckDB.

Cada base de datos PostgreSQL de producción que resulta útil crece con el tiempo con datos históricos necesarios para cargas de trabajo analíticas y requisitos de retención de datos. Los costes de almacenamiento y la complejidad operativa, incluidos los procesos de respaldo, la sobrecarga de VACUUM y el retraso de las réplicas, aumentan considerablemente, mientras que los datos actuales necesarios para las aplicaciones OLTP operativas en tiempo real siguen siendo relativamente pequeños. Los equipos responden eliminando datos antiguos, archivándolos en archivos planos que interrumpen las consultas, o adoptando soluciones propietarias de tiering que los bloquean en un formato de proveedor durante toda la vida útil de los datos. pgEdge ColdFront elimina la necesidad de realizar estas concesiones. Los datos en frío se trasladan automáticamente a almacenamiento de objetos de bajo coste, permanecen completamente legibles y modificables mediante PostgreSQL estándar, y se almacenan en un formato abierto en cada capa.

Un ejemplo sencillo, aunque problemático, demuestra el poder y la conveniencia de ColdFront: una solicitud de eliminación conforme al RGPD sobre datos archivados de hace cinco años. Con ColdFront, esto es una única sentencia SQL, no un ciclo de restaurar a almacenamiento activo, eliminar, volver a archivar y verificar nuevamente. El nivel de almacenamiento en frío es escribible de forma predeterminada.

“Durante años, los proveedores han afirmado que han unificado de manera transparente las cargas de trabajo analíticas, transaccionales y, ahora, de IA. ColdFront finalmente lo hace realidad para PostgreSQL, sin compromisos y sin dependencia de un proveedor propietario”, afirmó Phillip Merrick, CPO de pgEdge. “ColdFront elimina completamente esos compromisos. La aplicación mantiene el mismo SQL. DuckDB se ejecuta en el proceso para ofrecer velocidad analítica sobre datos en frío. El nivel de almacenamiento en frío es escribible. Y funciona sobre PostgreSQL estándar sin modificaciones, por lo que no se requieren migraciones para implementarlo.”

Lo que hace diferente a ColdFront. El único nivel en frío con escritura directa. La mayoría de las soluciones de tiering convierten los datos archivados en solo lectura o requieren código diferente para escribir en ellos. El nivel en frío de ColdFront es completamente escribible utilizando el mismo nombre de tabla de PostgreSQL, sin necesidad de rehidratación, rutas especiales ni conocimiento por parte de la aplicación sobre dónde residen los datos.

Velocidad analítica sobre datos en frío. ColdFront ejecuta DuckDB dentro del proceso de PostgreSQL, sin ningún daemon independiente ni sidecar. Las consultas de exploración sobre datos en frío almacenados en formato Parquet utilizan el motor columnar vectorizado de DuckDB, proporcionando un rendimiento analítico entre 10 y 100 veces superior al almacenamiento basado en registros con los mismos datos. Sin canalización ETL, sin un segundo sistema y sin necesidad de procesos CDC.

Cero cambios en la aplicación. ColdFront intercepta SQL en la capa de extensión. Las aplicaciones continúan utilizando SELECT, INSERT, UPDATE y DELETE sobre el mismo nombre de tabla. Sin refactorizaciones, sin cambios en los ORM, sin nuevos patrones de acceso a datos. El almacenamiento por niveles es una propiedad de la implementación, no del SQL de la aplicación.

Completamente de código abierto en todos sus niveles. ColdFront se ejecuta sobre las versiones estándar de PostgreSQL 16, 17 y 18 distribuidas por el proyecto upstream, sin utilizar un fork propietario. Los datos almacenados en frío se guardan en Apache Iceberg estándar (archivos Parquet en S3), legible por Spark, Trino, DuckDB, Snowflake o Databricks sin ninguna dependencia de ColdFront. En caso de dejar de utilizar ColdFront, los datos en caliente permanecerán disponibles como tablas PostgreSQL convencionales, mientras que los datos en frío conservarán su formato abierto como archivos Iceberg estándar en S3. Las operaciones habituales de administración, incluyendo pg_dump, respaldos, replicación lógica y las herramientas operativas existentes, continuarán funcionando sin cambios.

Gestión integrada del ciclo de vida de particiones. El conjunto de datos en caliente se controla mediante un único parámetro de configuración: hot_period. Un parámetro adicional opcional, retention_period, puede utilizarse para eliminar automáticamente los datos en frío después del período de tiempo especificado. ColdFront crea previamente las particiones futuras antes de las escrituras y retira las antiguas mediante DETACH CONCURRENTLY sobre PostgreSQL estándar: sin operaciones DROP bloqueantes y sin intervención manual. Funciona de manera independiente como un gestor de particiones puro, sin requerir un nivel de almacenamiento en frío, y las tablas pueden actualizarse posteriormente a un esquema completo de almacenamiento por niveles sin necesidad de rediseñar el modelo.

Hasta un 90 % de reducción en los costes de almacenamiento y operaciones menos complejas para los datos en frío. El almacenamiento de objetos S3 cuesta aproximadamente un 90 % menos que el almacenamiento de PostgreSQL basado en SSD. Las bases de datos más pequeñas en el nivel en caliente también permiten respaldos más rápidos, restauraciones más rápidas, menor carga sobre las réplicas y una reducción en los costes de los servicios gestionados.

Distribuido de forma natural mediante Spock. En un clúster multi-maestro de pgEdge Spock, los datos en frío almacenados en S3 son accesibles para lecturas y escrituras desde todos los nodos simultáneamente, proporcionando una solución de escalabilidad atractiva para cargas de trabajo que requieren un rendimiento extremadamente alto o una gran disponibilidad. Los datos en caliente se replican mediante Spock; los datos en frío residen en almacenamiento de objetos compartido, por lo que los clústeres solo replican el conjunto de datos de trabajo y consultan todo el historial desde cualquier nodo. El protocolo bakery, verificado formalmente en TLA+, serializa los commits de Iceberg entre nodos sin conflictos 409 ni reintentos a nivel de aplicación; rendimiento validado de 4,4 millones de registros por segundo en una malla de 6 nodos con 60 millones de registros.

“Los equipos de bases de datos están pagando precios de SSD por datos que casi nunca utilizan, mientras dedican tiempo real de ingeniería a gestionar qué conservar, qué eliminar y cómo recuperar datos antiguos cuando el negocio los necesita”, afirmó Dave Page, CTO de pgEdge. “ColdFront gestiona automáticamente todo el ciclo de vida. La aplicación sigue utilizando el mismo SQL y el coste de almacenamiento se reduce hasta en un 90 %. Lo validamos a 4,4 millones de registros por segundo en un clúster de seis nodos con 60 millones de registros. Eso es lo que realmente ocurre en producción.”

Las canalizaciones de IA y aprendizaje automático (ML) necesitan acceso a toda la profundidad de los datos de una organización, no solo al conjunto de datos de trabajo reciente. Los procesos de entrenamiento, la recuperación mediante RAG, la ingeniería de características y los análisis agénticos consultan datos históricos que las implementaciones tradicionales de PostgreSQL suelen eliminar o archivar en formatos inaccesibles.

En el modo desacoplado, ColdFront transforma PostgreSQL en una capa de cómputo sin estado basada en Iceberg: los nuevos nodos de procesamiento pueden iniciarse en cuestión de segundos sobre un mismo catálogo y un mismo almacén de objetos, sin requerir procesos de sincronización de datos. Los agentes de inteligencia artificial y los flujos de trabajo de aprendizaje automático se conectan mediante controladores estándar de PostgreSQL y tienen la capacidad de consultar volúmenes de datos históricos del orden de terabytes sin necesidad de un sistema independiente. En combinación con el pgEdge Agentic AI Toolkit — compuesto por MCP Server, RAG Server, Vectorizer y Docloader — ColdFront proporciona una infraestructura de datos integral para IA agéntica en entornos regulados en los que la soberanía de los datos constituye un requisito no opcional.

¿Quién o qué se beneficia? Cargas de trabajo de series temporales de SaaS e IoT. Las aplicaciones que generan millones de eventos al día mantienen el conjunto de trabajo reciente en PostgreSQL para consultas de paneles de control y alertas. El archivador mueve automáticamente las particiones más antiguas a Iceberg. Los costos de almacenamiento se reducen hasta en un 90 %; las consultas de tendencias históricas abarcan ambos niveles mediante el mismo SQL, sin cambios en la aplicación.

Sectores regulados con estrictos requisitos de retención de datos a largo plazo. Las organizaciones de servicios financieros, salud y administración pública que deben conservar información durante 7 a 10 años almacenan sus datos en frío en Apache Iceberg, un formato abierto e independiente del proveedor que garantiza que los datos sigan siendo accesibles desde cualquier herramienta compatible con Iceberg, independientemente de las futuras decisiones sobre proveedores. Las consultas de cumplimiento y las solicitudes de eliminación de datos se gestionan a través de la misma interfaz SQL.

Analítica sin un almacén de datos dedicado. Los equipos de producto y BI ejecutan agregaciones, análisis de cohortes y consultas de tendencias sobre datos en frío en formato Parquet utilizando el motor columnar de DuckDB, que se ejecuta en proceso dentro de PostgreSQL. Sin más facturas elevadas de proveedores de almacenes de datos ni canalizaciones ETL, sin CDC y sin necesidad de construir o mantener un sistema de analítica independiente.

Tres modos de operación. ColdFront admite tres modos de almacenamiento, además de un gestor de particiones independiente, configurables por tabla, todos coexistiendo en la misma base de datos:

Por niveles (en caliente + en frío): Los datos recientes permanecen en particiones heap de PostgreSQL. Un archivador ligero mueve las particiones más antiguas a Iceberg según una programación configurable y expira los datos en frío una vez superado su período de retención. Es la opción ideal para cargas de trabajo con gran uso de OLTP y un fuerte patrón de acceso a datos recientes.

Desacoplado (solo Iceberg): La tabla completa reside en Iceberg desde el primer registro. PostgreSQL se convierte en un front-end de procesamiento sin estado, permitiendo un escalado elástico de la capacidad de cómputo para cargas de trabajo de IA, ML y analítica sin mover los datos a un sistema separado.

Solo particiones (sin nivel en frío): ColdFront gestiona el ciclo de vida completo de una tabla particionada sobre PostgreSQL estándar, sin necesidad de Iceberg. Las tablas pueden comenzar en este modo y actualizarse posteriormente a un esquema completo de niveles de almacenamiento sin necesidad de remodelar los datos.

Disponibilidad. pgEdge ColdFront ya está disponible como versión beta para pruebas y evaluación en entornos de preproducción. Tanto los modos por niveles como desacoplado funcionan de extremo a extremo en una matriz de integración continua completamente validada que cubre PostgreSQL 16, 17 y 18, tanto en configuraciones estándar (vanilla) como en topologías de malla Spock multi-master, incluyendo lecturas desde réplicas físicas en standby. Los tipos de almacenamiento compatibles incluyen almacenamiento compatible con S3, Google Cloud Storage y Azure Blob Storage (ADLS Gen2).

ColdFront se distribuirá junto con pgEdge Enterprise Postgres y estará integrado en pgEdge Cloud durante el segundo semestre de 2026.

ColdFront es de código abierto bajo Licencia PostgreSQL y puede utilizarse con PostgreSQL estándar de la comunidad. Los clientes de pgEdge Enterprise Postgres pueden (a partir de hoy) utilizar binarios precompilados probados y disponibles, así como soporte empresarial 24×7. La documentación, las instrucciones de instalación y las arquitecturas de referencia están disponibles en https://docs.pgedge.com/coldfront.

Para obtener más información o comenzar a utilizarlo, visiten https://github.com/pgEdge/coldfront.

Haz clic aquí para leer la noticia original en inglés en la página web oficial de PostgreSQL.

Blog

pgEdge presenta ColdFront para PostgreSQL, que integra de manera transparente cargas de trabajo de IA, análisis y OLTP

Popular posts

Lanzamiento de PostgreSQL 19 Beta 2

pglayers: Extensiones de PostgreSQL como capas Docker modulares

Lanzamiento de Barman 3.19.0 y 3.19.1

POSETTE: An Event for Postgres 2026 — Ya están disponibles en YouTube las 44 presentaciones de

Elije tu Plan

CONTÁCTANOS

Política de privacidad