- Posts Publicaciones
- Blog Blog
- Guides, ClickHouse Guías, ClickHouse
Two years ago, Snowflake versus ClickHouse was a straightforward comparison. Back then, Snowflake was fully managed, expensive, and broadly featured. ClickHouse was on-prem, open source, and speed-optimized. Two ends of a data warehouse spectrum splitting versatility (Snowflake) and speed (ClickHouse). Hace dos años, la comparación entre Snowflake y ClickHouse era directa. En ese entonces, Snowflake era completamente gestionado, costoso y con muchas funciones. ClickHouse estaba en las instalaciones, era de código abierto y optimizado para la velocidad. Dos extremos de un espectro de almacén de datos que dividían la versatilidad (Snowflake) y la velocidad (ClickHouse).
If I was to compare the databases to boats, ClickHouse is a jet ski – ultra-fast, but limited. Snowflake, meanwhile, is a shipyard – a slew of (expensive) tools spanning various functions. Si tuviera que comparar las bases de datos con barcos, ClickHouse sería una moto acuática: ultra rápida, pero limitada. Mientras tanto, Snowflake sería un astillero: una serie de herramientas (costosas) que abarcan diversas funciones.
But, as I said, that was two years ago. Today, Clickhouse has broken ground on features that compete with Snowflake’s managed solution. Likewise, Snowflake released features that are beginning to tackle ClickHouse’s speed. However, the overlap between ClickHouse and Snowflake remains nascent. Today, they are both still pretty different, though the gaps are closing. Pero, como dije, eso fue hace dos años. Hoy en día, ClickHouse ha avanzado en características que compiten con la solución gestionada de Snowflake. Del mismo modo, Snowflake ha lanzado características que están empezando a abordar la velocidad de ClickHouse. Sin embargo, la superposición entre ClickHouse y Snowflake sigue siendo incipiente. Hoy en día, ambos siguen siendo bastante diferentes, aunque las brechas se están cerrando.
Background
Snowflake and ClickHouse are at wildly different stages of growth. Snowflake y ClickHouse se encuentran en etapas de crecimiento muy diferentes.
Snowflake, founded in 2012, is a well-funded, publicly-traded decacorn with nearly 4,000 employees. Snowflake, fundado en 2012, es un decacornio bien financiado y cotizado en bolsa con casi 4,000 empleados.
In contrast, ClickHouse is relatively new as an independent company. While the project originated internally at Yandex around 2012, ClickHouse only spun out independently in 2016 and received funding in 2021. En contraste, ClickHouse es relativamente nuevo como empresa independiente. Si bien el proyecto se originó internamente en Yandex alrededor de 2012, ClickHouse se separó de forma independiente en 2016 y recibió financiamiento en 2021.
Recently, ClickHouse raised a Series B to launch ClickHouse Cloud, its Snowflake-like service. Recientemente, ClickHouse recaudó una Serie B para lanzar ClickHouse Cloud, su servicio similar a Snowflake.
What even is Snowflake?
Every engineer and their cousin has heard about Snowflake. Its massive IPO was one of the most successful public launches in technology history. The title of “Next Snowflake” translates to “Next Incredible Business” in venture-capital land. And with over $1B in revenue, the hype is deserved. However, there’s also a rather curious phenomenon – relatively speaking, few engineers appear to be versed in SnowSQL (Snowflake’s SQL dialect). Cada ingeniero y su primo han oído hablar de Snowflake. Su enorme salida a bolsa fue uno de los lanzamientos públicos más exitosos en la historia de la tecnología. El título de “Próximo Snowflake” se traduce como “Próximo Negocio Increíble” en el mundo del capital de riesgo. Y con más de $1B en ingresos, el entusiasmo está justificado. Sin embargo, también hay un fenómeno bastante curioso: en términos relativos, pocos ingenieros parecen estar familiarizados con SnowSQL (el dialecto SQL de Snowflake).
This contradiction between success and adoption is because Snowflake doesn’t behave like a typical database company. Unlike ClickHouse, Apache Druid, TimescaleDB, QuestDB, and most other OLAP databases Snowflake is cloud-only. The codebase is neither open source nor locally installable. And sorry, startups, but there is no free tier. Esta contradicción entre el éxito y la adopción se debe a que Snowflake no se comporta como una empresa de bases de datos típica. A diferencia de ClickHouse, Apache Druid, TimescaleDB, QuestDB y la mayoría de las otras bases de datos OLAP, Snowflake es exclusivamente en la nube. El código fuente no es de código abierto ni se puede instalar localmente. Y lo siento, startups, pero no hay un nivel gratuito.
To some developer evangelists, this business-first scheme is seen as heresy. But it's an excellent solution for Snowflake’s customers, each of whom pays an average of ~$170,000 a year. But why? Snowflake isn’t Louis Vuitton – people aren’t clamoring to buy its product merely because it's expensive. Para algunos evangelistas del desarrollo, este esquema de negocio primero se ve como una herejía. Pero es una excelente solución para los clientes de Snowflake, cada uno de los cuales paga un promedio de ~$170,000 al año. ¿Pero por qué? Snowflake no es Louis Vuitton: la gente no está ansiosa por comprar su producto simplemente porque es caro.
Instead, Snowflake is a jack of all trades. Snowflake has complex, performant architecture, but its cloud-first, fully-managed design makes scaling seamless. Snowflake can handle complex, conditional-heavy queries, but its GUI enables non-technical people to take advantage of stored data. En cambio, Snowflake es un comodín. Snowflake tiene una arquitectura compleja y eficiente, pero su diseño en la nube y completamente gestionado hace que la escalabilidad sea sencilla. Snowflake puede manejar consultas complejas y condicionales pesadas, pero su interfaz gráfica de usuario permite que personas no técnicas aprovechen los datos almacenados.
Snowflake was built for businesses with complex, ever-changing needs with big budgets. It’s by no means the fastest horse, but it’s the only one that can prance, race, dance, and even sing. Snowflake fue construido para empresas con necesidades complejas y cambiantes con grandes presupuestos. De ninguna manera es el caballo más rápido, pero es el único que puede trotar, correr, bailar e incluso cantar.
What about Clickhouse?
An obvious difference between Snowflake and ClickHouse is that ClickHouse is an open-source solution that can be deployed on any arbitrary server – e.g. Metal, Cloud, K8s, etc. ClickHouse doesn’t make money on any of those open source deployments, and this leads their team to be less sales-driven and more product-lead. Una diferencia obvia entre Snowflake y ClickHouse es que ClickHouse es una solución de código abierto que se puede implementar en cualquier servidor arbitrario, por ejemplo, Metal, Cloud, K8s, etc. ClickHouse no obtiene beneficios de esas implementaciones de código abierto, lo que lleva a que su equipo esté menos orientado a las ventas y más orientado al producto.
The biggest difference is in Clickhouse’s strength. Let’s return to the analogy of ClickHouse being a jet ski. ClickHouse is fast. Incredibly, unbelievably fast. In particular, ClickHouse can return complex aggregations of terabyte-level data spanning millions of rows in milliseconds. In comparison, Snowflake takes dozens of seconds to query gigabyte-level data. La mayor diferencia radica en la fortaleza de ClickHouse. Volvamos a la analogía de ClickHouse siendo una moto acuática. ClickHouse es rápido. Increíblemente, increíblemente rápido. En particular, ClickHouse puede devolver agregaciones complejas de datos a nivel de terabytes que abarcan millones de filas en milisegundos. En comparación, Snowflake tarda decenas de segundos en consultar datos a nivel de gigabytes.
ClickHouse accomplishes this by optimizing the database for speed at returning aggregates. ClickHouse isn’t designed to be utilized like a stock PostgreSQL or mySQL database; it’s particularly good at write-heavy, mutation-low, read-and-reduce-heavy operations. It's perfect solution for analytics providers, like PostHog. ClickHouse logra esto optimizando la base de datos para devolver agregados rápidamente. ClickHouse no está diseñado para ser utilizado como una base de datos estándar de PostgreSQL o mySQL; es particularmente bueno en operaciones con muchas escrituras, pocas mutaciones, y muchas lecturas y reducciones. Es la solución perfecta para proveedores de análisis, como PostHog.
However, normal, on-prem ClickHouse lacks a lot of features that Snowflake likely considers table-stakes: Sin embargo, la versión normal de ClickHouse local carece de muchas características que Snowflake probablemente considera básicas:
- A dedicated non-technical-friendly GUI for exploring and visualizing data Una interfaz gráfica de usuario dedicada y amigable para explorar y visualizar datos
- The ability to modify entry data without massive performance burns La capacidad de modificar datos de entrada sin afectar significativamente el rendimiento
- The ability to scale architecture seamlessly with no migrations whatsoever La capacidad de escalar la arquitectura de forma transparente sin migraciones en absoluto
Hosted ClickHouse
It is slightly silly to compare Snowflake and ClickHouse without mentioning ClickHouse Cloud, Altinity Cloud, Firebolt, or TinyBird. Each solution simplifies deploying and maintaining a ClickHouse instance. This helps address the final bullet in the previous section; they make scaling architecture seamless without complex data migrations. Es un poco absurdo comparar Snowflake y ClickHouse sin mencionar ClickHouse Cloud, Altinity Cloud, Firebolt o TinyBird. Cada solución simplifica la implementación y el mantenimiento de una instancia de ClickHouse. Esto ayuda a abordar el último punto en la sección anterior; hacen que escalar la arquitectura sea sencillo sin migraciones complejas de datos.
ClickHouse Cloud – a new product launched in 2022 by ClickHouse Inc (ClickHouse’s primary contributor) – is exclusively available on AWS, with plans to support both Google Cloud and Azure like Snowflake. Meanwhile, Altinity Cloud – built by Altinity Inc (also contributors to ClickHouse) – has support for both AWS and Google Cloud. Altinity Cloud is also Kubernetes-compatible. ClickHouse Cloud, un nuevo producto lanzado en 2022 por ClickHouse Inc (el principal contribuyente de ClickHouse), está disponible exclusivamente en AWS, con planes de admitir tanto Google Cloud como Azure como Snowflake. Mientras tanto, Altinity Cloud, construido por Altinity Inc (también contribuyentes a ClickHouse), tiene soporte para AWS y Google Cloud. Altinity Cloud también es compatible con Kubernetes.
The big difference between ClickHouse Cloud and Altinity Cloud is how they store data. ClickHouse Cloud is engineered like Google BigQuery. The data is stored in object storage. Altinity Cloud meanwhile runs ClickHouse similar to how an on-prem or local instance works; virtually anything you can do on a local instance is possible on Altinity Cloud. La gran diferencia entre ClickHouse Cloud y Altinity Cloud es cómo almacenan los datos. ClickHouse Cloud está diseñado como Google BigQuery. Los datos se almacenan en almacenamiento de objetos. Mientras tanto, Altinity Cloud ejecuta ClickHouse de manera similar a como funciona una instancia local o en las instalaciones; virtualmente todo lo que se puede hacer en una instancia local es posible en Altinity Cloud.
Separately, an advantage of ClickHouse Cloud is that it includes some exclusive features not available in the ClickHouse core distribution. One of these is a SQL GUI explorer which provides similar features to some of Snowflake’s basic data exploration. Además, una ventaja de ClickHouse Cloud es que incluye algunas características exclusivas que no están disponibles en la distribución principal de ClickHouse. Una de ellas es un explorador SQL GUI que proporciona características similares a algunas de las exploraciones básicas de datos de Snowflake.
Overall, ClickHouse Cloud or Altinity Cloud are excellent options for companies that want a managed version of ClickHouse on the public cloud. Their emergence closes the gap between ClickHouse and Snowflake. En general, ClickHouse Cloud o Altinity Cloud son excelentes opciones para empresas que desean una versión gestionada de ClickHouse en la nube pública. Su aparición cierra la brecha entre ClickHouse y Snowflake.
📖 Further reading: ClickHouse also competes with another huge, established product... Google's BigQuery. Read our ClickHouse vs BigQuery comparison to understand how the two solutions differ. 📖 Lectura adicional: ClickHouse también compite con otro producto enorme y establecido... BigQuery de Google. Lee nuestra comparación entre ClickHouse y BigQuery para entender cómo difieren las dos soluciones.
Architecture overview
When Snowflake was released in 2012, there were two major paradigms – Shared-Disk Architecture and Shared-Nothing Architecture. Cuando Snowflake se lanzó en 2012, existían dos paradigmas principales: Arquitectura de Disco Compartido y Arquitectura de Nada Compartido.
Under Shared-Disk Architecture, CPU and memory were split into nodes, but each connected to a single storage unit – usually a blob store like S3 or GCS these days. The benefit of Shared-Disk Architecture is that you can scale Disk and Compute separately. This is huge when you are thinking about a data warehouse, where your workloads may be very spiky and periodic but your data has to be stored all the time. The cost here is that typically reading from disk is a bit slower, at least in terms of latency, when compared to reading from local storage. Bajo la Arquitectura de Disco Compartido, la CPU y la memoria se dividían en nodos, pero cada uno conectado a una única unidad de almacenamiento, generalmente un almacenamiento de objetos como S3 o GCS en la actualidad. El beneficio de la Arquitectura de Disco Compartido es que puedes escalar Disco y Cómputo por separado. Esto es enorme cuando estás pensando en un almacén de datos, donde tus cargas de trabajo pueden ser muy irregulares y periódicas pero tus datos deben almacenarse todo el tiempo. El costo aquí es que típicamente la lectura desde el disco es un poco más lenta, al menos en términos de latencia, en comparación con la lectura desde el almacenamiento local.
Meanwhile, CPU, memory, and storage are encapsulated under Shared-Nothing Architecture in separate, parallel instances, only syncing via background jobs. The benefit of Shared-Nothing Architecture is speed. There is a risk that storage could go out of sync since usually replication here is eventually consistent, but that was the case with blob stores up until recently too. The easiest way to think about this is consider Postgres. When you install Postgres everything is boxed up nice and neat on a single instance. At smaller scale this is a much simpler setup and enables you to run the architecture pretty much anywhere. Mientras tanto, la CPU, la memoria y el almacenamiento están encapsulados bajo la Arquitectura de Nada Compartido en instancias separadas y paralelas, solo sincronizándose a través de trabajos en segundo plano. El beneficio de la Arquitectura de Nada Compartido es la velocidad. Existe el riesgo de que el almacenamiento pueda desincronizarse ya que generalmente la replicación aquí es eventualmente consistente, pero ese era el caso con los almacenamientos de objetos hasta hace poco también. La forma más fácil de pensar en esto es considerar Postgres. Cuando instalas Postgres, todo está empaquetado de manera ordenada en una sola instancia. A menor escala, esta es una configuración mucho más simple y te permite ejecutar la arquitectura prácticamente en cualquier lugar.
Part of Snowflake’s initial appeal is its hybrid solution that combines the advantages of Shared-Disk Architecture and Shared-Nothing Architecture. Snowflake achieved this by adding another layer of storage to each node that stored partial data, similar to the cache but more complete. Parte del atractivo inicial de Snowflake es su solución híbrida que combina las ventajas de la Arquitectura de Disco Compartido y la Arquitectura de No Compartir Nada. Snowflake logró esto agregando otra capa de almacenamiento a cada nodo que almacenaba datos parciales, similar a la caché pero más completa.
More importantly, Snowflake’s middle layer – virtual warehouses – can be scaled easily, coming in T-shirt sizes (S/M/L/XL). Snowflake makes it easy to add parallel nodes or re-size existing nodes, made possible by Snowflake's virtualized architecture. Más importante aún, la capa intermedia de Snowflake, los almacenes virtuales, se pueden escalar fácilmente, viniendo en tamaños de camiseta (S/M/L/XL). Snowflake facilita la adición de nodos paralelos o el redimensionamiento de nodos existentes, hecho posible por la arquitectura virtualizada de Snowflake.
ClickHouse utilizes Shared-Nothing Architecture by default. But ClickHouse also supports Shared-Disk Architecture. This is useful if you want to scale disk and compute separately, so you can can have the best of both worlds depending on your use case and tune it to fit. You can do this by leveraging Zero Copy Replication and S3/GCS Backed MergeTrees, or even HDFS. ClickHouse utiliza por defecto la Arquitectura de No Compartir Nada. Pero ClickHouse también admite la Arquitectura de Disco Compartido. Esto es útil si deseas escalar el disco y la computación por separado, de modo que puedas tener lo mejor de ambos mundos según tu caso de uso y ajustarlo para que encaje. Puedes hacer esto aprovechando la Replicación de Copia Cero y los MergeTrees respaldados por S3/GCS, o incluso HDFS.
Differences in query optimization & speed
ClickHouse has three significant optimizations that make querying aggregate computations efficient: (i) materialized views, (ii) specialized engines, and (iii) vectorized query execution. ClickHouse tiene tres optimizaciones significativas que hacen que las consultas de cálculos de agregados sean eficientes: (i) vistas materializadas, (ii) motores especializados y (iii) ejecución de consultas vectorizadas.
-
Materialized views: Materialized views are independent tables derived from other table data generated at some specific point in time. Unlike databases like Postgres, ClickHouse's materialized views are constantly re-generated in the background as new data is inserted. While materialized views are delayed because most of ClickHouse's use cases involve aggregate, analytical data, the delay doesn’t pose a problem. Vistas materializadas: Las vistas materializadas son tablas independientes derivadas de datos de otras tablas generadas en algún momento específico. A diferencia de bases de datos como Postgres, las vistas materializadas de ClickHouse se regeneran constantemente en segundo plano a medida que se insertan nuevos datos. Aunque las vistas materializadas tienen un retraso porque la mayoría de los casos de uso de ClickHouse involucran datos analíticos de agregados, el retraso no supone un problema.
-
Specialized engines: Materialized views are aided by ClickHouse's specialized engines, which can do anything from storing aggregates more efficiently on disk (AggregatingMergeTree) to allowing you to make HTTP calls to fetch data. This is one of the useful features we leverage extensively at PostHog – watch our video on them if you're curious. Motores especializados: Las vistas materializadas son ayudadas por los motores especializados de ClickHouse, que pueden hacer desde almacenar agregados de manera más eficiente en disco (AggregatingMergeTree) hasta permitirte hacer llamadas HTTP para obtener datos. Esta es una de las características útiles que aprovechamos extensamente en PostHog; mira nuestro video sobre ellos si tienes curiosidad.
Vectorized query execution: Vectorized execution organizes data in a way that makes it possible to use SIMD (Single Instruction Multiple Data) to process multiple values at once. This is a huge performance boost for aggregate computations – see [ClickHouse's documentation] and this CMU video for more on this. Ejecución de consultas vectorizadas: La ejecución vectorizada organiza los datos de una manera que hace posible utilizar SIMD (Instrucción Única, Múltiples Datos) para procesar múltiples valores a la vez. Esto supone un gran impulso de rendimiento para los cálculos de agregados; consulta la [documentación de ClickHouse] y este video de CMU para obtener más información al respecto.
Snowflake has some of these features, but the main thing that Snowflake has bet on is the proliferation of JSON and unstructured data: Snowflake tiene algunas de estas características, pero lo principal en lo que Snowflake ha apostado es la proliferación de JSON y datos no estructurados:
-
Snowflake's Variant type was built into the service from the beginning and makes querying unstructured data nearly effortless. It decomposes JSON objects into a table of key-value pairs that better leverages the columnar aspect of Snowflake's architecture. This is something ClickHouse is actively working on, but for now is a competitive advantage of Snowflake. El tipo Variant de Snowflake se construyó en el servicio desde el principio y facilita casi sin esfuerzo la consulta de datos no estructurados. Descompone objetos JSON en una tabla de pares clave-valor que aprovecha mejor el aspecto columnar de la arquitectura de Snowflake. Esto es algo en lo que ClickHouse está trabajando activamente, pero por ahora es una ventaja competitiva de Snowflake.
-
While Snowflake has support for materialized views, it charges additionally for it since it needs to allocate serious CPU resources to recompute the views. Those re-computations, under the hood, are more resource intensive for Snowflake because it lacks the same partial-update techniques ClickHouse uses to expedite re-calculations. Si bien Snowflake tiene soporte para vistas materializadas, cobra un cargo adicional por ello, ya que necesita asignar recursos serios de CPU para recalcular las vistas. Esas recalculaciones, en el fondo, son más intensivas en recursos para Snowflake porque carece de las mismas técnicas de actualización parcial que ClickHouse utiliza para acelerar los recálculos.
-
Virtual warehouses instead of specialized engines: Unlike ClickHouse's specialized engines, which utilize hardware to optimize query execution, Snowflake segments its database into virtual warehouses sized from small to large. These warehouses can have larger or lesser compute to handle complex to easy queries and isolate workloads. However, while clever and organized, this approach is computationally and financially expensive when taken full advantage of. Almacenes virtuales en lugar de motores especializados: A diferencia de los motores especializados de ClickHouse, que utilizan hardware para optimizar la ejecución de consultas, Snowflake segmenta su base de datos en almacenes virtuales de tamaño pequeño a grande. Estos almacenes pueden tener más o menos capacidad de cálculo para manejar consultas complejas o sencillas y aislar cargas de trabajo. Sin embargo, aunque sea inteligente y organizado, este enfoque es computacional y financieramente costoso cuando se aprovecha al máximo.
-
Search optimization service: Introduced in 2021, Snowflake offers a search optimization service at its higher enterprise tiers. Because Snowflake is a closed-source product, not much is known about how the search optimization service works, but it can offer enormous performance gains (4x-100x) relative to un-optimized search for some types of queries. Unfortunately, while Snowflake likely uses similar mechanisms to ClickHouse, direct side-by-side analysis isn’t possible due to Snowflake’s closed-search tier. By extension, the search optimization service’s performance boost is unpredictable. Servicio de optimización de búsqueda: Introducido en 2021, Snowflake ofrece un servicio de optimización de búsqueda en sus niveles empresariales más altos. Debido a que Snowflake es un producto de código cerrado, no se sabe mucho sobre cómo funciona el servicio de optimización de búsqueda, pero puede ofrecer enormes mejoras de rendimiento (4x-100x) en comparación con búsquedas no optimizadas para algunos tipos de consultas. Desafortunadamente, aunque Snowflake probablemente utiliza mecanismos similares a ClickHouse, no es posible realizar un análisis directo lado a lado debido al nivel de búsqueda cerrado de Snowflake. Por extensión, el impulso de rendimiento del servicio de optimización de búsqueda es impredecible.
Overall, ClickHouse's close-metal optimizations enable it to return aggregate values over a thousand times faster (and cheaper) than Snowflake. However, Snowflake’s approach is more user-friendly as it requires less SQL-level optimization to take advantage of these organizational features. En general, las optimizaciones de metal cercano de ClickHouse le permiten devolver valores agregados más de mil veces más rápido (y más barato) que Snowflake. Sin embargo, el enfoque de Snowflake es más amigable para el usuario, ya que requiere menos optimización a nivel de SQL para aprovechar estas características organizativas.
Who uses Snowflake and ClickHouse?
Part of Snowflake’s value prop is the broad appeal to both technical and non-technical users. Snowflake’s marketplace makes connecting business intelligence tools with warehouse data easy, which appeals to teams wanting explore their data. ClickHouse Cloud has a growing competitive offering, but the current integrations are less numerous. Parte de la propuesta de valor de Snowflake es el amplio atractivo tanto para usuarios técnicos como no técnicos. El mercado de Snowflake facilita la conexión de herramientas de inteligencia empresarial con datos de almacén, lo cual atrae a equipos que desean explorar sus datos. ClickHouse Cloud tiene una oferta competitiva en crecimiento, pero las integraciones actuales son menos numerosas.
ClickHouse and Snowflake are both used for analytics, but ClickHouse is more focused on analytical queries. ClickHouse y Snowflake se utilizan ambos para análisis, pero ClickHouse se enfoca más en consultas analíticas.
ClickHouse is a great fit for PostHog because we are an analytics platform – we need to be able to answer questions like “what is the average time to convert for users who saw a certain feature?” in real time and at speed of click. ClickHouse es ideal para PostHog porque somos una plataforma de análisis: necesitamos poder responder preguntas como '¿cuál es el tiempo promedio para convertir para los usuarios que vieron cierta característica?' en tiempo real y a la velocidad de un clic.
Traditionally, Snowflake can be considered more of a standard data warehouse or data lake where you can store all your data and then query it. This is a great fit for companies that want to store all their data in one place and then query it. Tradicionalmente, Snowflake puede considerarse más como un almacén de datos estándar o un lago de datos donde puedes almacenar todos tus datos y luego consultarlos. Esto es ideal para empresas que desean almacenar todos sus datos en un solo lugar y luego consultarlos.
Snowflake customers include AT&T, Jetblue, Anthem, and Capital One. Snowflake customers tend to be enterprise-level and have to deal with a lot of data. Clientes de Snowflake incluyen AT&T, Jetblue, Anthem y Capital One. Los clientes de Snowflake tienden a ser de nivel empresarial y tienen que lidiar con una gran cantidad de datos.
ClickHouse’s customers include Github, YouTube, Twitter, and Slack. We, at PostHog, also use ClickHouse. It dramatically improved our analytics data warehouse from our previous Postgres setup and allows us to deliver billion-event scale insights quickly. Clientes de ClickHouse incluyen Github, YouTube, Twitter y Slack. Nosotros, en PostHog, también usamos ClickHouse. Mejoró drásticamente nuestro almacén de datos de análisis con respecto a nuestra configuración anterior de Postgres y nos permite ofrecer rápidamente ideas a escala de mil millones de eventos.
Conclusion
While ClickHouse didn't start life as a business-first data warehouse like Snowflake, the lines between the two are increasingly blurred. While it has some work to do, ClickHouse is quickly developing features that make it look more and more like a data warehouse. Si bien ClickHouse no comenzó su vida como un almacén de datos orientado a los negocios como Snowflake, las líneas entre los dos se están volviendo cada vez más borrosas. Aunque tiene trabajo por hacer, ClickHouse está desarrollando rápidamente características que lo hacen parecer cada vez más un almacén de datos.
ClickHouse is a fantastic solution for teams looking to built data intensive applications, such as analytics or a data-backed CRM. If you grow that business to the point where you need a data warehouse, ClickHouse will grow with you. However, if you are looking for a product that has deep integrations with a long list of tools and the majority of your data is schemaless JSON, Snowflake may be for you. ClickHouse es una solución fantástica para equipos que buscan construir aplicaciones intensivas en datos, como análisis o un CRM respaldado por datos. Si haces crecer ese negocio al punto en que necesitas un almacén de datos, ClickHouse crecerá contigo. Sin embargo, si buscas un producto que tenga integraciones profundas con una larga lista de herramientas y la mayoría de tus datos son JSON sin esquema, Snowflake puede ser para ti.
Further reading
Consider the following resources if you want to learn more about ClickHouse and Snowflake’s differences. Considera los siguientes recursos si deseas aprender más sobre las diferencias entre ClickHouse y Snowflake.
-
Clickbench, a benchmark test comparing ClickHouse, Snowflake, and other databases Clickbench, una prueba de referencia que compara ClickHouse, Snowflake y otras bases de datos
-
Andy Pavlo - Vectorized Query Execution <--- this is a great video that explains vectorized query execution and you should check out all of Andy's videos Andy Pavlo - Ejecución de consultas vectorizadas <--- este es un excelente video que explica la ejecución de consultas vectorizadas y deberías ver todos los videos de Andy
-
ClickHouse Separate Storage & Compute Almacenamiento y cálculo separados de ClickHouse
-
Velotio’s Snowflake versus ClickHouse article. Note, this article was published before the ClickHouse Cloud announcement, which impacts the comparison with Snowflake. Artículo de Velotio sobre Snowflake versus ClickHouse. Nota: este artículo se publicó antes del anuncio de ClickHouse Cloud, lo que afecta la comparación con Snowflake.