Saltar contenido

¿Qué diferencia a Snowflake de otras tecnologías de datos?

Snowflake es una tecnología de nube con 10 años que ayuda a las empresas a controlar sus datos. Pero con tantas tecnologías de datos en el mercado, ¿qué hace que Snowflake sea diferente?

Desde el primer día, Snowflake se ha distinguido de la gran mayoría de las demás bases de datos por su enfoque de administración cero y SaaS completo, y algunas tecnologías clave como el uso compartido de datos, microparticiones, copia de clones cero y desacoplamiento de procesamiento y Gestión de E/S. A continuación detallaremos algunas de estas características.

¿Qué es Snowflake?

Snowflake se fundó en California en 2012 y publica y distribuye la plataforma homónima Data Cloud, que se lanzó oficialmente en octubre de 2014.

Diseñada y disponible únicamente en la Nube, la plataforma Snowflake nos permite gestionar volúmenes de datos muy grandes reduciendo al extremo las habilidades tecnológicas requeridas.

El 16 de septiembre de 2020, apenas 8 años después de su creación, la empresa ingresa al Nasdaq y se convierte en una de las mayores OPI del mundo del software. La plataforma Snowflake ahora es utilizada por más de 6300 clientes en todo el mundo y tiene una NRR (tasa de retención neta) de SaaS de casi el 174 % en los últimos años.

¿De dónde vino Snowflake?

Los dos fundadores de Snowflake eran ingenieros franceses que trabajaban en Oracle como arquitectos de sistemas analíticos tradicionales. Con la llegada al mercado de nuevos sistemas de big data, rápidamente compartieron la misma frustración y una limitación obvia de las denominadas arquitecturas de bases de datos clásicas que las existentes frente a nuevas cargas de trabajo.

Decidieron crear una nueva plataforma de datos desde cero y, al percibir el impacto de la computación en la nube en la industria en 2012, decidieron que su base de datos solo funcionaría en la nube. Se abstienen tanto de las numerosas restricciones como de las variantes de hardware para poder concentrarse en las llamadas capas “altas” de su software.

Después de dos años de investigación y desarrollo, Snowflake estuvo disponible en 2014 en la plataforma Azure de Microsoft, cuando la computación en la nube comienza a aparecer en los titulares.

¿Cuáles son las 4 características principales de Snowflake?


Como se mencionó anteriormente, hay varias características clave que ayudan a distinguir a Snowflake de otras tecnologías de datos en el mercado. La tecnología sin servidor, las microparticiones, la separación de I/O y el procesamiento, y la funcionalidad de múltiples nubes le dan a Snowflake su ventaja competitiva. Revisemos las características con más detalle:

  1. Una tecnología sin servidor
    Snowflake es una tecnología denominada “sin servidor”, ya que Snowflake administra y proporciona todos los recursos informáticos necesarios (informática, almacenamiento, red) bajo demanda.
  2. Microparticiones
    Una de las principales características de Snowflake que le permite alcanzar niveles de alto rendimiento mientras se ocupa de uno de los principales problemas de las plataformas en la nube es su sistema de microparticiones. Este sistema almacena verticalmente (también conocido como por columna o grupo de columnas) en forma de una partición reducida de los datos, así como un conjunto de metadatos (rango de valores, número de valores distintos y otra información que permite acelerar las consultas y el procesamiento).

Todas las tablas se almacenan automáticamente con este sistema de microparticiones y se dividen a medida que se alimentan.

  1. Separación de I/O y procesamiento
    La segunda característica que debe conocer sobre Snowflake es su arquitectura que le permite separar el acceso a los datos del procesamiento de datos. Así, es posible a través de diferentes tipos de procesadores (Almacén Virtual) responder a un número virtualmente infinito de solicitudes en paralelo, cualquiera que sea la naturaleza del procesamiento. Los almacenes virtuales no requieren ninguna gestión, solo la elección de una potencia que lleva el nombre de la talla de una camiseta: de la XS a la 12XL.Es en esta última característica que Snowflake se diferencia fundamentalmente de las arquitecturas tradicionales que deben tratar dentro de un mismo servidor red/procesamiento/gestión de memoria. Por estas razones, Snowflake entra en la categoría “Cloud Native”.
  1. Nube múltiple
    Snowflake está disponible en las tres principales plataformas en la nube:
  1. Microsoft Azure 
  2. Google Cloud Computing
  3. Amazon Web Services

Snowflake funciona de la misma manera sea cual sea la plataforma en la nube y permite desde 2021 sincronizar en tiempo real y entornos transparentes implementados en dos proveedores de nube diferentes.

¿Cuáles son los casos de uso más conocidos de Snowflake?

Los casos de uso de Snowflake son muy numerosos y continúan evolucionando a un ritmo significativo: Aplicaciones analíticas, lago de datos, almacén de datos, ciencia de datos, aplicaciones de datos, en modo por lotes, microlotes o en tiempo real.

  1. Aplicaciones analíticas
    La arquitectura inicial de Snowflake se basa en el almacenamiento y procesamiento de datos a través de SQL. Por lo tanto, es natural encontrar aplicaciones analíticas como el caso de uso más extendido.

Cargar un volumen muy grande de datos, transformar los datos y proporcionar un conjunto de tablas y vistas para una herramienta de informes o análisis avanzada.

La tecnología descrita en el capítulo anterior permite a los usuarios almacenar, procesar y analizar cantidades de datos prácticamente ilimitadas. De hecho, los límites de hardware inherentes a otras bases de datos se reducen en gran medida, y no es raro dividir los tiempos de respuesta por múltiplos de 10.

  1. Datalake/Data Warehouse
    El costo muy bajo del almacenamiento de datos, la ausencia de niveles de datos dentro de Snowflake y su capacidad para procesar grandes volúmenes de datos le permiten implementar estos dos casos de uso en la misma plataforma que a menudo se manejan en diferentes plataformas, utilizando diferentes tecnologías.
  2. Ciencia de datos
    La implementación de casos de uso de Data Science se puede realizar a través de diferentes enfoques:
  • Snowpark, un entorno de ejecución de código externo para procesar datos almacenados en Snowflake (Scala, Java, Python)
  • Uso de una plataforma externa altamente integrada con Snowflake (como Dataiku o Datarobot)
  • Ejecución del modelo desde dentro de la plataforma mediante el uso de funciones definidas por el usuario (UDF- User-Defined Functions) externas.
  1. Intercambio de datos
    Rápidamente, Snowflake propuso un servicio de uso compartido de datos que permite que dos implementaciones de Snowflake de dos organizaciones diferentes compartan datos de forma segura en tiempo real dentro de la misma plataforma de Snowflake, sin tener que lidiar con costosos y complejos flujos de intercambio de datos entre organizaciones.
    Los datos se pueden compartir públicamente y monetizar dentro del Data Marketplace.
  2. Tiempo real
    El tiempo real está disponible tanto al ingerir datos a través de la función Snowpipe que permite que los datos se integren tan pronto como se detecta su presencia en un sistema de almacenamiento de archivos en la nube, así como en la forma de una API que permite que los datos presentes dentro de la plataforma sean consultado en REST. También está disponible un conector Kafka.

Asociaciones e inversiones

Para apoyar el desarrollo de su ecosistema, Snowflake ha creado una subsidiaria dedicada (Snowflake Ventures) que le permite invertir en soluciones externas fortaleciendo la integración en su plataforma y garantizando a sus clientes comunes una relación a largo plazo.

Este es especialmente el caso del 20% de las empresas: Alation, Collibra, Dataiku, DataRobot, DataOps.Live, dbtLabs, ThoughtSpot y muchas otras.

Participe en la comunidad Devoteam

Conozca la postura de nuestra comunidad de líderes tecnológicos sobre la posición actual de Snowflake en el mercado, eche un vistazo a la edición más reciente de Devoteam TechRadar. Si este artículo te resultó útil, echa un vistazo a algunas de las opiniones de otros expertos.