Big Data | Spanish InterSystems Developer Community

Artículo

Alberto Fuentes · 14 mayo, 2019 Lectura de 3 min

Guía rápida para conectar Apache Spark y Apache Zeppelin con InterSystems IRIS

Hola a todos, me gustaría compartir una guía rápida publicada en el Developer Community sobre cómo conectar Apache Spark + Apache Zeppelin con InterSystems IRIS.

#Analítica #Big Data #Artificial Intelligence (AI) #Mejores prácticas #Python #InterSystems IRIS

0 1

0 1.5K

Artículo

Pierre-Yves Duq... · 6 jul, 2020 Lectura de 11 min

Machine Learning con Spark e InterSystems IRIS

Apache Spark se ha convertido rápidamente en una de las tecnologías más atractivas para la analítica de big data y el machine learning. Spark es un motor de procesamiento de datos generales, creado para usar con entornos de procesamiento en clúster. Su corazón es el RDD (Resilient Distributed Dataset), que representa un conjunto de datos distribuido con tolerancia a fallos, sobre el que se puede operar en paralelo entre los nodos de un clúster. Spark se implementa con una combinación de Java y Scala, por lo que viene como una biblioteca que puede ejecutarse sobre cualquier JVM. Spark también es compatible con Python (PySpark) y R (SparkR) e incluye bibliotecas para SQL (SparkSQL), machine learning (MLlib), procesamiento de gráficas (GraphX) y procesamiento de flujos (Spark Streaming).

#Analítica #Big Data #Artificial Intelligence (AI) #JDBC #Machine Learning (ML) #Python #InterSystems IRIS

1 0

0 921

Artículo

Alberto Fuentes · 3 abr, 2020 Lectura de 4 min

Cómo cargar un modelo de ML a InterSystems IRIS (PMML)

¡Hola a todos!

Hoy hablaremos de cómo cargar un modelo de Machine Learning en IRIS y cómo probarlo, a través de un artículo genial de Niyaz Khafizov.

#Analítica #API #Big Data #Artificial Intelligence (AI) #Machine Learning (ML) #Principiante #Python #InterSystems IRIS

0 0

0 538

Artículo

Ricardo Paiva · 24 jun, 2021 Lectura de 6 min

Cómo utilizar AWS Glue con InterSystems IRIS

Publicación Original por: Anton Umnikov
Arquitecto Senior de soluciones en la nube en InterSystems
AWS CSAA, GCP CACE

AWS Glue es un proceso ETL (extraer, transformar y cargar) completamente gestionado, que hace sencillo y rentable clasificar los datos, limpiarlos, enriquecerlos y moverlos de forma fiable entre diferentes almacenes de datos.

En el caso de InterSystems IRIS, AWS Glue permite mover grandes cantidades de datos a IRIS desde fuentes de datos tanto en la nube como en las propias instalaciones (on-premise). Las fuentes de datos potenciales incluyen, pero no se limitan a, bases de datos on-prem, archivos CSV, JSON, Parquet y Avro que residen en buckets S3, bases de datos nativas en la nube como AWS Redshift y Aurora, y muchas otras.

#AWS #Bases de datos #Big Data #Mejores prácticas #Nube #Python #SQL #InterSystems IRIS

0 1

0 477

Artículo

Kurro Lopez · 30 jul, 2020 Lectura de 9 min

Visualizando la jungla de datos - Parte I. Hagamos un gráfico

Este es el primer artículo de una serie que se sumerge en herramientas de visualización y análisis de datos de series temporales. Obviamente, estamos más interesados en analizar los datos relacionados con el rendimiento que podemos recopilar de la familia de productos Caché. Sin embargo, como veremos más adelante, no estamos limitados a eso. Por ahora estamos explorando Python y las bibliotecas/herramientas disponibles dentro de ese ecosistema.

#Big Data #Herramientas #Modelo de datos de objetos #Python #Visualización #Caché

0 0

0 317

Artículo

Ricardo Paiva · 4 jun, 2021 Lectura de 4 min

Utilizando Synthea y Docker para generar pacientes sintéticos de forma consistente y realista.

Durante las últimas semanas, el equipo de Solution Architecture (Soluciones de Arquitectura) ha estado trabajando para terminar la carga de trabajo de 2019: esto incluyó la creación del código abierto de la Demostración de Readmisiones que llevó a cabo HIMSS el año pasado, para poder ponerla a disposición de cualquiera que busque una forma interactiva de explorar las herramientas proporcionadas por IRIS.

#Analítica #Big Data #Contenedorización #Docker #Herramientas #Mejores prácticas #InterSystems IRIS for Health

Open Exchange app

0 1

0 304

Artículo

Eduardo Anglada · 29 mar, 2022 Lectura de 2 min

Cómo hacer que los usuarios encuentren el conjunto de datos perfecto

¡Hola a todos!

Hoy quiero hablar sobre nuestro proyecto y utilizar el tema del conjunto de datos para el concurso.

Nuestra intención nunca fue ser unos gestores de datos, sobre todo porque a veces nuestros preciosos datos significan mucho para nosotros, pero no para el resto del mundo.

Mi Tesoro

Queremos ir un paso más allá y permitir que los usuarios encuentren el conjunto de datos perfecto para satisfacer sus necesidades.

Nuestro proyecto es un puente entre la comunidad de la Ciencia de Datos y la Comunidad de Desarrolladores, utilizando InterSystems IRIS para lograr esta misión.

#Big Data #Concurso #Modelo de datos #InterSystems IRIS #InterSystems IRIS BI (DeepSee) #InterSystems IRIS for Health

Open Exchange app

0 0

0 267

Artículo

Luis Angel Pére... · 20 dic, 2022 Lectura de 3 min

Test de velocidad de ingestión y consulta de datos

Llamamos Procesamiento Híbrido Transaccional y Analítico (HTAP por sus siglas en inglés) a la capacidad de recuperar numerosos registros por segundo, mientras que a la vez se permiten consultas simultáneas en tiempo real. También se llama Analítica Transaccional ó Transanalítica y es un elemento muy útil en escenarios en los que disponemos de un flujo constante de datos en tiempo real, como podría ser el caso de datos provenientes de sensores IIOT o información de las fluctuaciones en el mercado bursátil y nos permite satisfacer la necesidad de consultar estos conjuntos de datos en tiempo real o casi en tiempo real.

Os comparto un ejemplo que podréis ejecutar en el que se recibe un conjunto de datos en streaming, con entradas de datos constantes y consultas continuas a la vez. El ejemplo está desarrollado en varias plataformas y podréis comparar cómo reaccionó cada una de ellas, con la velocidad de entrada y salida de datos en cada plataforma y su rendimiento. Las plataformas con las que he probado en esta demo son: InterSystems IRIS, MariaDB y MySQL.

#Analítica #Big Data #Importación y Exportación de Datos #Procesamiento de transacciones de base de datos #InterSystems IRIS

0 0

0 119

Artículo

Ricardo Paiva · 30 jul, 2024 Lectura de 4 min

Puesta en funcionamiento de Databricks para InterSystems Cloud SQL

Un inicio rápido para los datos de InterSystems Cloud SQL en Databricks

#Big Data #Java #JDBC #Nube #Python #SQL #SSL #InterSystems IRIS

0 0

0 56