Artículo
David Reche · Feb 2, 2021 Lectura de 2 min

Arquitectura de Machine Learning para datos masivos

InterSystems IRIS es una excelente opción para desarrollar proyectos de aprendizaje automático (Machine Learning, ML), en escenarios de operaciones con datos masivos, debido a las siguientes razones:

  1. Soporta el uso de shards para escalar el repositorio de datos, tal y como MongoDB por ejemplo.
  2. Soporta la creación de cubos analíticos, y si unimos esto más el "sharding" nos permite tener volumen y rendimiento.
  3. Soporta la recopilación de datos de forma planificada o en tiempo real, con una gran variedad de opciones de adaptadores de datos.
  4. Permite automatizar todo el proceso de de-duplicación, utilizando lógica en Python u ObjectScript.
  5. Permite organizar y automatizar el flujo de datos al repositorio, usando flujos visuales (BPL) y el Lenguaje para la transformación de datos (DTL).
  6. Soporta el escalamiento automático avanzado, mediante Docker (IaC) y los scripts de Cloud Manager.
  7. Soporta la carga de librerías ObjectScript in provisioning, mediante ZPM.
  8. Dispone de interoperabilidad con Python y R para realizar ML en tiempo real.
  9. Permite utilizar un motor AutoML, denominado IntegratedML para ejecutar el mejor algoritmo para el conjunto de datos indicados.
  10. Permite crear análisis posteriores a la ejecución, como predicciones y clasificaciones de AutoML, salidas desde los procesos cognitivos de Python y R, tablas dinámicas de Inteligencia empresarial (BI), todo ello con visualizaciones propias o de terceros.
  11. Permite crear vistas e informes avanzados con JReport.
  12. Permite maximizar la reutilización y monetización de los datos con el API Management incluido. 
00
2 0 0 17