Arquitectura de Machine Learning para datos masivos
InterSystems IRIS es una excelente opción para desarrollar proyectos de aprendizaje automático (Machine Learning, ML), en escenarios de operaciones con datos masivos, debido a las siguientes razones:
- Soporta el uso de shards para escalar el repositorio de datos, tal y como MongoDB por ejemplo.
- Soporta la creación de cubos analíticos, y si unimos esto más el "sharding" nos permite tener volumen y rendimiento.
- Soporta la recopilación de datos de forma planificada o en tiempo real, con una gran variedad de opciones de adaptadores de datos.
- Permite automatizar todo el proceso de de-duplicación, utilizando lógica en Python u ObjectScript.
- Permite organizar y automatizar el flujo de datos al repositorio, usando flujos visuales (BPL) y el Lenguaje para la transformación de datos (DTL).
- Soporta el escalamiento automático avanzado, mediante Docker (IaC) y los scripts de Cloud Manager.
- Soporta la carga de librerías ObjectScript in provisioning, mediante ZPM.
- Dispone de interoperabilidad con Python y R para realizar ML en tiempo real.
- Permite utilizar un motor AutoML, denominado IntegratedML para ejecutar el mejor algoritmo para el conjunto de datos indicados.
- Permite crear análisis posteriores a la ejecución, como predicciones y clasificaciones de AutoML, salidas desde los procesos cognitivos de Python y R, tablas dinámicas de Inteligencia empresarial (BI), todo ello con visualizaciones propias o de terceros.
- Permite crear vistas e informes avanzados con JReport.
- Permite maximizar la reutilización y monetización de los datos con el API Management incluido.
Ir a la publicación original, escrita por @YURI MARX GOMES