Usando IRIS como una base de datos vectorial
Las capacidades integradas de búsqueda vectorial de InterSystems IRIS nos permiten buscar datos no estructurados y semiestructurados. Los datos se convierten en vectores (también llamados “embeddings”) y luego se almacenan e indexan en InterSystems IRIS para búsqueda semántica, generación aumentada por recuperación (RAG), análisis de texto, motores de recomendación y otros casos de uso.
Esta es una demostración sencilla de IRIS siendo utilizado como una base de datos vectorial y para búsquedas por similitud en IRIS.
Requisitos previos:
- Python
- InterSystems IRIS for Health - ya que se usará como la base de datos vectorial
Repositorio: https://github.com/piyushisc/vectorsearchusingiris
Pasos a seguir:
- Clonar el repositorio.
- Abrir VS Code, conectarse a la instancia y espacio de nombres deseados de IRIS y compilar las clases.
- Abrir la terminal de IRIS e invocar el comando:
do ##class(vectors.vectorstore).InsertEmbeddings(), Esto lee el texto del archivotext.txtgenera los embeddings y los almacena en IRIS. - Invocar el comando:
do ##class(vectors.vectorstore).VectorSearch("search_terms")con las palabras deseadas para realizar la búsqueda por similitud. IRIS devolverá los tres resultados más cercanos:
Ir a la publicación original, escrita por @Piyush Adhikari
Comentarios (0)1