Artículo
· 4 mayo, 2023 Lectura de 3 min

Detección de texto generado mediante IA usando IntegratedML

En los últimos años, las tecnologías de inteligencia artificial para la generación de texto han avanzado significativamente. Por ejemplo, los modelos de generación de texto basados en redes neuronales pueden producir textos que son casi indistinguibles de los textos escritos por humanos. ChatGPT es uno de estos servicios. Es una enorme red neuronal entrenada con una gran cantidad de textos, que puede generar textos sobre varios temas y adaptarse a un contexto dado.

La nueva tarea para las personas es desarrollar formas de reconocer textos escritos no solo por personas sino también por inteligencia artificial (IA). Esto se debe a que, en los últimos años, los modelos de generación de texto basados en redes neuronales se han vuelto capaces de producir textos que son casi indistinguibles de los textos escritos por humanos.

Hay dos métodos principales para el reconocimiento de texto escrito por inteligencia artificial (IA):

  • Utilizar algoritmos de machine learning para analizar las características estadísticas del texto;
  • Utilizar métodos criptográficos que pueden ayudar a determinar la autoría del texto

En general, la tarea de reconocimiento de texto de IA es difícil pero importante.

Me complace presentar una aplicación para el reconocimiento de textos generados por inteligencia artificial (IA). Durante el desarrollo, aproveché los beneficios de InterSystems Cloud SQL e Integrated ML, que incluyen:

  • Solicitudes de datos rápidas y eficientes, con alto rendimiento y velocidad;
  • Interfaz amigable para usuarios no expertos en bases de datos y machine learning;
  • Escalabilidad y flexibilidad para ajustar rápidamente los modelos de ML según los requisitos;

En el desarrollo y entrenamiento posterior del modelo, utilicé un conjunto de datos abierto, concretamente 35 mil textos escritos. La mitad de los textos fueron escritos a mano por un gran número de autores, y la otra mitad fue generada por IA con ChatGPT.

Configuración usada para el modelo GPT:

model="text-curie-001"
temperature=0.7
max_tokens=300
top_p=1
frequency_penalty=0.4
presence_penalty=0.1

A continuación, se establecieron unos 20 parámetros básicos, según los cuales se llevó a cabo el entrenamiento posterior. Estas son algunas de las opciones que utilicé:

  • Cantidad de caracteres
  • Cantidad de palabras
  • Longitud media de las palabras
  • Cantidad de frases
  • Longitud media de las frases
  • Cantidad de palabras únicas
  • Cantidad de palabras vacías (stop words)
  • Ratio de palabras únicas
  • Cantidad de signos de puntuación
  • Ratio de signos de puntuación
  • Cantidad de preguntas
  • Cantidad de exclamaciones
  • Cantidad de dígitos 
  • Cantidad de letras en mayúscula
  • Cantidad de palabras repetidas
  • Cantidad de bigramas únicos
  • Cantidad de trigramas únicos
  • Cantidad de cuatrigramas únicos

Como resultado, obtuve una sencilla aplicación que podéis usar para vuestras tareas o para pasarlo bien.

Así es como se ve:

imagePara probar la aplicación podéis usar la demo online o ejecutarla en local con vuestra cuenta Cloud SQL.

Todos los comentarios sobre la app son bienvenidos!
 

Comentarios (0)1
Inicie sesión o regístrese para continuar