Objetivo Funcional
El módulo de Revisión Inteligente proporciona herramientas automatizadas para
comparar el contenido de las evidencias entregadas por los investigadores. El sistema
analiza las secciones de cada entrega, calcula el grado de similitud y genera reportes
detallados que apoyan a los coordinadores en la detección de posibles coincidencias
o casos de plagio.
Para acceder a este módulo, sigue la siguiente ruta:
Menú Principal → Módulos → Revisión Inteligente
El sistema de Revisión Inteligente utiliza Inteligencia Artificial (OpenAI)
para analizar y comparar evidencias de productos investigativos:
┌─────────────────────────────────────────────────────────────┐
├─────────────────────────────────────────────────────────────┤
│ Evidencia A (PDF) Evidencia B (PDF) │
│ ┌──────────┐ ┌──────────┐ │
│ │ Extrae │ │ Extrae │ │
│ └────┬─────┘ └────┬─────┘ │
│ ┌──────────┐ ┌──────────┐ │
│ │ Sección 1│ │ Sección 1│ │
│ │ Sección 2│ │ Sección 2│ │
│ │ Sección 3│ │ Sección 3│ │
│ └────┬─────┘ └────┬─────┘ │
│ └──────────┬───────────────────┘ │
│ ┌──────────────────────┐ │
│ │ OpenAI Embeddings │ │
│ │ (text-embedding-3- │ │
│ └──────────┬───────────┘ │
│ ┌──────────────────────┐ │
│ └──────────┬───────────┘ │
│ ┌──────────────────────┐ │
│ │ Análisis de progreso │ │
│ └──────────────────────┘ │
└─────────────────────────────────────────────────────────────┘
Extracción de texto PDF: Se extrae el texto de los archivos PDF usando smalot/pdfparser
División en secciones: El sistema identifica y divide automáticamente el contenido en secciones
Generación de embeddings: Se crean embeddings vectoriales usando OpenAI (text-embedding-3-small)
Cálculo de similitud: Se calcula la similitud coseno entre los embeddings (0-100%)
Análisis con IA: GPT-4o-mini analiza el progreso y coherencia entre secciones
Generación de reporte: Se crea un informe detallado con porcentaje de similitud y análisis textual
La vista principal muestra productos que tienen al menos 2 entregas de tipo evidencia:
Campo Descripción Título Nombre del producto investigativo Subtipo Clasificación del producto Autores Investigadores responsables Evidencias Cantidad de evidencias disponibles Acciones Ver evidencias, comparar
Acceder a producto
Haz clic en un producto del listado para ver sus evidencias.
Ver evidencias disponibles
Se mostrarán todas las evidencias del producto con:
Usuario que entregó la evidencia
Período académico
Fecha de entrega
Comparaciones existentes
Seleccionar dos evidencias
Selecciona dos evidencias diferentes para comparar:
Evidencia 1: Primera entrega a comparar
Evidencia 2: Segunda entrega a comparar
Iniciar comparación
Presiona Comparar para iniciar el proceso.
El sistema extrae automáticamente secciones de los PDFs:
Al seleccionar evidencias
Cuando seleccionas evidencias para comparar, el sistema verifica si
ya tienen secciones extraídas.
Extracción automática
Si no existen secciones, el sistema:
Extrae el texto del PDF usando smalot/pdfparser
Identifica secciones automáticamente usando patrones de texto
Guarda cada sección con su título y contenido
Reextracción (si es necesario)
Puedes recalcular las secciones si el PDF fue actualizado o si
la extracción inicial no fue correcta.
Al acceder al detalle de una comparación, encontrarás:
Información de las evidencias comparadas:
Producto investigativo
Evidencia 1: Usuario, período, fecha
Evidencia 2: Usuario, período, fecha
Comparaciones de secciones realizadas
Visualización de las secciones extraídas de cada evidencia:
Evidencia 1: Lista de secciones con título y contenido
Evidencia 2: Lista de secciones con título y contenido
Desde aquí puedes seleccionar secciones específicas para comparar.
Lista de comparaciones realizadas entre secciones:
Sección 1 vs Sección 2
Grado de similitud (0-100%)
Análisis de progreso generado por IA
Elemento del producto asociado
Para comparar secciones específicas de las evidencias:
Seleccionar secciones
En la vista de comparación, selecciona:
Sección 1: De la primera evidencia
Sección 2: De la segunda evidencia
Elemento del producto: Para contextualizar la comparación
Ejecutar comparación
Presiona Comparar Secciones para iniciar el análisis con IA.
Proceso de análisis
El sistema:
Genera embeddings de ambas secciones usando OpenAI
Calcula similitud coseno (0-100%)
Analiza el progreso reportado vs contenido real usando GPT-4o-mini
Genera un análisis textual del avance
Ver resultados
Se mostrará:
Grado de similitud: Porcentaje de similitud entre secciones
Análisis de progreso: Evaluación de coherencia del progreso reportado
Diferencias principales: Identificación de avances o cambios
Si necesitas reextraer las secciones de las evidencias:
Acceder a opción
En la vista de comparación, presiona Recalcular Secciones .
Confirmar acción
Confirma que deseas eliminar las secciones existentes y regenerarlas.
Proceso automático
El sistema:
Elimina todas las secciones existentes de ambas evidencias
Elimina las comparaciones de secciones asociadas
Reextrae el texto de los PDFs
Regenera las secciones automáticamente
El módulo utiliza las siguientes tecnologías de IA:
OpenAI Embeddings
Modelo: text-embedding-3-small
Convierte el texto de las secciones en vectores numéricos para
calcular similitud semántica.
Similitud Coseno
Algoritmo matemático que calcula el grado de similitud entre
dos vectores (0-100%).
GPT-4o-mini
Modelo de lenguaje que analiza el contenido y evalúa la coherencia
del progreso reportado.
PDF Parser
Librería: smalot/pdfparser
Extrae texto de archivos PDF para análisis.
Mínimo 2 evidencias
Solo se pueden comparar productos que tengan al menos 2 evidencias entregadas.
Evidencias diferentes
No se puede comparar una evidencia consigo misma.
Sin duplicados
Si ya existe una comparación entre dos evidencias, se muestra la existente
en lugar de crear una nueva.
Mismo producto
Las evidencias comparadas deben pertenecer al mismo producto investigativo.
Error Causa Solución ”Las evidencias no pertenecen al producto” Seleccionaste evidencias de diferentes productos Selecciona evidencias del mismo producto ”Comparación ya existe” Ya se compararon estas evidencias Se mostrará la comparación existente automáticamente ”Sin contenido para comparar” No se pudo extraer texto del PDF Verifica que el PDF tenga texto (no solo imágenes) “Error al realizar la comparación” Problema con OpenAI o archivo Verifica conexión a internet y formato del PDF
¿El sistema detecta plagio de internet?
No, el sistema solo compara entre evidencias registradas en la plataforma.
Para detectar plagio de fuentes externas, se recomienda usar herramientas
especializadas como Turnitin o iThenticate.
¿Qué significa el grado de similitud?
El grado de similitud (0-100%) indica qué tan similar es el contenido
semántico entre dos secciones. Un porcentaje alto no implica necesariamente
plagio; puede deberse a metodologías estándar, citas correctas o contenido
propio reutilizado.
¿Puedo comparar evidencias de diferentes períodos?
Sí, puedes comparar evidencias de cualquier período. Esto es útil para
evaluar el progreso entre entregas y detectar si hay avance real en el
desarrollo del producto.
¿Qué pasa si el PDF no tiene texto?
Si el PDF contiene solo imágenes escaneadas, el sistema no podrá extraer
el texto. Asegúrate de que los PDFs sean de texto seleccionable o usa
herramientas OCR antes de subirlos.
¿Puedo recalcular secciones si el PDF cambió?
Sí, puedes usar la opción “Recalcular Secciones” para reextraer el contenido
si actualizaste el archivo PDF de la evidencia.