3. Resultados
En esta sección, se presentan los resultados del modelo YOLOv5 aplicado a la detección de frutos de café. En la Figura 2 uestra cómo el modelo YOLOv5 ha identificado y delimitado los frutos de café presentes en la planta. Cada caja azul representa una detección del modelo, con una etiqueta que indica el objeto detectado (“café”) y un valor de confianza asociado a la detección. Este valor de confianza refleja la certeza del modelo respecto a la presencia de un fruto de café en la posición indicada
Figure 2.
Detección de frutos de café utilizando el modelo YOLOv5. Fuente: Elaboración propia.
Figure 2.
Detección de frutos de café utilizando el modelo YOLOv5. Fuente: Elaboración propia.
Las cajas delimitadoras azules encierran los frutos de café que el modelo ha identificado, y el valor de confianza, que varía entre 0.3 y 0.82, se muestra al lado de cada caja. Un valor de confianza más alto indica una mayor certeza del modelo en la precisión de la detección. Este resultado indica que el modelo puede identificar correctamente los frutos de café, mostrando una alta precisión y fiabilidad en la detección.
La Figura 3 muestra la evolución de la pérdida de la caja delimitadora a lo largo de las 50 épocas de entrenamiento del modelo YOLOv5. Al inicio, la pérdida es alta (alrededor de 0.13) y disminuye rápidamente durante las primeras 10 épocas, lo que indica un aprendizaje eficaz. Hacia la época 20, la pérdida se estabiliza en torno a 0.08, mostrando que el modelo ha alcanzado una precisión óptima en la detección de objetos.
Figure 3.
Evolución de la pérdida de la caja delimitadora durante las épocas de entrenamiento. Fuente: Elaboración Propia.
Figure 3.
Evolución de la pérdida de la caja delimitadora durante las épocas de entrenamiento. Fuente: Elaboración Propia.
La matriz de confusión fue utilizada para evaluar el modelo YOLOv5, utilizando verdaderos positivos, verdaderos negativos, falsos positivos y falsos negativos. Esta herramienta permite medir el rendimiento del modelo en términos de precisión, exactitud, recall y F1-Score, proporcionando una visión detallada de su efectividad en la detección y conteo de frutos de café.
Métricas de evaluación: En la Figura 4 se presenta la matriz de confusión, que incluye las definiciones de Verdadero (V) y Falso (F) junto con Positivo (P) y Negativo (N) para este proyecto de investigación.
Figure 4.
Matriz de confusión para este proyecto de investigación. Fuente: Elaboración Propia.
Figure 4.
Matriz de confusión para este proyecto de investigación. Fuente: Elaboración Propia.
La Figura 5 muestra la matriz de confusión generada a partir de las imágenes reales y las predicciones realizadas por el modelo YOLOv5
Figure 5.
Matriz de confusión en YOLOv5.
Figure 5.
Matriz de confusión en YOLOv5.
Fuente: Elaboración Propia
Con los datos obtenidos, es posible calcular diversas métricas que permiten medir y evaluar el rendimiento del modelo de detección. Las métricas que se utilizarán para esta evaluación incluyen precisión, recall y F1 score. La precisión refleja la exactitud del modelo en términos de la cantidad de frutos de café detectados correctamente. Por otro lado, el recall indica la capacidad del modelo para identificar los frutos, es decir, el porcentaje de frutos de café correctamente identificados por el modelo.
En este estudio, se da prioridad a la métrica F1 score sobre las demás, ya que esta métrica integra tanto la precisión como el recall, otorgándoles igual importancia y proporcionando un único valor que permite comparar el rendimiento del modelo de manera integral. Además, considerando que el modelo se aplicará en condiciones de campo, es fundamental asegurar la detección precisa de los frutos de café, que pueden ser fácilmente confundidos con el entorno natural de las ramas y hojas del cafeto.
En la Tabla 8 se presentan los resultados obtenidos a partir de la matriz de confusión y las métricas calculadas.
Table 8.
Resultados del modelo Yolov5.
Table 8.
Resultados del modelo Yolov5.
| |
Yolov5 |
| Precisión |
97.25% |
| Recall |
95.77% |
| F1- Score |
96.37% |
Figure 6.
Grafico de barra de las métricas calculadas de Yolov5.
Figure 6.
Grafico de barra de las métricas calculadas de Yolov5.
Fuente: Elaboración Propia.
La precisión del modelo se sitúa en 95.25%, lo que indica que la mayoría de las detecciones realizadas por el modelo son correctas. Esto refleja la alta capacidad del modelo para minimizar los falsos positivos, es decir, la detección errónea de objetos que no son frutos de café como si lo fueran.
Por otro lado, el recall del modelo es de 95.77%, lo que significa que el modelo detecta la mayoría de los frutos de café presentes en las imágenes. Esta métrica mide la capacidad del modelo para identificar todos los casos positivos, reduciendo al mínimo los falsos negativos, es decir, los frutos de café que no fueron detectados.
Además, el F1-Score del modelo es de 96.37%, una métrica que combina la precisión y el recall en un único valor equilibrado. Un F1-Score alto indica que el modelo tiene un rendimiento robusto en términos de precisión y recall, proporcionando un balance óptimo entre la detección correcta de frutos y la minimización de errores.
En la Figura 7 se observa que el tiempo promedio de detección por imagen de cafeto utilizando YOLOv5 es de 17.9 segundos. Este tiempo incluye todo el procesamiento necesario para identificar y etiquetar los frutos de café en cada imagen.
Figure 7.
Gráfico de barra del tiempo promedio de detención por imagen de cafeto. Fuente: Elaboración Propia.
Figure 7.
Gráfico de barra del tiempo promedio de detención por imagen de cafeto. Fuente: Elaboración Propia.