Facultad de Ingeniería
URI permanente para esta comunidad
Examinar
Examinando Facultad de Ingeniería por Materia "Computer vision"
Mostrando 1 - 2 de 2
Resultados por página
Opciones de ordenación
Ítem Diseño y desarrollo de aplicación móvil para la clasificación de flora nativa chilena utilizando redes neuronales convolucionales(Universidade Federal do Paraná, 2022-01-22) Muñoz Villalobos, Ignacio Andrés; Bolt, Alfredo JoséIntroducción: Las aplicaciones móviles, a través de la visión artificial, son capaces de reconocer especies vegetales en tiempo real. Sin embargo, las actuales aplicaciones de reconocimiento de especies no consideran la gran variedad de especies endémicas y nativas de Chile, tendiendo a predecir erróneamente. Esta investigación presenta la construcción de un dataset de especies chilenas y el desarrollo de un modelo de clasificación optimizado e implementado en una aplicación móvil. Método: La construcción del dataset se realizó a través de la captura de fotografías de especies en terreno y selección de imágenes de datasets en línea. Se utilizaron redes neuronales convolucionales para desarrollar los modelos de predicción de imágenes. Se realizó un análisis de sensibilidad al entrenar las redes, validando con k-fold cross validation y efectuando pruebas con distintos hiperparámetros, optimizadores, capas convolucionales y tasas de aprendizaje, para seleccionar los mejores modelos y luego ensamblarlos en un solo modelo de clasificación. Resultados: El dataset construido se conformó por 46 especies, incluyendo especies nativas, endémicas y exóticas de Chile, con 6120 imágenes de entrenamiento y 655 de prueba. Los mejores modelos se implementaron en una aplicación móvil, donde se obtuvo un porcentaje de acierto de aproximadamente 95% con respecto al conjunto de pruebas. Conclusiones: La aplicación desarrollada es capaz de clasificar especies correctamente con una probabilidad de acierto acorde con el estado del arte de la visión artificial y de mostrar información de la especie clasificada.Ítem Negative sampling for triplet-based loss: improving representation in self-supervised representation learning(Springer, 2024-11-17) Manuel Alejandro Goyo; Hidalgo Barrientos, Mauricio FernandoSignificant strides have been made in artificial neural networks across various fields, necessitating extensive labeled data for effective training. However, the acquisition of such annotated data is both costly and labor-intensive. To address this challenge, Self-Supervised Representation Learning (SSRL) has emerged as a promising solution. One prominent SSRL method, Contrastive Self-Supervised Learning (CSL), enhances feature representations by discerning similarities and differences among samples in the feature space. Yet, accurately identifying dissimilar samples remains a persistent issue, limiting CSL’s effectiveness. In response, an innovative enhancement to CSL is proposed in this paper. Explicit negative sampling strategies using a binary classification algorithm within the feature space are introduced to distinguish between similar and dissimilar features precisely. Additionally, Triplet Loss, originally designed for tasks such as person re-identification and face recognition, is incorporated to further refine feature learning. Experimental evaluations on the CIFAR-10 and SVHN datasets validate the proposed method’s superiority in content-based image retrieval (CBIR) and classification tasks. Significant improvements are demonstrated in metrics such as mean average precision (MAP), accuracy, recall, precision, and F1-score compared to existing techniques. This framework contributes to the advancement of SSRL by enabling scalable neural network training on large datasets with minimal annotation, effectively bridging the gap between supervised and unsupervised learning paradigms.