1. Pre procesamiento de imágenes sub-acuáticas de peces en
criaderos
Alberto Ceballos
Universidad del Magdalena
PLANTEAMIENTO DEL PROBLEMA: identificar peces en criaderos para medirlos y pesarlos
automáticamente, con el fin de facilitar, entre otros, la determinación de cantidad de alimento
necesario para estos. Se requiere calcular las equivalencias pixel-unidad de medida. Asimismo, se
encontraron tres grandes dificultades en la fase de pre-procesamiento
Iluminación poco balanceada
Falta de contraste/color
Presencia de ruido
Para la fase de procesamiento primero que todo se procedía a adquirir la imagen luego al
preprocesamiento, segmentación y por ultimo a determinar orientación y eje principal.
Los montajes más adecuados para esta estimación de biomasa en estanques consisten en una
cámara ubicadajuntoa un conductoo túnel por el que se esperaque circulenlospeces, a menudo
lospecessonretroiluminados ose colocaun fondoblancopara así poderfacilitarlasegmentación.
Los entornos subacuáticos debidoasusatributos particulares añadenal procesode tratamientode
la imagen una serie de dificultades adicionales tales como:
Deficiencia en la visibilidad
Prevalencia de tonos específicos
Esto debido ala densidad del medioylarefracción de laluz que reduce laintensidad comofunción
de la profundidad, perdiendo las gamas de color diferentes al azul de forma gradual.
Para dichos inconvenientes explicados anteriormente se realizaron técnicasentre ellas, lastécnicas
de restauración, que intentan definir un modelo que simule la degradación para utilizarlo
posteriormente enlade reconstrucción de la imagenoriginal y la técnicade mejoramiento,el cual
pretende mejorar la visibilidad de la imagen mediante la manipulación de sus componentes
MEJORAMIENTO DE IMÁGENES SUBACUATICAS
Técnicas basadas en estiramiento y manipulación de histogramas y contraste
Técnicas basadas en modelo retinex
Técnicas basadas en filtros
Técnicas mixtas
Las metodologías de evaluación se tuvieron presente la evaluación subjetiva donde se tiene en
cuanta un criterio de percepción de color y visibilidad y la evaluación objetiva donde determina la
2. calidad del método según la cantidad de bordes que se detectan mediante un algoritmo de
detección de bordes y análisis de los histogramas de las imágenes procesadas.
En conclusión, los montajes basados en una única cámara en entorno controlado simplifican las
tareas de procesamiento, segmentación y medición y que, durante la evaluación subjetiva, se
observó una mejora notable del color, sin generación excesiva de artefactos, al trabajar sobre el
modelocombinadoRGB-HSV. Sinembargo,enlasimágenesdonde nohayunatotalidaddominante,
FH-CLAHE HSV-FB es la mejor opción.
Un enfoque heurístico para el pre-procesamiento de
superficies tridimensionales
Nallig Leal
Universidad Autónoma del Caribe
Para procederaunareconstrucciónde imagenen3dprimeroquetodose deberealizarunacaptura
del objeto con diferentesvistas,luegose pasa a un procesamiento de imagen para lograr obtener
los puntos del objeto esto se realiza atraves de algoritmos, detección de bordes, mapa de
profundidad, como se tiene varias capas del objeto se tendrá que proceder a otro proceso muy
importante como el procesos de registros, donde las diferentes caras son mezcladas en una sola,
luegose procede al pre-procesamientoque esdonde se eliminael ruido,simplificación,llenadode
huecosy finalmente se reconstruye lasuperficiey se obtiene la representación visual del objeto.
Problemas de la reconstrucción en 3D es necesario para algunas aplicaciones por cuestionesde
manejo de memoria y costo computacional,reducir el número de puntosen la nube,es necesario
hacer un diezmado, pero al hacerlo se puede perder información valiosa, el algoritmo tienen que
lidiar con eso y saber qué puntos puede quitar las técnicas heurísticas nos ayudan a no tener que
combatir con problemas no condicionados.
En la reconstrucción de la superficie, se hace necesario mantener características y detalles finos
como lo son: bordes, esquemas, etc.
Soluciones heurísticas:
Grandes volúmenes de información: simplificación basada en algoritmos genéticos (AG) y
mapas Auto-asociativos
Orientación de la superficie: calculo normales basada en redes neuronales artificiales
Representaciónde detallesfinos:cálculode pesosde superficie NURBSusandoestrategias
evolutivas
En conclusión, las técnicas heurísticas suelen construir una aproximación que genera nivelesde
precisión adecuados, de acuerdo con la parametrización establecida por El usuario.
3. Las técnicas basadas en heurísticas permiten mitigar el costo computacional de otras técnicas de
optimización y búsqueda de soluciones aplicables a problemas mal condicionados que no tienen
única solución. Las técnicas heurísticas simplifican la solución de algunos problemas presentados
durante la reconstrucción 3D
Clasificación de segmentos de video utilizando
representaciones visuales y lingüísticas
Pedro Atencio
Instituto Tecnológico Metropolitano, Medellín
Primero que todo para entrar en contexto hay que definir segmentos de video, que tiene como
significado secuencias de cuadros consecutivos que tienen relación visual o semántica.
La aproximación más común a la hora de segmentar un video consiste en realizar un muestreo
uniforme, otras aproximaciones se basan en el agrupamientode cuadros consecutivos a partir de
características visuales y temporales, por ejemplo, agrupamiento por color y por flujo óptico.
Lo anterior ya aplicado podemos ver que en diversas tareas de análisis de video tales como
búsquedas de video, clasificación de videos y generación de resúmenes de video, entre otras, es
necesario determinar los segmentos que conforman el video.
Tecnologías relacionadas:
Aprendizaje profundo (Deep learning)
Aprendizaje de extremo a extremo (end- to- end)
Representaciones lingüísticas vectoriales (Word-embeddings-vectors).
La metodologíaque se llevóacabofue la siguiente:primeroque todose procedió alaselecciónde
cuadros, seguido de la descripción, clasificación y agrupamiento.
En la selecciónde cuadrossiempre esposible analizar todosloscuadrosdel video,aunque el costo
computacional es un factor a tener en cuenta en caso de utilizar esta aproximación.
Se utiliza un muestreo uniforme de un cuadro por segundo y se parte del supuesto de que un
segundo de video es la unidad mínima para un segmento y por otra parte, para un muestreo
promedio de 30 cuadros por segundo, no ocurriría una variación significativa visual o semántica.
Descripción: se utiliza un clasificador basado en redes neuronales profundas. Prácticamente, la
arquitectura de red VGG-16.
Preentrenada con la base de datos imageNet.
4. Esta arquitecturapuede reconocer1000categoriasvisualesenunaimagenylacomunidadcientífica
la ha utilizado de forma exitosa en diversas aplicaciones.
Clasificación: la representación GloVe es posteriormente procesada mediante una secuencia de
convoluciones 1D y maxpooling. La representación obtenida mediante las capas anteriores es
ingresadaauna serie de capastotalmente conectadas,lacapafinal tiene unafunciónde activación
softmax-one-hot encodding.
Agrupamiento:filtradode medianaconventanade anchurakconel objetivode reducirlavariación
en las categorías semánticas detectadas en segmentos consecutivos.
Generación de grupos de segmentos consecutivos que presente igual categoría semántica.
En conclusión, se propone un método basado en una aproximación visual y lingüística para la
estimación de segmentos de video. El carácter modular del método propuesto hace posible la
modificacióndeaspectoscomolaredde clasificaciónvisual,elmodelode representaciónlingüística,
el clasificador lingüístico o el dataset utilizado para la clasificación semántica.
Es posible generar resultados interesantes utilizando arquitectura de redes neuronales modernas
pre-entrenadas, lo cual agiliza la construcción de sistemas de este tipo. Como trabajo futuro se
identificalaposibilidadde generarresúmenesde videode formaautomática,utilizandoelesquema
anterior.