Tecnologías big data para análisis y recuperación de imágenes web

Rodríguez Vaamonde, Sergio; Torre Bastida, Ana Isabel; Garrote Contreras, Estíbaliz

doi:10.3145/EPI.2014.NOV.02

Tecnologías big data para análisis y recuperación de imágenes web

Rodríguez Vaamonde, Sergio
Torre Bastida, Ana Isabel
Garrote Contreras, Estíbaliz

Revista:

El profesional de la información

ISSN: 1386-6710, 1699-2407

Año de publicación: 2014

Título del ejemplar: Big data y analítica digital

Volumen: 23

Número: 6

Páginas: 567-574

Tipo: Artículo

DOI: 10.3145/EPI.2014.NOV.02 DIALNET GOOGLE SCHOLAR Acceso abierto editor

Otras publicaciones en: El profesional de la información

Resumen

Se aborda el análisis web desde el punto de vista de las imágenes, empleando tecnologías big data. Las imágenes cada vez tienen más peso en la web por lo que cualquier análisis que se realice deberá considerar este tipo de información. Los grandes volúmenes de imágenes existentes hacen necesaria la utilización de grandes infraestructuras de computación para realizar este tipo de trabajos, así como tecnologías de visión artificial específicas. Se muestran tecnologías big data que pueden ser utilizadas dentro del campo del análisis de imágenes a gran escala. Además, se propone una arquitectura que permite recuperar imágenes de una biblioteca de imágenes de forma eficiente y con un bajo coste computacional. Esta arquitectura puede servir como base para los análisis web e investigaciones que requieran un estudio detallado de las imágenes similares, sin la necesidad de disponer de hardware específico para ello.

Referencias bibliográficas

Bajcsy, Peter; Vandecreme, Antoine; Amelot, Julien; Nguyen, Phuong; Chalfoun, Joe; Brady, Mary (2013). "Terabyte-sized image computations on Hadoop cluster platforms". En: IEEE Intl conf on big data, pp. 729-737. http://dx.doi.org/10.1109/BigData.2013.6691645
Beyer, Mark A.; Laney, Douglas (2012). The importance of big data: A definition. Gartner. http://www.gartner.com/id=2057415
Dean, Jeffrey; Ghemawat, Sanjay (2008). "MapReduce: simplified data processing on large clusters". Communications of the ACM, v. 51, n. 1, pp. 107-113. http://static.googleusercontent.com/media/research.google.com/es//archive/mapreduce-osdi04.pdf
Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Li, Kai; Fei-Fei, Li (2009). "ImageNet: A large-scale hierarchical image database". IEEE Computer vision and pattern recognition (CVPR). http://dx.doi.org/10.1109/CVPR.2009.5206848
Ferrari, Vittorio; Jurie, Frederic; Schmid, Cordelia (2010). "From images to shape models for object detection". Intl journal of computer vision, v. 87, n. 3, pp. 284-303. https://lear.inrialpes.fr/pubs/2010/FJS10/vitto-final-ijcv.pdf http://dx.doi.org/10.1007/s11263-009-0270-9
Guo, Guodong; Dyer, Charles R. (2005). "Learning from examples in the small sample case: face expression recognition". IEEE Transactions on systems, man, and cybernetics, Part B: Cybernetics, v. 35, n. 3, pp. 477-488. ftp://ftp.cs.wisc.edu/computer-vision/repository/PDF/guo.2005.smc.pdf http://dx.doi.org/10.1109/TSMCB.2005.846658
Instagram (2014). Instagram press stats. http://instagram.com/press
Kulis, Brian; Grauman, Kristen (2009). "Kernelized locality-sensitive hashing for scalable image search". En: IEEE 12th Intl conf on computer vision, pp. 2130-2137. http://www.cs.utexas.edu/~grauman/papers/iccv2009-klsh.pdf http://dx.doi.org/10.1109/ICCV.2009.5459466
Leavitt, Neal (2010). "Will NoSQL databases live up to their promise?". IEEE Computer, v. 43, n. 2, pp. 12-14. http://leavcom.com/pdf/NoSQL.pdf
Lowe, David G. (2004). "Distinctive image features from scale-invariant keypoints". Intl journal of computer vision, v. 60, n. 2, pp. 91-110. http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf http://dx.doi.org/10.1023/B:VISI.0000029664.99615.94
Lyman, Peter; Varian, Hal R. (2003). How much information? Berkeley, CA: University of California at Berkeley, School of Information Management and Systems. http://www2.sims.berkeley.edu/research/projects/how-much-info/how-much-info.pdf
Martín, David; López-de-Ipiña, Diego; Alzua-Sorzabal, Aurkene; Lamsfus, Carlos; Torres-Manzanera, Emilio (2013). "A methodology and a web platform for the collaborative development of context-aware systems". Sensors, v. 13, n. 5, pp. 6032-6053. http://www.mdpi.com/1424-8220/13/5/6032 http://dx.doi.org/10.3390/s130506032
Rodríguez-Vaamonde, Sergio; Ruiz-Ibáñez, Pilar; González-Rodríguez, Marta (2011). "Uso combinado de tecnologías semánticas y análisis visual para la anotación automática de imágenes y su recuperación". El profesional de la información, v. 21, n. 1, enero-febrero, pp. 27-33. http://www.computervisionbytecnalia.com/wp-content/uploads/2012/12/2012-JointUseSemantics.pdf http://dx.doi.org/10.3145/epi.2012.ene.04
Saratxaga, Cristina L.; Picón, Artzai; Rodríguez-Vaamonde, Sergio; López-Carrera, Ángel; Echazarra, Jone; Bereciartua, Arantza; Garrote, Estibaliz (2014). "Plataforma de búsqueda de imágenes histológicas por similitud visual". En: XVII Congreso nacional de informática de la salud. http://www.computervisionbytecnalia.com/wp-content/uploads/2014/04/PlataformaBusquedadeImagenesHistologicas.pdf
Slaney, Malcolm; Casey, Michael (2008). "Locality-sensitive hashing for finding nearest neighbors". IEEE Signal processing magazine, v. 25, n. 2, pp. 128-131. http://web.iitd.ac.in/~sumeet/Slaney2008-LSHTutorial.pdf
Urbani, Jacopo; Kotoulas, Spyros; Oren, Eyal; Van-Harmelen, Fran (2009). "Scalable distributed reasoning using MapReduce". En: ISWC '09 Procs of the 8th Intl semantic web conf, pp. 634-649. http://www.few.vu.nl/~jui200/papers/ISWC09-Urbani.pdf http://dx.doi.org/10.1007/978-3-642-04930-9-40
White, Brandyn; Yeh, Tom; Lin, Jimmy; Davis, Larry (2010). "Web-scale computer vision using mapreduce for multimedia data mining". En: Procs of the 10th Intl workshop on multimedia data mining, pp. 1-10. http://www.umiacs.umd.edu/~lsd/papers/brandyn-kdd-cloud.pdf http://dx.doi.org/10.1145/1814245.1814254
Yan, Yuzhong; Huang, Lei (2014). "Large-scale image processing research cloud". En: Cloud computing 2014, The 5thIntl conf on cloud computing, grids, and virtualization, pp. 88-93. http://www.thinkmind.org/index.php?view=article&articleid=cloud-computing-2014-4-20-20069
Yen, Stephen (2009). "NoSQL is a horseless carriage". NoSQL Oakland.

Fuente de los datos: Dialnet