Tecnologías big data para análisis y recuperación de imágenes web
- Rodríguez Vaamonde, Sergio
- Torre Bastida, Ana Isabel
- Garrote Contreras, Estíbaliz
ISSN: 1386-6710, 1699-2407
Año de publicación: 2014
Título del ejemplar: Big data y analítica digital
Volumen: 23
Número: 6
Páginas: 567-574
Tipo: Artículo
Otras publicaciones en: El profesional de la información
Resumen
Se aborda el análisis web desde el punto de vista de las imágenes, empleando tecnologías big data. Las imágenes cada vez tienen más peso en la web por lo que cualquier análisis que se realice deberá considerar este tipo de información. Los grandes volúmenes de imágenes existentes hacen necesaria la utilización de grandes infraestructuras de computación para realizar este tipo de trabajos, así como tecnologías de visión artificial específicas. Se muestran tecnologías big data que pueden ser utilizadas dentro del campo del análisis de imágenes a gran escala. Además, se propone una arquitectura que permite recuperar imágenes de una biblioteca de imágenes de forma eficiente y con un bajo coste computacional. Esta arquitectura puede servir como base para los análisis web e investigaciones que requieran un estudio detallado de las imágenes similares, sin la necesidad de disponer de hardware específico para ello.
Referencias bibliográficas
- Bajcsy, Peter; Vandecreme, Antoine; Amelot, Julien; Nguyen, Phuong; Chalfoun, Joe; Brady, Mary (2013). "Terabyte-sized image computations on Hadoop cluster platforms". En: IEEE Intl conf on big data, pp. 729-737. http://dx.doi.org/10.1109/BigData.2013.6691645
- Beyer, Mark A.; Laney, Douglas (2012). The importance of big data: A definition. Gartner. http://www.gartner.com/id=2057415
- Dean, Jeffrey; Ghemawat, Sanjay (2008). "MapReduce: simplified data processing on large clusters". Communications of the ACM, v. 51, n. 1, pp. 107-113. http://static.googleusercontent.com/media/research.google.com/es//archive/mapreduce-osdi04.pdf
- Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Li, Kai; Fei-Fei, Li (2009). "ImageNet: A large-scale hierarchical image database". IEEE Computer vision and pattern recognition (CVPR). http://dx.doi.org/10.1109/CVPR.2009.5206848
- Ferrari, Vittorio; Jurie, Frederic; Schmid, Cordelia (2010). "From images to shape models for object detection". Intl journal of computer vision, v. 87, n. 3, pp. 284-303. https://lear.inrialpes.fr/pubs/2010/FJS10/vitto-final-ijcv.pdf http://dx.doi.org/10.1007/s11263-009-0270-9
- Guo, Guodong; Dyer, Charles R. (2005). "Learning from examples in the small sample case: face expression recognition". IEEE Transactions on systems, man, and cybernetics, Part B: Cybernetics, v. 35, n. 3, pp. 477-488. ftp://ftp.cs.wisc.edu/computer-vision/repository/PDF/guo.2005.smc.pdf http://dx.doi.org/10.1109/TSMCB.2005.846658
- Instagram (2014). Instagram press stats. http://instagram.com/press
- Kulis, Brian; Grauman, Kristen (2009). "Kernelized locality-sensitive hashing for scalable image search". En: IEEE 12th Intl conf on computer vision, pp. 2130-2137. http://www.cs.utexas.edu/~grauman/papers/iccv2009-klsh.pdf http://dx.doi.org/10.1109/ICCV.2009.5459466
- Leavitt, Neal (2010). "Will NoSQL databases live up to their promise?". IEEE Computer, v. 43, n. 2, pp. 12-14. http://leavcom.com/pdf/NoSQL.pdf
- Lowe, David G. (2004). "Distinctive image features from scale-invariant keypoints". Intl journal of computer vision, v. 60, n. 2, pp. 91-110. http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf http://dx.doi.org/10.1023/B:VISI.0000029664.99615.94
- Lyman, Peter; Varian, Hal R. (2003). How much information? Berkeley, CA: University of California at Berkeley, School of Information Management and Systems. http://www2.sims.berkeley.edu/research/projects/how-much-info/how-much-info.pdf
- Martín, David; López-de-Ipiña, Diego; Alzua-Sorzabal, Aurkene; Lamsfus, Carlos; Torres-Manzanera, Emilio (2013). "A methodology and a web platform for the collaborative development of context-aware systems". Sensors, v. 13, n. 5, pp. 6032-6053. http://www.mdpi.com/1424-8220/13/5/6032 http://dx.doi.org/10.3390/s130506032
- Rodríguez-Vaamonde, Sergio; Ruiz-Ibáñez, Pilar; González-Rodríguez, Marta (2011). "Uso combinado de tecnologías semánticas y análisis visual para la anotación automática de imágenes y su recuperación". El profesional de la información, v. 21, n. 1, enero-febrero, pp. 27-33. http://www.computervisionbytecnalia.com/wp-content/uploads/2012/12/2012-JointUseSemantics.pdf http://dx.doi.org/10.3145/epi.2012.ene.04
- Saratxaga, Cristina L.; Picón, Artzai; Rodríguez-Vaamonde, Sergio; López-Carrera, Ángel; Echazarra, Jone; Bereciartua, Arantza; Garrote, Estibaliz (2014). "Plataforma de búsqueda de imágenes histológicas por similitud visual". En: XVII Congreso nacional de informática de la salud. http://www.computervisionbytecnalia.com/wp-content/uploads/2014/04/PlataformaBusquedadeImagenesHistologicas.pdf
- Slaney, Malcolm; Casey, Michael (2008). "Locality-sensitive hashing for finding nearest neighbors". IEEE Signal processing magazine, v. 25, n. 2, pp. 128-131. http://web.iitd.ac.in/~sumeet/Slaney2008-LSHTutorial.pdf
- Urbani, Jacopo; Kotoulas, Spyros; Oren, Eyal; Van-Harmelen, Fran (2009). "Scalable distributed reasoning using MapReduce". En: ISWC '09 Procs of the 8th Intl semantic web conf, pp. 634-649. http://www.few.vu.nl/~jui200/papers/ISWC09-Urbani.pdf http://dx.doi.org/10.1007/978-3-642-04930-9-40
- White, Brandyn; Yeh, Tom; Lin, Jimmy; Davis, Larry (2010). "Web-scale computer vision using mapreduce for multimedia data mining". En: Procs of the 10th Intl workshop on multimedia data mining, pp. 1-10. http://www.umiacs.umd.edu/~lsd/papers/brandyn-kdd-cloud.pdf http://dx.doi.org/10.1145/1814245.1814254
- Yan, Yuzhong; Huang, Lei (2014). "Large-scale image processing research cloud". En: Cloud computing 2014, The 5thIntl conf on cloud computing, grids, and virtualization, pp. 88-93. http://www.thinkmind.org/index.php?view=article&articleid=cloud-computing-2014-4-20-20069
- Yen, Stephen (2009). "NoSQL is a horseless carriage". NoSQL Oakland.