Tecnologías big data para análisis y recuperación de imágenes web

  1. Rodríguez Vaamonde, Sergio
  2. Torre Bastida, Ana Isabel
  3. Garrote Contreras, Estíbaliz
Revista:
El profesional de la información

ISSN: 1386-6710 1699-2407

Año de publicación: 2014

Título del ejemplar: Big data y analítica digital

Volumen: 23

Número: 6

Páginas: 567-574

Tipo: Artículo

DOI: 10.3145/EPI.2014.NOV.02 DIALNET GOOGLE SCHOLAR lock_openAcceso abierto editor

Otras publicaciones en: El profesional de la información

Resumen

Se aborda el análisis web desde el punto de vista de las imágenes, empleando tecnologías big data. Las imágenes cada vez tienen más peso en la web por lo que cualquier análisis que se realice deberá considerar este tipo de información. Los grandes volúmenes de imágenes existentes hacen necesaria la utilización de grandes infraestructuras de computación para realizar este tipo de trabajos, así como tecnologías de visión artificial específicas. Se muestran tecnologías big data que pueden ser utilizadas dentro del campo del análisis de imágenes a gran escala. Además, se propone una arquitectura que permite recuperar imágenes de una biblioteca de imágenes de forma eficiente y con un bajo coste computacional. Esta arquitectura puede servir como base para los análisis web e investigaciones que requieran un estudio detallado de las imágenes similares, sin la necesidad de disponer de hardware específico para ello.

Referencias bibliográficas

  • Bajcsy, Peter; Vandecreme, Antoine; Amelot, Julien; Nguyen, Phuong; Chalfoun, Joe; Brady, Mary (2013). "Terabyte-sized image computations on Hadoop cluster platforms". En: IEEE Intl conf on big data, pp. 729-737. http://dx.doi.org/10.1109/BigData.2013.6691645
  • Beyer, Mark A.; Laney, Douglas (2012). The importance of big data: A definition. Gartner. http://www.gartner.com/id=2057415
  • Dean, Jeffrey; Ghemawat, Sanjay (2008). "MapReduce: simplified data processing on large clusters". Communications of the ACM, v. 51, n. 1, pp. 107-113. http://static.googleusercontent.com/media/research.google.com/es//archive/mapreduce-osdi04.pdf
  • Deng, Jia; Dong, Wei; Socher, Richard; Li, Li-Jia; Li, Kai; Fei-Fei, Li (2009). "ImageNet: A large-scale hierarchical image database". IEEE Computer vision and pattern recognition (CVPR). http://dx.doi.org/10.1109/CVPR.2009.5206848
  • Ferrari, Vittorio; Jurie, Frederic; Schmid, Cordelia (2010). "From images to shape models for object detection". Intl journal of computer vision, v. 87, n. 3, pp. 284-303. https://lear.inrialpes.fr/pubs/2010/FJS10/vitto-final-ijcv.pdf http://dx.doi.org/10.1007/s11263-009-0270-9
  • Guo, Guodong; Dyer, Charles R. (2005). "Learning from examples in the small sample case: face expression recognition". IEEE Transactions on systems, man, and cybernetics, Part B: Cybernetics, v. 35, n. 3, pp. 477-488. ftp://ftp.cs.wisc.edu/computer-vision/repository/PDF/guo.2005.smc.pdf http://dx.doi.org/10.1109/TSMCB.2005.846658
  • Instagram (2014). Instagram press stats. http://instagram.com/press
  • Kulis, Brian; Grauman, Kristen (2009). "Kernelized locality-sensitive hashing for scalable image search". En: IEEE 12th Intl conf on computer vision, pp. 2130-2137. http://www.cs.utexas.edu/~grauman/papers/iccv2009-klsh.pdf http://dx.doi.org/10.1109/ICCV.2009.5459466
  • Leavitt, Neal (2010). "Will NoSQL databases live up to their promise?". IEEE Computer, v. 43, n. 2, pp. 12-14. http://leavcom.com/pdf/NoSQL.pdf
  • Lowe, David G. (2004). "Distinctive image features from scale-invariant keypoints". Intl journal of computer vision, v. 60, n. 2, pp. 91-110. http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf http://dx.doi.org/10.1023/B:VISI.0000029664.99615.94
  • Lyman, Peter; Varian, Hal R. (2003). How much information? Berkeley, CA: University of California at Berkeley, School of Information Management and Systems. http://www2.sims.berkeley.edu/research/projects/how-much-info/how-much-info.pdf
  • Martín, David; López-de-Ipiña, Diego; Alzua-Sorzabal, Aurkene; Lamsfus, Carlos; Torres-Manzanera, Emilio (2013). "A methodology and a web platform for the collaborative development of context-aware systems". Sensors, v. 13, n. 5, pp. 6032-6053. http://www.mdpi.com/1424-8220/13/5/6032 http://dx.doi.org/10.3390/s130506032
  • Rodríguez-Vaamonde, Sergio; Ruiz-Ibáñez, Pilar; González-Rodríguez, Marta (2011). "Uso combinado de tecnologías semánticas y análisis visual para la anotación automática de imágenes y su recuperación". El profesional de la información, v. 21, n. 1, enero-febrero, pp. 27-33. http://www.computervisionbytecnalia.com/wp-content/uploads/2012/12/2012-JointUseSemantics.pdf http://dx.doi.org/10.3145/epi.2012.ene.04
  • Saratxaga, Cristina L.; Picón, Artzai; Rodríguez-Vaamonde, Sergio; López-Carrera, Ángel; Echazarra, Jone; Bereciartua, Arantza; Garrote, Estibaliz (2014). "Plataforma de búsqueda de imágenes histológicas por similitud visual". En: XVII Congreso nacional de informática de la salud. http://www.computervisionbytecnalia.com/wp-content/uploads/2014/04/PlataformaBusquedadeImagenesHistologicas.pdf
  • Slaney, Malcolm; Casey, Michael (2008). "Locality-sensitive hashing for finding nearest neighbors". IEEE Signal processing magazine, v. 25, n. 2, pp. 128-131. http://web.iitd.ac.in/~sumeet/Slaney2008-LSHTutorial.pdf
  • Urbani, Jacopo; Kotoulas, Spyros; Oren, Eyal; Van-Harmelen, Fran (2009). "Scalable distributed reasoning using MapReduce". En: ISWC '09 Procs of the 8th Intl semantic web conf, pp. 634-649. http://www.few.vu.nl/~jui200/papers/ISWC09-Urbani.pdf http://dx.doi.org/10.1007/978-3-642-04930-9-40
  • White, Brandyn; Yeh, Tom; Lin, Jimmy; Davis, Larry (2010). "Web-scale computer vision using mapreduce for multimedia data mining". En: Procs of the 10th Intl workshop on multimedia data mining, pp. 1-10. http://www.umiacs.umd.edu/~lsd/papers/brandyn-kdd-cloud.pdf http://dx.doi.org/10.1145/1814245.1814254
  • Yan, Yuzhong; Huang, Lei (2014). "Large-scale image processing research cloud". En: Cloud computing 2014, The 5thIntl conf on cloud computing, grids, and virtualization, pp. 88-93. http://www.thinkmind.org/index.php?view=article&articleid=cloud-computing-2014-4-20-20069
  • Yen, Stephen (2009). "NoSQL is a horseless carriage". NoSQL Oakland.