segunda-feira, 27 de setembro de 2010

Em Pauta: Bancos de Imagens e Indexação

Os Bancos de Imagens na internet têm crescido absurdamente.  Nem sempre a tarefa de encontrar uma fotografia desejada é fácil, pois a quantidade excessiva de imagens torna esse processo dificultoso. Para uma eficiente recuperação de imagens é necessário que esta tenha sido indexada ao ser disponibilizada.

Uno de los principales problemas que presenta la descripción de este material es la forma en la que se representan los conceptos implícitos en ellos dada su peculiar riqueza visual y de contenido. Esto requiere de una verbalización de los mismos mediante un análisis documental, materializado en la delimitación de categorías, el uso de descriptores y la redacción de títulos [...]. (MUÑOZ CASTAÑO, 2001, p. 6).

A indexação de fotografias e documentos é feita de forma totalmente diferente. Atualmente a indexação de fotografias tem utilizado o uso combinado de conceito e conteúdo. 

O conceito está ligado a elementos que dizem respeito ao assunto, podendo, estes elementos serem concretos (imagem de uma árvore, um livro, um computador) e abstratos (emoções, por exemplo), essa leitura é muito subjetiva, portanto terá variações ao ser interpretada por diferentes indexadores. O conteúdo são atributos tais como: cor, textura, formato, orientação espacial, planos, locação da imagem, dimensões.

Na abordagem que se baseia no conteúdo, a indexação é realizada de modo automático, por algoritmos computacionais, através da extração de características de cor, textura e arranjo de figuras geométricas presentes na imagem. Na indexação com base em conceitos, as imagens são representadas por uma lista de palavras-chave que se referem às informações presentes na imagem. A indexação por conteúdo opera no nível sintático, enquanto a indexação por conceitos opera no nível semântico. (MANINI; LIMA-MARQUES; MIRANDA, 2007, p. 2).

A busca avançada utiliza campos que combinam esses e outros elementos, filtrando e especificando a busca de maneira significativa. 

Para melhorar a recuperação de imagens fotográficas há a necessidade de representar o conteúdo informacional (o que a imagem mostra) e a sua expressão fotográfica (como a imagem mostra). (MANINI; LIMA-MARQUES; MIRANDA, 2007, p. 2).

Desse modo, quanto mais informações um banco de imagens disponibilizar sobre uma fotografia mais recursos o usuário terá para filtrá-la e recuperá-la. Elementos como autor, data, assunto, cor, textura, forma, orientação, ponto de vista, planos devem ser utilizados para indexação, facilitando a recuperação de imagens.

O uso de vocabulários controlados para padronização de descritores utilizados como palavras-chave deve ser pensado para uma eficácia do banco de imagens. A possibilidade de os usuários acrescentarem tags às imagens é um recurso extremamente importante no mundo da web 2.0 e isso deve ser pensado também.

A precisão nos resultados de pesquisa que associe requisitos de conteúdo e conceito dependerá exclusivamente do indexador. Além disso, cada banco de imagens, sendo estes especializados, devem ater para questões particulares e de interesse de seus usuários, caso algum outro atributo seja de interesse para a comunidade que utiliza o banco de imagens, estes devem ser disponibilizados.

A Fundação Biblioteca Nacional possui um manual para indexação de imagens fotográficas e lembra das particularidades de cada na indexação de fotografias em diferentes contextos:

Dificilmente nossos critérios serão iguais àqueles de outras instituições detentoras de acervos fotográficos, já que uma imagem pode ter vários significados e usos — conseqüentemente, terão também assuntos diversos. Portanto, o objetivo deste manual é direcionar a visão do indexador para o ponto de vista da instituição, que se baseia no tipo de acervo que possui, no tipo de usuário diversificado que atende e nas suas características de biblioteca nacional.(ALVES; VALERIO, 1998, p. 7).

Aqui podem ser encontradas alguns comentários de como as imagens são indexadas no Google Imagens e isto pode facilitar quando formos fazer uma busca por imagens, entender como funciona a indexação é um grande passo para uma recuperação satisfatória.



REFERÊNCIAS:

ALVES, Mônica Carneiro; VALERIO, Sergio Apelian. Manual para indexação de documentos fotográficos. Rio de Janeiro: Fundação Biblioteca Nacional, Departamento de Processos Técnicos, 1998. Disponível em: < http://consorcio.bn.br/consorcio/manuais/manualfoto/Manualfoto.pdf>. Acesso em: 27 set. 2010.

MANINI, Miriam Paula; LIMA-MARQUES, Mamede; MIRANDA, Alex Sandro Santos. Ontologias: indexação e recuperação de fotografias baseadas na técnica fotográfica e no conteúdo da imagem. In: Encontro Nacional de Pesquisa em Ciência da Informação, 8., 2007, Salvador. Anais eletrônicos... Salvador: UFBA, 2007. Disponível em: < http://www.enancib.ppgci.ufba.br/artigos/GT2--151.pdf >. Acesso em: 26 set. 2010.


Muñoz Castaño, Jesús E. Bancos de imágenes: evaluación y análisis de los mecanismos de recuperación de imágenes. El profesional de la información, v. 10, n. 3, p. 4-18 , mar., 2001.
 




 
  

        Um mecanismo de recuperação de imagens que acho bem interessante e que trás resultados esteticamente lindos é o Multicolr Search Lab. É muito útil para quem trabalho com design ou arte, onde a cor das imagens é de interesse extremo. Essa ferramenta, desenvolvida pela  Idée Inc. filtra imagens no Flickr  sob licenças Creative Commons a partir das cores indicadas pelo usuário. O resultado é apresentado em miniatura (o que produz um efeito fantástico).

Um comentário:

N. disse...

O processo de indexação não é facil, ainda mais de imagens, onde a criatividade pode fluir ainda mais!
não adianta, o mundo estaria perdido sem profissionais da informaçao qualificados para recuperar informações! hehehe

Nalin Ferreira