jueves, 13 de febrero de 2014

¿Qué es el Proyecto IMPACT? Solucionando los problemas de la digitalización en las bibliotecas

Esta semana nos hemos encontrado con esta noticia relativa a la digitalización, La Biblioteca Nacional  se une al Centro de Competencia en Digitalización IMPACT pero... ¿Que es el el Poyecto IMPACT ? El proyecto impulsará la innovación en la tecnología OCR y tecnología del lenguaje para el procesamiento de documentos históricos y la recuperación , y tiene como objetivo compartir conocimientos para fortalecer la capacidad de digitalización en toda Europa.




En la visión i2010 de una biblioteca digital europea , la UE puso en marcha un ambicioso plan de proyectos de digitalización a gran escala transformando el patrimonio impreso de Europa en recursos digitales disponibles . 

El objetivo de la plena integración de contenido intelectual a la información y tecnologías de la comunicación moderna sólo puede lograrse mediante la digitalización de texto completo : la transformación de las imágenes digitales de los libros escaneados en texto electrónico .

En los últimos 2-3 años la digitalización masiva se ha convertido en uno de los temas más destacados en el mundo de las bibliotecas . 

Fuente
Hoy en día, un número de bibliotecas avanzadas de Europa  escanean millones de páginas cada año y gran escala . Sin embargo , estos esfuerzos pueden hacer frente a sólo una fracción del patrimonio total disponible en instituciones de la memoria cultural. El material digitalizado se está convirtiendo en disponible muy lentamente y en cantidades demasiado pequeñas (aunque como sabéis estamos compartiendo con vosotros las bibliotecas digitales y virtuales) , por tres razones.
  1. Hay una falta de conocimiento institucional y experiencia previa . Esto es un problema para la gran mayoría de las bibliotecas , museos y archivos de Europa.
  2. Los costes de texto electrónico con todas las funciones de los documentos históricos son demasiado altos . Por ejemplo el precio que se baraja es de  alrededor de 1 euro por página , por lo que un libro puedes llegar a costar  1.000 euros.
  3.  Reconocimiento de texto automatizado , realizado por reconocimiento óptico de caracteres (OCR) que no  produce resultados satisfactorios para los documentos históricos en los motores de búsqueda.

El proyecto IMPACT eliminará muchas de estas barreras . El proyecto impulsará la innovación en la tecnología OCR y tecnología del lenguaje para el procesamiento de documentos históricos y la recuperación , y tiene como objetivo compartir conocimientos para fortalecer la capacidad de digitalización en toda Europa. 


Fuente
El Centro de Competencia se creó con el fin de proporcionar un punto de entrada del servicio central para todas las bibliotecas, archivos y museos que participan en la digitalización del material textual.

El consorcio reúne a veintiséis bibliotecas nacionales y regionales, instituciones de investigación y los proveedores comerciales , quienes compartirán sus conocimientos y mejores prácticas , desarrollando herramientas innovadoras para mejorar las capacidades de los motores de OCR y la accesibilidad de los textos digitalizados y sentará las bases para los programas de digitalización masiva que tendrá lugar durante la próxima década

Con la BNE, ya son ocho las bibliotecas nacionales (España, Francia, Holanda, Suecia, República Checa, Finlandia, Letonia y Gran Bretaña) que forman parte de este consorcio sin ánimo de lucro nacido en 2011 de la mano del proyecto homónimo de la Comisión Europea.

Desde su creación en 2011, y con la dirección de la Fundación Biblioteca Virtual Miguel de Cervantes, IMPACT no ha dejado de crecer. En este momento aglutina a una treintena de miembros tan prestigiosos como el Instituto de Investigación Fraunhofer (Alemania), el Centro de Supercomputación de Poznan (Polonia), la Universidad de Salford (Gran Bretaña), la Biblioteca Digital de California, Contentra Technologie o las universidades de Barcelona, Complutense de Madrid, Salamanca y Gotemburgo (Suecia), además de las bibliotecas nacionales ya mencionadas. De hecho algunas de las empresas de digitalización ya se han unido al proyecto, cómo nos comentó Marta Framit de Vinfra como nos comentó en la entrevista que nos concedió a Documania o Libnova.

Fuente
Formado por expertos en digitalización, y con la dirección de la Fundación Biblioteca Virtual Miguel de Cervantes, el Centro de Competencia IMPACT asesora, coordina y da apoyo a sus miembros, empresas, bibliotecas e instituciones públicas y privadas, al tiempo que desarrolla una red de colaboradores que comparten los últimos avances científicos y tecnológicos en este campo. IMPACT sirve de puente y canal de comunicación, así como de lugar de discusión y encuentro, para facilitar el acceso y la preservación de textos y documentos históricos.  Así gracias a la Biblioteca Virtual Miguel de Cervantes hemos podido conocer la página de  Facebook El CoC IMPACT.

Durante los próximos días 19 y 20 de mayo se celebrarán en la BNE los Digitisation Days, que reunirán a investigadores y profesionales en busca de nuevos enfoques para la creación, transformación y explotación de documentos históricos en formato digital.

Ahora sólo queda seguir de cerca este Proyecto y ver sus avances.

No hay comentarios :

Publicar un comentario