La editorial SDVIG PRESS acaba de iniciar un plan piloto para digitalizar obras fundamentales de las humanidades y las ciencias sociales que, por su antigüedad, están libres de derechos editoriales.
El proyecto no consiste sólo en escanear los documentos y ponerlos a libre disposición, lo que de por sí ya es meritorio y más aún tratándose de obras completas y no de libros aislados. En muchas ocasiones, el lector se encuentra con documentos en formato pdf en los que no puede buscar un término específico ni copiar una parte del mismo que quiera citar; la causa: el pdf ha sido compuesto a partir de imágenes, que es lo normal cuando se escanea documentos. No le queda sino volver a copiar el texto que le interesa y aguzar la vista para encontrar el término leyendo todo el documento. Evidentemente, eso no es nada fácil ni rápido cuando el documento tiene cientos de páginas. Algunos optaron por pasar los documentos a formatos de Word, pero el costo era reducir la fiabilidad de la fuente, ya que en ellos el documento no se presenta tal como fue originalmente publicado y está sujeto a manipulación, lo que es importante especialmente al momento de citar la paginación de la edición impresa y que es precisamente la ventaja del formato pdf. En consecuencia, la alternativa fue desarrollar, dentro del mismo formato pdf, un sistema de "reconocimiento óptico de caracteres" (OCR) que, a partir de la imagen, realizara automáticamente un reconocimiento de las letras contenidas en cada página y convirtiera a la imagen en texto. La imagen del documento no cambia, permanece fotográficamente tal como fue escaneada, pero ya es posible sombrear las palabras y copiarlas. Este sistema, que puede ser llevado a cabo por infinidad de programas, es utilizado en este proyecto de la editorial SDVIG PRESS, ya que contar con toda una obra completa y no poder realizar búsquedas precisas en ella sería sumamente desalentador, dados los actuales alcances tecnológicos y las limitaciones de los -a veces inexistentes- índices de términos. El problema que persiste es que, al ser un proceso automático, hay ocasiones, sobre todo cuando las tipografías son especiales o cuando hay términos en otros idiomas, en que la palabra resultante, cuando se copia el texto sombreado, no coincide con la palabra de la imagen. En algunos casos se trata de confusiones mínimas (por ejemplo, confundiendo el cero por la letra o) y en otros no hay ninguna legibilidad del texto resultante. Ello, obviamente, afecta también a la búsqueda de términos, que no aparecerán no porque no estén en el documento, sino porque el OCR los ha reconocido mal. Eso sin contar que el OCR no discrimina entre el texto principal y otros textos que no debieran ser incluidos, tales como sellos de las bibliotecas o anotaciones manuscritas de los lectores. Teniendo esto en cuenta, el proyecto en mención propone limpiar y corregir manualmente el "ruido" y los errores que pudiesen aparecer luego del escaneado de los documentos. Ese trabajo, sin embargo, es largo y pesado. Por ese motivo, el plan piloto solicita la colaboración de profesores, estudiantes, investigadores o simples interesados, que se encarguen de realizar esa labor de limpieza y corrección.
Como primer objetivo, este proyecto se ha propuesto poner a libre disposición las obras completas de Max Scheler, destacado discípulo directo de Husserl que es cada vez más estudiado por un renovado interés por la fenomenología temprana, pero especialmente porque llevó a cabo una fenomenología de las emociones y de los valores en cuyo centro está una sólida teoría personalista de la ética. Los editores señalan que, de tener éxito este plan piloto, el próximo objetivo será la digitalización del corpus completo de la fenomenología temprana, en la cual se encuentran importantes y aún poco conocidos fenomenólogos como Johannes Daubert, Alexander Pfänder, Moritz Geiger, Hedwig Conrad-Martius, Dietrich von Hildebrand, Maximilian Beck, Hans Lipps y Roman Ingarden, además de otros más conocidos como Martin Heidegger, Karl Jaspers, Edith Stein y Alexandre Koyré. Menciono de manera particular a Moritz Geiger, uno de los más importantes y tempranos estudiosos interesados en llevar a cabo una estética fenomenológica que tuvo recepción en Hispanoamérica y fue traducida al castellano hace unas décadas, pero que hoy, ante el resurgimiento del interés por la estética (en parte, contra las teorías idealistas del arte), está siendo retomado. Otro autor importante para la estética, incluyendo a la estética musical, es sin duda Roman Ingarden.
Para participar del proyecto hace falta sólo registrarse. Los documentos en pdf están siendo colgados en la misma página del proyecto y con dicho registro se puede acceder a ellos. Por mínima que pueda ser, toda colaboración es útil; aunque se trate de corregir unas pocas páginas.
Este proyecto es posible también gracias al apoyo del Central European Institute of Philosophy, la revista Horizon: Studies in Phenomenology, la Max Scheler Gesellschaft, la North American Society for Early Phenomenology y la Romanian Society for Phenomenology.
Los textos de Scheler que están disponibles para su digitalización son:
- Beiträge zur Feststellung der Beziehungen zwischen den logischen und ethischen Prinzipien
- Die transzendentale und die psychologische Methode
- Kultur und Religion
- Drei kleinere Veröffentlichungen
- R. Euckens Religionsbegriff
- Zur Phänomenologie und Theorie der Sympathiegefühle und von Liebe und Hass
- Ethik. Eine kritische Übersicht der Ethik der Gegenwart
- Vom Umsturz der Werte: Abhandlungen und Aufsätze (Band 1)
- Vom Umsturz der Werte: Abhandlungen und Aufsätze (Band 2)
- Vom Ewigen im Menschen
- Der Formalismus in der Ethik und die materielle Wertethik: Neuer Versuch der Grundlegung eines ethischen Personalismus
- Über Ressentiment und moralisches Werturteil. Zeitschrift für Pathopsychologie 1
Aquí la página Web del proyecto.
El proyecto no consiste sólo en escanear los documentos y ponerlos a libre disposición, lo que de por sí ya es meritorio y más aún tratándose de obras completas y no de libros aislados. En muchas ocasiones, el lector se encuentra con documentos en formato pdf en los que no puede buscar un término específico ni copiar una parte del mismo que quiera citar; la causa: el pdf ha sido compuesto a partir de imágenes, que es lo normal cuando se escanea documentos. No le queda sino volver a copiar el texto que le interesa y aguzar la vista para encontrar el término leyendo todo el documento. Evidentemente, eso no es nada fácil ni rápido cuando el documento tiene cientos de páginas. Algunos optaron por pasar los documentos a formatos de Word, pero el costo era reducir la fiabilidad de la fuente, ya que en ellos el documento no se presenta tal como fue originalmente publicado y está sujeto a manipulación, lo que es importante especialmente al momento de citar la paginación de la edición impresa y que es precisamente la ventaja del formato pdf. En consecuencia, la alternativa fue desarrollar, dentro del mismo formato pdf, un sistema de "reconocimiento óptico de caracteres" (OCR) que, a partir de la imagen, realizara automáticamente un reconocimiento de las letras contenidas en cada página y convirtiera a la imagen en texto. La imagen del documento no cambia, permanece fotográficamente tal como fue escaneada, pero ya es posible sombrear las palabras y copiarlas. Este sistema, que puede ser llevado a cabo por infinidad de programas, es utilizado en este proyecto de la editorial SDVIG PRESS, ya que contar con toda una obra completa y no poder realizar búsquedas precisas en ella sería sumamente desalentador, dados los actuales alcances tecnológicos y las limitaciones de los -a veces inexistentes- índices de términos. El problema que persiste es que, al ser un proceso automático, hay ocasiones, sobre todo cuando las tipografías son especiales o cuando hay términos en otros idiomas, en que la palabra resultante, cuando se copia el texto sombreado, no coincide con la palabra de la imagen. En algunos casos se trata de confusiones mínimas (por ejemplo, confundiendo el cero por la letra o) y en otros no hay ninguna legibilidad del texto resultante. Ello, obviamente, afecta también a la búsqueda de términos, que no aparecerán no porque no estén en el documento, sino porque el OCR los ha reconocido mal. Eso sin contar que el OCR no discrimina entre el texto principal y otros textos que no debieran ser incluidos, tales como sellos de las bibliotecas o anotaciones manuscritas de los lectores. Teniendo esto en cuenta, el proyecto en mención propone limpiar y corregir manualmente el "ruido" y los errores que pudiesen aparecer luego del escaneado de los documentos. Ese trabajo, sin embargo, es largo y pesado. Por ese motivo, el plan piloto solicita la colaboración de profesores, estudiantes, investigadores o simples interesados, que se encarguen de realizar esa labor de limpieza y corrección.
Como primer objetivo, este proyecto se ha propuesto poner a libre disposición las obras completas de Max Scheler, destacado discípulo directo de Husserl que es cada vez más estudiado por un renovado interés por la fenomenología temprana, pero especialmente porque llevó a cabo una fenomenología de las emociones y de los valores en cuyo centro está una sólida teoría personalista de la ética. Los editores señalan que, de tener éxito este plan piloto, el próximo objetivo será la digitalización del corpus completo de la fenomenología temprana, en la cual se encuentran importantes y aún poco conocidos fenomenólogos como Johannes Daubert, Alexander Pfänder, Moritz Geiger, Hedwig Conrad-Martius, Dietrich von Hildebrand, Maximilian Beck, Hans Lipps y Roman Ingarden, además de otros más conocidos como Martin Heidegger, Karl Jaspers, Edith Stein y Alexandre Koyré. Menciono de manera particular a Moritz Geiger, uno de los más importantes y tempranos estudiosos interesados en llevar a cabo una estética fenomenológica que tuvo recepción en Hispanoamérica y fue traducida al castellano hace unas décadas, pero que hoy, ante el resurgimiento del interés por la estética (en parte, contra las teorías idealistas del arte), está siendo retomado. Otro autor importante para la estética, incluyendo a la estética musical, es sin duda Roman Ingarden.
Para participar del proyecto hace falta sólo registrarse. Los documentos en pdf están siendo colgados en la misma página del proyecto y con dicho registro se puede acceder a ellos. Por mínima que pueda ser, toda colaboración es útil; aunque se trate de corregir unas pocas páginas.
Este proyecto es posible también gracias al apoyo del Central European Institute of Philosophy, la revista Horizon: Studies in Phenomenology, la Max Scheler Gesellschaft, la North American Society for Early Phenomenology y la Romanian Society for Phenomenology.
Los textos de Scheler que están disponibles para su digitalización son:
- Beiträge zur Feststellung der Beziehungen zwischen den logischen und ethischen Prinzipien
- Die transzendentale und die psychologische Methode
- Kultur und Religion
- Drei kleinere Veröffentlichungen
- R. Euckens Religionsbegriff
- Zur Phänomenologie und Theorie der Sympathiegefühle und von Liebe und Hass
- Ethik. Eine kritische Übersicht der Ethik der Gegenwart
- Vom Umsturz der Werte: Abhandlungen und Aufsätze (Band 1)
- Vom Umsturz der Werte: Abhandlungen und Aufsätze (Band 2)
- Vom Ewigen im Menschen
- Der Formalismus in der Ethik und die materielle Wertethik: Neuer Versuch der Grundlegung eines ethischen Personalismus
- Über Ressentiment und moralisches Werturteil. Zeitschrift für Pathopsychologie 1
Aquí la página Web del proyecto.
No hay comentarios:
Publicar un comentario