Вы находитесь на странице: 1из 11

DeOptimoGenere GNU/Linux para traductores o cmo no morir en el intento jueves, 5 de enero de 2012 Vaya memorin!

Vuelvo tras un prolongado silencio. Como muchos sabris por mi twitter o FB las co sas no me han ido mal del todo en 2011 y trabajo no me falta, as que la tarea de actualizar esta bitcora se hace dura y en muchas ocasiones acaban venciendo las g anas de no volver a tocar el ordenador hasta el da siguiente o para qu nos vamos a engaar, es vagancia. Hoy toca hablar de una herramienta de gestin de memorias de traduccin (MT) que pos teriormente utilizaremos en nuestro programa de TAO, en mi caso OmegaT. A raz de un tuit de Kevin Lossner (@germanENtrans), lleg a mis odos por @saavedrama nuel la publicacin de un corpus hexalinge de las resoluciones de la Asamblea Gener al de la ONU, un memorin, vaya. Tras pegar un respingo y gritar un vivalamadrequeospari, me dispuse a zambullirme en cienes y cienes de segmentos, pero veris que hay tres opciones de descarga: Machine-friendly version (49.4/176.2 MBytes). This version contains no newli nes or insignificant whitespaces and is the version described in the paper. Human-friendly version (50/187 MBytes). This slightly-larger version has bee n pretty-printed to make it easier to review its content or to process it with n on-XML tools, like grep. I recommend downloading this version. Plain TM version (40.9/155.6 MBytes). In this version, voting segments are r emoved, footnotes are removed completely and symbols and lead markers are remove d (but the content is kept). This is a version suitable for import into commerci al TM tools, which may not be implementing full TMX spec. Me baj la tercera opcin porque quera evitar que OmegaT se volviera loco. Si las MT que tenemos en la carpeta 'tm' van pasaditas de turrones, el tiempo de respuesta en el arranque del programa y en las bsquedas puede parecernos eterno (15 segund os para buscar la palabra maldita stakeholders pueden ser muchos segundos). Tras descomprimir el zip, nos queda una memoria de traduccin en formato estndar (t mx) que podemos copiar-pegar directamente en la carpeta 'tm' de nuestro proyecto OmegaT (acurdate de pulsar F5 para volver a cargar el proyecto y que tenga en cu enta la MT que le acabas de aadir). El problema en este caso es que tendremos una MT con seis idiomas, funcionar igua l, porque en su infinita sabidura OmegaT buscar en los pares de lenguas que hayamos indicado al configurar el proyecto, pero si queremos limpiar esa MT tenemos a nues tra disposicin una herramienta llamada Olifant (para Window$). Edito: la versin de desarrollo para GNU/Linux del paquete Okapi, que incluye toda s sus herramientas, est en: http://okapi.opentag.com/snapshots (gracias Silvia). Olifant es una aplicacin. NET que permite cargar o importar MT en diferentes form atos (TMX o delimitadas por tabulaciones). Se pueden editar las unidades de trad uccin, sus atributos y cualquier otro dato asociado, adems de poder guardar o expo rtar datos en varios formatos. Dispone de una interfaz basada en tablas para nav egar fcilmente a travs de la MT, con funciones como: marcar segmentos duplicados y borrarlos, buscar y remplazar texto con expresiones regulares, filtrar las entr adas en funcin de diversos criterios, unir varias MT en una ya existente, exporta r parte de la TM, invertir el idioma de origen y el meta, etc. Precisamente lo q ue nos interesa es exportar parte de la MT, en este caso EN-ES.

Una vez descargado e instalado el programa, abrimos la MT (File-Open) Como puede verse, tenemos los 6 idiomas con sus 72341 segmentos! Vamos al lo: Tan simple como ejecutar File-Export. Se abrir un cuadro de dilogo en el que habr q ue poner el nombre de la nueva MT que vamos a crear. Una vez decidido, clica en Aceptar y se abrir otro cuadro de dilogo como este: Selecciona en las casillas de verificacin los idiomas correspondientes. En el men desplegable Style puedes seleccionar el estilo de MT: Default, SDLX, Transit, Wo rdfast, etc. La opcin Default es la ms adecuada ya que es un estndar que funcionar i ndependientemente del programa que utilices. Clica en OK y tras unos 10-15 segun dos el archivo ya estar listo en la carpeta que seleccionaste en el paso anterior . Si te pica la curiosidad, abre el archivo creado con Notepad o con un simple blo c de notas y vers la pinta que tiene una MT: Algo que parece tan feo en realidad es de una sencillez apabullante (qu atrevida es la ignorancia): Etiquetas de inicio y cierre con informacin sobre el idioma y el segmento equival ente en el otro idioma. Ya tenemos nuestra memoria, la copiamos en la carpeta 'tm' del proyecto OmegaT. Al iniciar el programa tardar un poquito ms, 20-30 segundos. Este tipo de memorion es, al igual que el de la DG de traduccin de la UE (ms grande si cabe que el de la ONU, el par EN-ES son ms de 300 MB, es decir, 507149 segmentos!!) son muy tiles a l a hora de hacer bsquedas terminolgicas (recuerda, para abrir el cuadro de bsquedas pulsa Ctrl+F)

En este caso ha tardado 4 segundos en buscar la palabra maldita y ha dado 412 re sultados. Los tiempos con la MT de la UE aumentan bastante, con todo y con eso, que arroje resultados en menos de 10 segundos con 300 MB de segmentos es todo un logro que el propio Kevin Lossner comenta en su blog y que supera a muchos prog ramas comerciales. Enredos Si te gusta enredar un poco ms y te atreves a aumentar la memoria de OmegaT, pued es hacerlo directamente en: - la lnea de comando (GNU/Linux) java -Xmx1024M -jar OmegaT.jar - Archivo OmegaT.l4J (Window$) 1024M de memoria van bastante bien, pero 2048 mejor :) Las pruebas que hice de bs queda con 2048 M arrojaron estos tiempos de respuesta: - MT ONU: 3 segundos - MT UE+ONU: 8 segundos

Por ltimo, tan solo decir que Olifant es una excelente herramienta para limpiar, fijar y dar esplendor a tus MT (aunque cometa el gran pecado de no estar disponi ble para otras plataformas). Enreda, prueba y no seas como yo: lee la ayuda en ln ea.

Habis probado el programa? Qu os ha parecido? Utilizis otras herramientas de gestin de MT? Espero vuestros comentarios. Publicado por Jose Luis en 11:01 3 comentarios: Enviar por correo electrnicoEscribe un blogCompartir con TwitterCompartir con Fac ebook lunes, 6 de junio de 2011 GoldenDict Alternativas al software propietario GoldenDict: interfaz para la administracin de diccionarios en lnea y locales GoldenDict es un programa OpenSource con licencia GNU/GPL y funciona con las pla taformas GNU/Linux, Windows y Mac. Se pueden consultar diccionarios en lnea y loc ales, adems de pginas como Wikipedia, Wikitionary, Urbandictionary, etc. GoldenDic t no es un diccionario, es la interfaz que nos permite consultar varios dicciona rios -similar al conocido Babylon- con formatos: .BGL (Babylon) .ifo/.dict./.idx/.syn (Stardict) Dictd .index/.dict(.dz) etc. Entre otras cosas, GoldenDict tiene caractersticas como la sugerencia de palabras clave basadas en la fontica, la posibilidad de escribir las palabras sin acentos , puntuacin o espacios o una funcin emergente para buscar palabras en todas las ap licaciones abiertas. Su uso facilita la tarea de bsqueda porque tienes a tiro de clic los diccionarios habituales: diccionarios de sinnimos, diccionarios monolinges y varios glosarios especializados descargados de forma gratuita aqu. Ejemplo de instalacin de un glosario una vez instalado el programa: descarga el diccionario/glosario (de babylon u otras webs); coloca el diccionario/glosario en una carpeta comn; Edit - Ditionaries - pestaa Files, botn Add y pon la ruta de la carpeta con lo s diccionarios, a continuacin, pulsa el botn Rescan Now u OK. Ejemplo de glosario de Babylon:

Vista de algunos de mis diccionarios: Interfaz de bsqueda: Trucos:

1. Usuarios de GNU/Linux: (esto es secreto, que no se entere nadie, ssssssssh) s i descargas un diccionario en formato .exe de babylon, basta con hacer un clic s ecundario en el archivo, descomprimirlo y haces un copia-pega del archivo con ex tensin .bgl en la carpeta donde tengamos todos los diccionarios y voil, ya tenemos otro diccionario! 2. Utilizar webs para buscar: vamos a Edit - Dictionaries F3 y en la pestaa Websi tes aadimos el nombre de la web en la que queremos buscar y la direccin para busca r, que suele ser algo as: Diccionario de la RAE: http://buscon.rae.es/draeI/SrvltGUIBusUsual?TIPO_HTML =2&TIPO_BUS=3&LEMA=%GDISO1% WordReference: http://www.wordreference.com/definicion/%GDISO1% Sinnimos de WordReference: http://www.wordreference.com/sinonimos/%GDISO1% Ingls-Espaol de WordReference: http://www.wordreference.com/en/es/translation. asp?spen=%GDWORD% Capito? Probad con %GDISO1% o con %GDWORD% Por ejemplo, estas dos son mis fuente ms habituales de consultas: http://www.cnrtl.fr/lexicographie/%GDWORD% http://www.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&index=ent &__index=ent&srchtxt=%GDWORD%

Despus, en Edit - Dictionaries F3 - Dictionaries podis colocarlas por orden de apa ricin. 3. Instalacin en Ubuntu: Aplicaciones - Centro de software - Buscar. No dudis en aportar vuestras direcciones o pginas con glosarios!! Fuentes: Wikipedia Goldendict Sliceoflinux Publicado por Jose Luis en 10:00 2 comentarios: Enviar por correo electrnicoEscribe un blogCompartir con TwitterCompartir con Fac

ebook Etiquetas: diccionario, FOSS, GNU/Linux, GoldenDict lunes, 28 de febrero de 2011 De optimo qu? All por el 46 a. C., Cicern escribi De Optimo Genere Oratorum, que era la introducc in de una obra en la que se analizaban los debates entre dos grandes oradores, Es quines y Demstenes. Cicern lo verti al latn "con las mismas ideas y con sus formas a modo de figuras, pero con palabras acomodadas a nuestro tiempo", a diferencia d e lo que ocurra en la poca en la que el intrprete (lase traductor) deba verter palabr a por palabra (verbum pro verbo). Lo dicho, os doy la bienvenida. PD: El 46 a.C. ser recordado en la crnicas sociales como el ao de la muerte de Verc ingtorix - DEP - pero eso si tal lo dejamos para otro da. Publicado por Jose Luis en 02:45 4 comentarios: Enviar por correo electrnicoEscribe un blogCompartir con TwitterCompartir con Fac ebook Pgina principal Suscribirse a: Entradas (Atom) Compartir Datos personales Mi foto Jose Luis Traductor en pijama Ver todo mi perfil Se ha producido un error en este gadget. Buscar en el blog Lista de blogs El blog de Mar Traducciones Algo ms que traducir Begoa Martnez la paradoja de Chomsky El taller del traductor No Peanuts! for Translators Localizacin y testeo con Curri El Gascn Jurado The World In My Hands El blog de irenevidal Translation Services tony baldwin | bloguiando Analizando la traduccin Traduccin y mundo libre El Blog de Kobalt Languages Seguidores Archivos del blog 2012 (1) enero (1) Vaya memorin! 2011 (2) Webs favoritas

GNU/Linux Desktop for Translators Mi web :)

Creative Commons Attribution 3.0 License. Plantilla Picture Window. Imgenes de pl antillas de enot-poloskun. Con la tecnologa de Blogger.

DeOptimoGenere GNU/Linux para traductores o cmo no morir en el intento jueves, 5 de enero de 2012 Vaya memorin! Vuelvo tras un prolongado silencio. Como muchos sabris por mi twitter o FB las co sas no me han ido mal del todo en 2011 y trabajo no me falta, as que la tarea de actualizar esta bitcora se hace dura y en muchas ocasiones acaban venciendo las g anas de no volver a tocar el ordenador hasta el da siguiente o para qu nos vamos a engaar, es vagancia. Hoy toca hablar de una herramienta de gestin de memorias de traduccin (MT) que pos teriormente utilizaremos en nuestro programa de TAO, en mi caso OmegaT. A raz de un tuit de Kevin Lossner (@germanENtrans), lleg a mis odos por @saavedrama nuel la publicacin de un corpus hexalinge de las resoluciones de la Asamblea Gener al de la ONU, un memorin, vaya. Tras pegar un respingo y gritar un vivalamadrequeospari, me dispuse a zambullirme en cienes y cienes de segmentos, pero veris que hay tres opciones de descarga: Machine-friendly version (49.4/176.2 MBytes). This version contains no newli nes or insignificant whitespaces and is the version described in the paper. Human-friendly version (50/187 MBytes). This slightly-larger version has bee n pretty-printed to make it easier to review its content or to process it with n on-XML tools, like grep. I recommend downloading this version. Plain TM version (40.9/155.6 MBytes). In this version, voting segments are r emoved, footnotes are removed completely and symbols and lead markers are remove d (but the content is kept). This is a version suitable for import into commerci al TM tools, which may not be implementing full TMX spec. Me baj la tercera opcin porque quera evitar que OmegaT se volviera loco. Si las MT que tenemos en la carpeta 'tm' van pasaditas de turrones, el tiempo de respuesta en el arranque del programa y en las bsquedas puede parecernos eterno (15 segund os para buscar la palabra maldita stakeholders pueden ser muchos segundos). Tras descomprimir el zip, nos queda una memoria de traduccin en formato estndar (t mx) que podemos copiar-pegar directamente en la carpeta 'tm' de nuestro proyecto OmegaT (acurdate de pulsar F5 para volver a cargar el proyecto y que tenga en cu enta la MT que le acabas de aadir). El problema en este caso es que tendremos una MT con seis idiomas, funcionar igua l, porque en su infinita sabidura OmegaT buscar en los pares de lenguas que hayamos indicado al configurar el proyecto, pero si queremos limpiar esa MT tenemos a nues tra disposicin una herramienta llamada Olifant (para Window$). Edito: la versin de desarrollo para GNU/Linux del paquete Okapi, que incluye toda s sus herramientas, est en: http://okapi.opentag.com/snapshots (gracias Silvia).

Olifant es una aplicacin. NET que permite cargar o importar MT en diferentes form atos (TMX o delimitadas por tabulaciones). Se pueden editar las unidades de trad uccin, sus atributos y cualquier otro dato asociado, adems de poder guardar o expo rtar datos en varios formatos. Dispone de una interfaz basada en tablas para nav egar fcilmente a travs de la MT, con funciones como: marcar segmentos duplicados y borrarlos, buscar y remplazar texto con expresiones regulares, filtrar las entr adas en funcin de diversos criterios, unir varias MT en una ya existente, exporta r parte de la TM, invertir el idioma de origen y el meta, etc. Precisamente lo q ue nos interesa es exportar parte de la MT, en este caso EN-ES. Una vez descargado e instalado el programa, abrimos la MT (File-Open) Como puede verse, tenemos los 6 idiomas con sus 72341 segmentos! Vamos al lo: Tan simple como ejecutar File-Export. Se abrir un cuadro de dilogo en el que habr q ue poner el nombre de la nueva MT que vamos a crear. Una vez decidido, clica en Aceptar y se abrir otro cuadro de dilogo como este: Selecciona en las casillas de verificacin los idiomas correspondientes. En el men desplegable Style puedes seleccionar el estilo de MT: Default, SDLX, Transit, Wo rdfast, etc. La opcin Default es la ms adecuada ya que es un estndar que funcionar i ndependientemente del programa que utilices. Clica en OK y tras unos 10-15 segun dos el archivo ya estar listo en la carpeta que seleccionaste en el paso anterior . Si te pica la curiosidad, abre el archivo creado con Notepad o con un simple blo c de notas y vers la pinta que tiene una MT: Algo que parece tan feo en realidad es de una sencillez apabullante (qu atrevida es la ignorancia): Etiquetas de inicio y cierre con informacin sobre el idioma y el segmento equival ente en el otro idioma. Ya tenemos nuestra memoria, la copiamos en la carpeta 'tm' del proyecto OmegaT. Al iniciar el programa tardar un poquito ms, 20-30 segundos. Este tipo de memorion es, al igual que el de la DG de traduccin de la UE (ms grande si cabe que el de la ONU, el par EN-ES son ms de 300 MB, es decir, 507149 segmentos!!) son muy tiles a l a hora de hacer bsquedas terminolgicas (recuerda, para abrir el cuadro de bsquedas pulsa Ctrl+F)

En este caso ha tardado 4 segundos en buscar la palabra maldita y ha dado 412 re sultados. Los tiempos con la MT de la UE aumentan bastante, con todo y con eso, que arroje resultados en menos de 10 segundos con 300 MB de segmentos es todo un logro que el propio Kevin Lossner comenta en su blog y que supera a muchos prog ramas comerciales. Enredos Si te gusta enredar un poco ms y te atreves a aumentar la memoria de OmegaT, pued es hacerlo directamente en: - la lnea de comando (GNU/Linux) java -Xmx1024M -jar OmegaT.jar - Archivo OmegaT.l4J (Window$) 1024M de memoria van bastante bien, pero 2048 mejor :) Las pruebas que hice de bs

queda con 2048 M arrojaron estos tiempos de respuesta: - MT ONU: 3 segundos - MT UE+ONU: 8 segundos

Por ltimo, tan solo decir que Olifant es una excelente herramienta para limpiar, fijar y dar esplendor a tus MT (aunque cometa el gran pecado de no estar disponi ble para otras plataformas). Enreda, prueba y no seas como yo: lee la ayuda en ln ea.

Habis probado el programa? Qu os ha parecido? Utilizis otras herramientas de gestin de MT? Espero vuestros comentarios. Publicado por Jose Luis en 11:01 3 comentarios: Enviar por correo electrnicoEscribe un blogCompartir con TwitterCompartir con Fac ebook lunes, 6 de junio de 2011 GoldenDict Alternativas al software propietario GoldenDict: interfaz para la administracin de diccionarios en lnea y locales GoldenDict es un programa OpenSource con licencia GNU/GPL y funciona con las pla taformas GNU/Linux, Windows y Mac. Se pueden consultar diccionarios en lnea y loc ales, adems de pginas como Wikipedia, Wikitionary, Urbandictionary, etc. GoldenDic t no es un diccionario, es la interfaz que nos permite consultar varios dicciona rios -similar al conocido Babylon- con formatos: .BGL (Babylon) .ifo/.dict./.idx/.syn (Stardict) Dictd .index/.dict(.dz) etc. Entre otras cosas, GoldenDict tiene caractersticas como la sugerencia de palabras clave basadas en la fontica, la posibilidad de escribir las palabras sin acentos , puntuacin o espacios o una funcin emergente para buscar palabras en todas las ap licaciones abiertas. Su uso facilita la tarea de bsqueda porque tienes a tiro de clic los diccionarios habituales: diccionarios de sinnimos, diccionarios monolinges y varios glosarios especializados descargados de forma gratuita aqu. Ejemplo de instalacin de un glosario una vez instalado el programa: descarga el diccionario/glosario (de babylon u otras webs); coloca el diccionario/glosario en una carpeta comn; Edit - Ditionaries - pestaa Files, botn Add y pon la ruta de la carpeta con lo s diccionarios, a continuacin, pulsa el botn Rescan Now u OK. Ejemplo de glosario de Babylon:

Vista de algunos de mis diccionarios: Interfaz de bsqueda: Trucos: 1. Usuarios de GNU/Linux: (esto es secreto, que no se entere nadie, ssssssssh) s i descargas un diccionario en formato .exe de babylon, basta con hacer un clic s ecundario en el archivo, descomprimirlo y haces un copia-pega del archivo con ex tensin .bgl en la carpeta donde tengamos todos los diccionarios y voil, ya tenemos otro diccionario! 2. Utilizar webs para buscar: vamos a Edit - Dictionaries F3 y en la pestaa Websi tes aadimos el nombre de la web en la que queremos buscar y la direccin para busca r, que suele ser algo as: Diccionario de la RAE: http://buscon.rae.es/draeI/SrvltGUIBusUsual?TIPO_HTML =2&TIPO_BUS=3&LEMA=%GDISO1% WordReference: http://www.wordreference.com/definicion/%GDISO1% Sinnimos de WordReference: http://www.wordreference.com/sinonimos/%GDISO1% Ingls-Espaol de WordReference: http://www.wordreference.com/en/es/translation. asp?spen=%GDWORD% Capito? Probad con %GDISO1% o con %GDWORD% Por ejemplo, estas dos son mis fuente ms habituales de consultas: http://www.cnrtl.fr/lexicographie/%GDWORD% http://www.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&index=ent &__index=ent&srchtxt=%GDWORD%

Despus, en Edit - Dictionaries F3 - Dictionaries podis colocarlas por orden de apa ricin. 3. Instalacin en Ubuntu: Aplicaciones - Centro de software - Buscar. No dudis en aportar vuestras direcciones o pginas con glosarios!! Fuentes:

Wikipedia Goldendict Sliceoflinux Publicado por Jose Luis en 10:00 2 comentarios: Enviar por correo electrnicoEscribe un blogCompartir con TwitterCompartir con Fac ebook Etiquetas: diccionario, FOSS, GNU/Linux, GoldenDict lunes, 28 de febrero de 2011 De optimo qu? All por el 46 a. C., Cicern escribi De Optimo Genere Oratorum, que era la introducc in de una obra en la que se analizaban los debates entre dos grandes oradores, Es quines y Demstenes. Cicern lo verti al latn "con las mismas ideas y con sus formas a modo de figuras, pero con palabras acomodadas a nuestro tiempo", a diferencia d e lo que ocurra en la poca en la que el intrprete (lase traductor) deba verter palabr a por palabra (verbum pro verbo). Lo dicho, os doy la bienvenida. PD: El 46 a.C. ser recordado en la crnicas sociales como el ao de la muerte de Verc ingtorix - DEP - pero eso si tal lo dejamos para otro da. Publicado por Jose Luis en 02:45 4 comentarios: Enviar por correo electrnicoEscribe un blogCompartir con TwitterCompartir con Fac ebook Pgina principal Suscribirse a: Entradas (Atom) Compartir Datos personales Mi foto Jose Luis Traductor en pijama Ver todo mi perfil Se ha producido un error en este gadget. Buscar en el blog Lista de blogs El blog de Mar Traducciones Algo ms que traducir Begoa Martnez la paradoja de Chomsky El taller del traductor No Peanuts! for Translators Localizacin y testeo con Curri El Gascn Jurado The World In My Hands El blog de irenevidal Translation Services tony baldwin | bloguiando Analizando la traduccin Traduccin y mundo libre El Blog de Kobalt Languages Seguidores

Archivos del blog 2012 (1) enero (1) Vaya memorin! 2011 (2) Webs favoritas GNU/Linux Desktop for Translators Mi web :)

Creative Commons Attribution 3.0 License. Plantilla Picture Window. Imgenes de pl antillas de enot-poloskun. Con la tecnologa de Blogger.

Вам также может понравиться