Extracción de contextos definitorios de tecnologías biomédicas en corpus especializado francés

Rodríguez Martínez, Manuel Cristóbal

doi:10.17533/UDEA.MUT.V14N2A11

Extracción de contextos definitorios de tecnologías biomédicas en corpus especializado francés

Rodríguez Martínez, Manuel Cristóbal ¹

1 Universidad Europea del Atlántico

Universidad Europea del Atlántico

Santander, España

Revista:

Mutatis Mutandis: Revista Latinoamericana de Traducción

ISSN: 2011-799X

Año de publicación: 2021

Título del ejemplar: Nuevas perspectivas de investigación en la traducción especializada en lenguas románicas: aspectos comparativos, léxicos, fraseológicos, discursivos y didácticos

Volumen: 14

Número: 2

Páginas: 509-526

Tipo: Artículo

DOI: 10.17533/UDEA.MUT.V14N2A11 DIALNET GOOGLE SCHOLAR Dialnet editor

Otras publicaciones en: Mutatis Mutandis: Revista Latinoamericana de Traducción

Objetivos de desarrollo sostenible

Resumen

Before new developments of certain fields of knowledge, translators face context and terminology gaps that specialized dictionaries are not able to cover. Thanks to the potential shown by corpus management and text analysis software, corpora are emerging as essential tools to study not only the grammatical relations between specific words but also their semantic relations and extract defining contexts which could compensate the shortcomings of dictionaries during the translation process. Therefore, this study extracts definitional contexts in biomedical technology, continuously expanding areas with ongoing techniques, tools, methodologies, and products using CQL (Corpus Query Language) and RegEx. This study seeks hence to establish patterns in order to build searches combining CQL and RegEx to retrieve defining, rewording, and/or refining the terminology of these fields. Hence, a corpus made of 100 research articles, written in French, about bioengineering and biotechnology is compiled using the corpus management online tool Sketch Engine. The suggested searches and the results confirm the usefulness of this strategy to retrieve knowledge-rich contexts. These contexts are interesting for researchers and specialized translation professionals from French to Spanish, language combination with scarce terminological resources.

Referencias bibliográficas

Alarcón, R., Bach, C. y Sierra, G. (2007). Extracción de contextos definitorios en corpus especializados: hacia la elaboración de una herramienta de ayuda terminográfica. Revista Española de Lingüística (rsel), 37(1), 247-277. https://doi.org/10.31810/RSEL.37.1
Alarcón. R. y Sierra G. (2006). Reglas léxico-metalingüísticas para la extracción automática de contextos definitorios. En A. Hernández y J. L. Zechineli (Eds.), Avances en la ciencia de la computación, vii Encuentro Internacional de Computación ENC’06 18 al 22 de septiembre 2006, San Luis Potosí, México (pp. 242-247). mscc.
Alarcón, R. y Sierra, G. (2017). El rol de las predicaciones verbales en la extracción automática de conceptos. Estudios de Lingüística Aplicada, (38), 129-144. https://ela.enallt.unam.mx/in-dex.php/ela/article/view/753
American Psychological Association. (2020). Publication manual of the American Psychological Association (7.ª ed.). apa.
Barceló Martínez, T. y Delgado Pugés, I. (2015). La traducción de la preposición sur en el lenguaje jurídico francés: un estudio de caso. Çédille, (11), 51-67.
Boré, C. y Malrieu, D. (2017). Approche textométrique des séquences de discours direct dans un corpus de contes. A textometric approach of direct speech sequences in a tales corpus. Corpus, (17), 1-16. https://doi.org/10.4000/corpus.2856
Bordons, M. (2004). Hacia el reconocimiento internacional de las publicaciones científicas españolas. Revista Española de Cardiología, 57(9), 799-802. https://www.revespcardiol.org/es-hacia-el-reconocimiento-internacional-publicaciones-articulo-13065646
Cabezas-García, M. y Faber, P. (2018). Phraseology in specialized resources: An approach to complex nominals. Lexicography, 5, 55-83. https://doi.org/10.1007/s40607-018-0046-x
Cabré, M. T. (2001). La terminología. Representación y comunicación. iula.
Cabré, M. T., Estopà, R. y Vivaldi, J. (2001). Automatic term detection. A review of current systems. En D. Bourigault, C. Jaquemin y M. C. l’Homme (Eds.), Recent advances in computational terminology (pp. 53-87). John Benjamins.
Cagnolati, B. E. (2015). Interferencia en la traducción francés-español de textos de ciencias sociales. Hikma, 14, 55-74. https://doi.org/10.21071/ hikma.v14i.5200
Capsada Blanch, R. y Torruella Casañas, J. (2017). Métodos para medir la riqueza léxica de los textos. Revisión y propuesta. Verba, 44, 347- 408. https://doi.org/10.15304/verba.44.3155
Cartier, E. y Viaux, J. (2018). Étude de la pénétration des anglicismes de type N ou ADJ(-)Ving à partir d’un corpus contemporain journalistique : les exemples de bashing et shaming en français contemporain. En C. Jacquet-Pfau, A. Napieralski y J.-F. Sablayrolles (Eds.), Emprunts néologiques et équivalents autochtones : études interlangues (pp. 11-34). Presses Universitaires de Łódź.
Clark, A., Fox, C. y Lappin, S. (2010). The handbook of computational linguistics and natural language processing. Wiley-Blackwell.
Condamines, A., Josselin-Leray, A., Fabre, C., Lefeuvre, L., Picton, A. y Rebeyrolle, J. (2013). Using comparable corpora to characterize knowledge-rich contexts for various kinds of users: Preliminary steps. Procedia – Social and Behavioral Sciences, 95, 581-586. https://doi.org/10.1016/j.sbspro.2013.10.685
Condamines, A. y Rebeyrolle, J. (1997). Construction d’une base de connaissances terminologiques à partir de textes : expérimentation et définition d’une méthode. En Actes Journées Ingénierie des Connaissances et Apprentissage Automatique, JICAA’97 (pp. 191-206). Institut National de Recherche en Informatique et en Automatique.
Corpas Pastor, G. (1996). Manual de fraseología española. Gredos.
Corpas Pastor, G. (2001). Compilación de un corpus ad hoc para la enseñanza de la traducción inversa especializada. Trans, 5, 155-184. https://doi.org/10.24310/TRANS.2001. v0i5.2916
Corpas Pastor, G. y Roldán Juárez, M. (2014). Análisis de necesidades documentales y terminológicas de médicos y traductores médicos como base para el diseño de un diccionario multilingüe de nueva generación. MonTI, 6, 167-202. http://dx.doi.org/10.6035/MonTI.2014.6.6
Corpas Pastor, G. y Seghiri Domínguez, M. (2007). Determinación del umbral de representatividad de un corpus mediante el algoritmo N-Cor. Procesamiento del Lenguaje Natural, (39), 165-172. http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/2670
Denis, P. y Sagot, B. (2012). Coupling an annotated corpus and a lexicon for state-of-the-art pos tagging. Language Resources and Evaluation, 46, 721-736. https://doi.org/10.1007/s10579- 012-9193-0
eagles (1996). Preliminary recommendations on corpus typology. eagles document, eag-tcwg-fr-2. http://www.ilc.cnr.it/EAGLES/corpustyp/ corpustyp.html
Egbert, J., Larsson, T. y Biber, D. (2020). Doing lin¬guistics with a corpus. Cambridge.
Estopà, R. (2001). Elementos lingüísticos de las unidades terminológicas para su extracción automática. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica. Reconocimiento, análisis y extracción de información formal y semántica (pp. 67-80). Universitat Pompeu Fa¬bra, Institut Universitari de Lingüística Aplicada.
Evert, S., Harlamov, O., Heinrich, P. y Banski, P. (2020). Corpus Query Lingua Franca part II: Ontology. En N. Calzolari, F. Béchet, P. Blache, K. Choukri, C. Cieri, T. Declerck, S. Goggi, H. Isahara, B. Maegaard, J. Mariani, H. Mazo, A. Moreno, J. Odijk y S. Piperidis (Eds.), Proceedings of the 12th Language Resources and Evaluation Conference, May 2020, Marseille (pp. 3346-3352). European Language Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.410/
Fromm, G., Grama, D. F., Bilke, N. S. y Guarato Santos, C. (2020). Wordsmith Tools and Sketch Engine: An analytical comparative study for scientific research with corpora ma¬nipulation. Revista de estudos de linguagem, 28(3), 1101-1248. http://dx.doi.org/10.17851/2237-2083.28.3.1191-1248
Haße, W., Peters, S. y Fey, K. H. (2011). ¿Lingua franca impuesta o lenguas europeas de la ciencia en medicina? La opción del multilingüismo. Panace@, 12(34), 267-372. https://www.tre-medica.org/wp-content/uploads/n34-tribuna-abepetersfey_ESP.pdf
Jakubíček, M., Kilgariff, A., McCarthy, D. y Ry¬chlý, P. (2010). Fast syntactic searching in very large corpora for many languages. En R. Otoguro, K. Ishikawa, H. Umemoto, K. Yoshimoto y Y. Harada (Eds.), Proceedings of the 24th Pa¬cific Asia Conference on Language, Information and Computation (pp. 741-747). Waseda University, Institute of Digital Enhancement of Cognitive Processing. https://www.aclweb.org/anthology/Y10-1086/
Ježek, E. y Melloni, C. (2011). Nominals, polysemy and co-predication. Journal of Cognitive Science, 12(1), 1-31. https://doi.org/10.17791/ jcs.2011.12.1.1
Kilgarriff, A., Baisa, V., Bušta, J., Jakubíček, M., Kovář, V., Michelfeit, J., Rychlý, P. y Su¬chomel, V. (2014). The Sketch Engine: ten years on. Lexicography, 1, 7-36. https://doi.org/10.1007/s40607-014-0009-9
Kunilovskaya, M. y Koviazina, M. (2017). Sketch engine: A toolbox for linguistic discovery. Journal of Linguistics, 68(3), 503-507. https://doi.org/10.2478/jazcas-2018-0006
Laursen, A. y Arinas-Pellón, I. (2012). Text corpora in translator training. A case of study of use of comparable corpora in classroom teaching. The Interpreter and Translator Trainer, 6(1), 45- 70. https://doi.org/10.1080/13556509.2012.10798829
León-Araúz, P., San Martín, A. y Faber, P. (2016). Pattern-based word sketches for the extraction of semantic relations. En P. Drouin, N. Grabar, T. Hamon, K. Kageura y K. Takeuchi (Eds.), Proceedings of the 5th International Workshop on Computational Terminology (Computerm2016) (pp. 73-82). acl. https://www.aclweb.org/anthology/W16-4709/
León-Araúz, P. y Reimerink, A. (2019). High-density knowledge rich contexts. Argentinian Journal of Applied Linguistics, 7(1), 109-130. https://redib.org/Record/oai_articulo2061846-high-density-knowledge-rich-contexts
León-Araúz, P. y Reimerink, A. (2020). Improved knowledge rich context extraction for terminography. En T. Read, S. Montaner y B. Sedano (Eds.), Technological innovation for specialized linguistic domains. Languages for digital lives and cultures. Proceedings of tislid’18 (pp. 69-84). Éditions universitaires européennes.
López Rodríguez, C. I. (2020). Marcos predicativos asociados al concepto signo y síntoma en textos sobre medicina en español. Revista Signos, 53(103), 392-418. https://doi.org/10.4067/ S0718-09342020000200392
Martínez López, A. B. (2010). La terminología médica en francés, inglés y español: problemas que se derivan de la presencia del inglés como lingua franca de la comunicación científica a es¬cala internacional. Anales de Filología Francesa, (18), 393-404. https://revistas.um.es/analesff/article/view/117041
McEnery, T., Xiao, R. y Tono, Y. (2006). Corpus-based language studies. An advanced resource book. Routledge.
Meyer, I. (2001). Extracting knowledge-rich contexts for terminography. A conceptual and methodological framework. En D. Bourigault, C. Jacquemin y M.-C. L’Homme (Eds.), Recent advances in computational terminology (pp. 279- 302). John Benjamins.
Navarro, F. A. (2001). El inglés, el idioma internacional de la medicina. Panace@, 3(2), 35- 51. https://www.tremedica.org/wp-content/uploads/n3_Panacea3_Marzo2001.pdf
Navarro, F. A. (2006). La anglización del español: mucho más allá de bypass, piercing, test, airbag, container y spa. En L. González y P. Hernúñez (Coords.), Traducción: contacto y contagio. Actas del III Congreso Internacional “El Español, lengua de traducción”. Puebla (México) (pp. 231-232). ESLEtRA. https://cvc.cervantes.es/lengua/esletra/pdf/03/017_navarro.pdf
Nazar, R. y Galdames, A. (2020). Formalización de reglas para la detección del plural en castellano en el caso de unidades no diccionarizadas. Linguamática, 11(2), 17-32. https://doi. org/10.21814/lm.11.2.285
Ortega Arjonilla, E. (2003). Aspectos metodológicos de la traducción científica y técnica. Aplicaciones al ámbito francés-español. En M. Á. García Peinado y E. Ortega Arjonilla (Coords.), Panorama actual de la investigación en traducción e interpretación (pp. 199-234). Atrio.
Picton, A., Josselin-Leray, A. y Planas, E. (2017). Defining knowledge-rich contexts for specialized translation: Uses and limitations of a mixed-method approach. En I. Simonnæs, Ø. Andersen y K. Schubert (Eds.), 21st Conference on Language for Specific Purposes, Bergen (Norway), June 28-30 (pp. 289-307). Frank & Timme.
Pimienta, D. y Prado, D. (2016). Medición de la presencia de la lengua española en la internet: métodos y resultados. Revista Española de Documentación Científica, 39(3), 1-14. https://doi. org/10.3989/redc.2016.3.1328
Rodríguez Martínez, M. C. (2017). Particularidades de la traducción en el ámbito biosanitario del francés al español. En E. Ortega, A. B. Martínez López y F. García Luque (Eds.), Cartografía de la traducción, la interpretación y las industrias de la lengua. Mundo profesional y formación académica: interrogantes y desafíos (pp. 151-166). Comares.
Rodríguez Martínez, M. C. y Ortega Arjonilla, E. (2020). Particularidades morfológicas en traducción biosanitaria del francés al español: el prospecto de medicamentos para uso humano. Trans, (24), 401-418. https://doi.org/10.24310/TRANS.2020.v0i24.6440
Ruiz Rosendo, L. (2007). El predominio del inglés en el lenguaje científico: características del lenguaje médico español en la actualidad. Polissema, (7), 85-113. https://core.ac.uk/rea-der/47137820
Ryšavá, D., Volková, N. y Rambousek, A. (2015). Converting the corpus query language to the natural language. En A. Hokák, P. Rychlý y A. Rambousek (Eds.), Proceedings of recent advances in Slavonic natural language processing, raslan 2015 (pp. 43-48). Tribun eu. https://nlp.fi.muni.cz/raslan/2015/paper11-Rysava_Volkova_ Rambousek.pdf
Sierra, G. (2009). Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos. Linguamática, 1(2), 13-37. https://www.linguamatica.com/index.php/linguamatica/article/view/38
Sierra, G. (2011). Lexicografía computacional en las búsquedas onomasiológicas con lenguaje natural. En M. E. Vázquez Laslop, K. Zimmerman y F. Segovia (Eds.), De la lengua por sólo la extrañeza: estudios de lexicología, norma lingüística, historia y literatura en homenaje a Luis Fernando Lara (pp. 445-464). El Colegio de México.
Sierra, G. (2017). Introducción a los corpus lingüísticos. unam, Instituto de Ingeniería.
Sierra, G., Alarcón, R., Aguilar, C., Barrón, A., Benítez, B. y Baca, I. (2008). Corpus de contextos definitorios: una herramienta para la lexicografía y la terminología. En L. Fabbri (Ed.), Terminología, conocimientos, sociedad y poder: x Simposio Iberoamericano de Terminología (riterm): Montevideo, 7 a 19 de noviembre de 2006. riterm; Intendencia Municipal de Montevideo.
Sierra, G., Medina, A., Alarcón, R. y Aguilar, C. A. (2003). Towards the extraction of conceptual information from corpora. En D. Archer, P. Rayson, A. Wilson y T. McEnery (Eds.), Pro¬ceedings of the Corpus Linguistics 2003 Conference (pp. 691-697). ucrel.
Sierra, G., Torres-Moreno, J.-M. y Molina, A. (2010). Regroupement sémantique de défini-tions en espagnol. ArXiv, abs/1501.04920.
Sketch Engine (s. f). Learn how language works. https://www.sketchengine.eu/
Valero Doménech, E. y Alcina Caudet, A. (2010). Exploración de características conceptuales en contextos ricos en conocimiento mediante un programa de análisis cualitativo. Revista de Lingüística y Lenguas Aplicadas, 5, 241-254. https://doi.org/10.4995/rlyla.2010.772

Fuente de los datos: Dialnet

Extracción de contextos definitorios de tecnologías biomédicas en corpus especializado francés

Universidad Europea del Atlántico

Objetivos de desarrollo sostenible

Resumen

Referencias bibliográficas