viernes, 9 de noviembre de 2012

AntConc: analizador de corpus

Si buscamos en la RAE corpus encontraremos la siguiente definición :
corpus2.

(Del lat. corpus; propiamente 'cuerpo').


1. m. Conjunto lo más extenso y ordenado posible de datos o textos científicos, literarios, etc., que pueden servir de base a una investigación.
Real Academia Española © Todos los derechos reservados
Lo que para los traductores significa un conjunto de textos que le servirán como modelo para aprender las estructuras de los distintos tipos de textos (resúmenes, cartas al director, editoriales, etc.).
Hoy voy a centrarme en un programa para analizar las palabras empleadas en los textos de vuestros corpus, que podéis descargaros gratuitamente en http://www.antlab.sci.waseda.ac.jp/software.html . Lo primero que debéis hacer es introducir los textos para lo cual solo tenéis que pinchar en "file", "open file" (para incluirlos uno a uno) o "open dir" (para incluir todos los archivos de una carpeta. Se advierte que este programa solo soporta archivos .txt así que si vuestros textos están en otro formato no los reconocerá. 
Las principales funciones de este programa son:
  • Permitir stop lists para evitar que en las listas de frecuencias aparezcan palabras con significado gramatical (preposiciones, determinantes, etc.). Hay que seleccionar las opciones de treat all data as lowercase porque si no pueden seguir apareciendo en las listas de frecuencias. 
  • Pinchamos en la pestaña word list y en el botón start que encontramos en la parte inferior del programa. 
  • En sort by podemos elegir el método de clasificación de nuestros términos (frecuencia normal e inversa, alfabéticamente normal e inversa, etc.)






  • Pinchar en un término nos llevará a la pestaña concordance donde veremos las concordancias que se han encontrado. 
  • Si seleccionamos el botón sort (a la derecha de donde se encontraba el de start) se resaltarán en color el término buscado y las 3 palabras que le preceden o que le siguen. 
  • A su vez si pinchamos en el término buscado de cualquiera de las concordancias nos enviará a la pestaña file view donde podremos leer el texto entero del que se ha extraído la concordancia.  
  • En lo texto se resaltarán con color el término sobre el que cliqueamos así como todas las demás veces que aparece. 

No hay comentarios:

Publicar un comentario