domingo, 9 de septiembre de 2012

Ngram Viewer, la aplicación estadística de Google Books como herramienta de investigación en cinofilia

Para los que no conozcáis Ngram Viewer os aclaro que es un proyecto de Google que entró en funcionamiento en 2008 y que se centra en la llamada ‘’minería de datos’’.
 
En esencia y de modo resumido podemos decir que es un gigantesco banco de términos resultado del escaneo de unos 5,2 millones de fondos literarios en las siguientes lenguas: francés, español, alemán, chino, ruso y hebreo. Hasta la fecha la base de datos cuenta con más de 5000 millones de vocablos extraídos de libros escritos entre el año 1500 y el 2008, aunque se espera que este número vaya aumentando.
 
El valor de esta herramienta de cara a cualquier tipo de investigación literaria, antropológica, sociológica o de tipo histórico es incalculable y probablemente a día de hoy todavía no somos conscientes de toda su potencialidad. Centrándonos en un tema tan modesto como es la cinofilia las posibilidades son también infinitas, por poner un ejemplo nos permite tener un conocimiento cierto acerca de qué expresiones relacionadas con el mundo canino eran de uso común en la sociedad de determinada época y por tanto saber en qué momento se empezó a emplear determinada denominación y diferenciarla de un término de nuevo cuño.
 
Las variables en la búsqueda son relativamente sencillas de comprender, uno puede poner varios términos, con el rango de años que quiera, la lengua deseada y con el ‘’alisamiento’’ que más le complazca – esto último se refiere a la forma de presentar los datos en la gráfica, va desde el valor 1 al 50. Hay que tener en cuenta que presenta los valores en porcentaje, de modo que si uno busca en inglés los términos ‘’mastiff’’ y ‘’bandogge’’ (escrito con la grafía antigua) en la gráfica sólo le aparecerán representados los valores de ‘’mastiff’’ ya que esa palabra tiene tantas entradas con respecto al otro vocablo que en cierta forma lo ‘’ensombrece’’, el programa no tiene forma de mostrar los datos de un valor tan escaso proporcionalmente. De modo que para ver las entradas de la base de datos relativas a ‘’bandogge’’ uno tendría que buscar ese término solo o junto a otro que también arroje pocos resultados como puede ser ‘’bandog’’ (esta vez escrito con la grafía moderna).
 
También es posible que a más de uno le sorprenda que ciertas denominaciones no aparezcan en la base de datos, así personalmente me ha resultado imposible hallar cualquier referencia al perro villano de las Encartaciones o al término antiguo ‘’bulldogge’’; lo que indica esto es que la labor de escaneo de datos de google es una visión general de toda la tradición literaria de un país, de modo que es totalmente lógico que no toque libros dedicados a la tradición cinófila a lo largo de todos los siglos. Pero precisamente lo positivo de este hecho es que nos permite comprender el uso en el lenguaje cotidiano de ciertas expresiones y denominaciones, y así hacernos una idea de la importancia que tenían ciertas castas caninas en el acerbo cultural en cada momento histórico.

La verdad es que nos podríamos pasar horas y días haciendo búsquedas a través de Ngram Viewer, yo personalmente he llevado a cabo unas pocas de ejemplo de las que cuelgo las capturas en pantalla a continuación. Están realizadas en español, inglés, francés y alemán, en el rango de años 1500-2008 y comparando nombres de razas diferentes.

Búsqueda en español de mastín y mastin (el mismo término sin acento gráfico), perro alano (para diferenciarlo del pueblo de origen iranio), dogo, podenco, galgo:

Búsqueda en español (con alisamiento de 50, en detalle) de mastín y mastin (el mismo término sin acento gráfico), perro de presa dogo, podenco, galgo:


Búsqueda en español de perro chato, perro alano, perro dogo, perro villano, perro de presa, dogo:


Búsqueda en español de perro chato, perro alano, perro dogo, perro villano, perro de presa:

Búsqueda en español de perro chato, perro alano, perro dogo: Búsqueda en español de perro chato, perro alano, bulldog y mastiff:


Conclusiones generales de las búsquedas en lengua castellana:

Está claro que las primeras y más importantes denominaciones que aparecen son las de galgo, podenco, mastin (sin tilde) , dogo y perro de presa ( en un sentido genérico , ya que en siglos pasados se podía referir tanto a lo que hoy entendemos por un bandog o un alano, como a cualquiera de los perros de rehala con sangre mestiza). Es interesante destacar que dogo aparece como término en solitario y también como ‘’perro dogo’’; en el caso del alano no se puede realizar la búsqueda separada de la palabra ‘’perro’’ ya que de lo contario tal y como digo más arriba nos arrojaría datos relativos al pueblo de la etnia homónima. Y por último muy curioso constatar que la denominación ‘’alano’’ no aparece de forma común hasta 1800 – no quiere decir que no aparezca antes en libros especializados como los clásicos libros medievales dedicados a la caza, que de hecho aparece, sino que Ngram Viewer no lo registra porque se escapa de la literatura común; y que la denominación ‘’perro chato’’ que todavía era de uso común en ambientes rurales de ciertas regiones en los 70 y 80 – por ejemplo Murcia y Cantabria, y seguro que muchas más- se empieza a detectar en torno a 1900.

Y por último, es muy esclarecedor el hecho de que términos ingleses como ‘’bulldog’’ y ‘’mastiff’’ aparezcan ya de forma normal en el siglo XVIII y que incluso el primero sea de largo mucho más popular en la bibliografía que expresiones tan españolas como perro alano o perro chato.
 
-------------
Búsqueda en inglés de mastiff, mastive( algunos consideran que la forma arcaica y popular del término mastiff), bulldog y bandog:

Búsqueda en inglés bulldog, bull terrier, bull mastiff, bandog, mastiff:

Búsqueda en inglés de dogo (del castellano), dogue (del francés) y bulldog:

Búsqueda en inglés de bandog y bandogge (forma antiguo del mismo término):

Búsqueda en inglés de bull mastiff y bandogge:

Conclusiones generales de las búsquedas en lengua inglesa:

Está claro que al igual que en castellano si hablamos de castas de molosos el término mastín, en este caso tanto en su forma anglosajona primitiva (mastive) como en la moderna (mastiff), destaca por su temprana aparición en textos populares; el vocablo bulldog también lo hallamos muy pronto, en torno al siglo XVII, aunque resulta sorprendente no haber podido encontrar nada relativo a la expresión ‘’bulldogge’’ que algunos pretenden que es la grafía antigua del mismo vocablo- habrá que seguir investigando en el tema.

Otra curiosidad es que bandog aparece reflejado antes que ‘’bandogge’’, siendo este último término más antiguo; quizás pueda deberse a una falta de fuentes fiables al tratarse de una base de datos acerca de literatura y bibliografía más generalista, aparte de la imposibilidad de recoger datos anteriores al 1500. Otra posibilidad es que haya existido cierto grado de invención por parte de eruditos del siglo XIX que atribuyeron una antigüedad inexistente al término bandog y en cierto modo ‘’medievalizaron’’ la expresión para dotarla de un poso de tradición – cosas parecidas han ocurrido en el estudio de la Historia Universal más convencional.

En la línea de lo anterior destacar que bulldog aparece antes que bandog, cosa sorprendente porque contradice la teoría general sostenida por la cinofilia más clásica. Nos encontramos de nuevo en la misma situación: ¿ es debido a la falta de fuentes o a que la base de datos sólo llega hasta el 1500…?

Y ya para acabar destacar que la importancia de tipos raciales más modernos como la familia de los ‘’bull and terrier’’ o los bull mastiff es mínima en comparación con las castas primigenias descritas más arriba; y que términos foráneos como ‘’dogo’’ y ‘’dogue’’ se cuelan en la cinofilia inglesa a partir del XIX.

----------------------
Búsqueda en francés (con alisamiento de 50, en detalle ) de caniche, mâtin y dogue:

Búsqueda en francés (con alisamiento de 50, en detalle ) de dogue, mâtin, bouledogue, bulldog:


Conclusiones generales de las búsquedas en lengua francesa:

Una vez más la raza emblemática y con más tradición del país aparece cronológicamente en primer lugar en el registro bibliográfico, en este caso el caniche; y a renglón seguido el mastín y el dogo, términos básicos en la cinofilia europea. Mientras, vocablos como bouledogue o su versión anglosajona bulldog, no aparecen hasta finales del siglo XVIII o principios del XIX.

-------------------

Búsqueda en alemán de dogge, bullenbeisser, mastiff y pinscher:

Búsqueda en alemán de dogge, bullenbeisser,bulldog y bulldogge:


Búsqueda en alemán de bullenbeisser, bulldog, bulldogge, rottweiler y dobermann:

Búsqueda en alemán de schnauzer, rottweiler, dobermann y pastor alemán:


Conclusiones generales de las búsquedas en lengua alemana:

Por supuesto un tipo canino autóctono en su desarrollo y fuertemente enraizado en la tradición del país, el pinscher, aparece en primer lugar en cuanto a antigüedad de las referencias. Seguido, como en el caso de España y Francia, de ubicuo dogo (dogge) que siempre lo hallamos entre los primeros resultados en los países de la Europa continental- señal inequívoca de la cercanísima relación histórica en la cinofilia de toda esa amalgama de pueblos y naciones.

Por supuesto las referencias a denominaciones más ‘’modernas’’ en el continente europeo- y en definitiva de tradición británica- como bullenbeisser, bulldog o bulldogge no aparecen en la bibliografía base del proyecto hasta el siglo XIX. Lo mismo ocurre con razas inequívocamente decimonónicas e incluso más próximas al siglo XX como el rottweiler, pastor alemán, dobermann , schnauzer etc.

Es especialmente llamativa la comparación entre estas últimas entradas, ya que la importancia en la gráfica del gran pinscher alemán – el dobermann- en torno a la cronología coincidente con la Segunda Guerra Mundial es sencillamente pasmosa. Y no menos sorprendente el pobre número de referencias al pastor alemán en comparación con las otras cuatro grandes razas germanas. Decir también que me ha sido imposible realizar una búsqueda acerca de la raza bóxer, ya que es imposible discriminar en la base de datos entre resultados relativos a esta casta canina de los que hacen alusión al deporte del boxeo y sus practicantes.

Conclusiones generales:

Primero de todo quiero aclarar que este informe estadístico es muy superficial y somero, ya que ha sido resultado de una búsqueda totalmente intuitiva, de modo que no es un trabajo científico en absoluto, pero sí que sirve para apuntar ideas y ver ciertas tónicas generales en la evolución de algunas expresiones y vocablos que consecuentemente nos darán pistas acerca del desarrollo de determinadas castas caninas.

Aparte de esto tenemos que saber diferenciar entre significante y significado, pues  un término no siempre se refiere a la misma cosa a lo largo de la historia; por ejemplo, la palabra ''mastiff'' ha sido empleada en el pasado en el mundo anglosajón para definir animales tan dispares entre sí como un moloso de montaña del estilo del Montaña del Pirineo y un dogo de Burdeos- de hecho a día de hoy en mucha bibliografía en lengua inglesa hablan del mastín francés para referirse a este perro, o incluso mastín argentino para denominar al dogo austral. Con esto quiero decir que hay que ser muy cautos a la hora de identificar el nacimiento de una nueva casta con su aparición en una gráfica estadística…, lo único que indica una de estas tablas de porcentajes es la popularidad de un término determinado, con independencia de que el tipo de perro al que se refiera sea el mismo que el de un siglo antes o efectivamente haya cambiado.

Una vez aclarado esto sí que me permito dar una interpretación personal de algunos datos grosso modo.

En Francia, España e Inglaterra el término mastín – en sus distintas grafías dependiendo de la época y el idioma- aparece en los primeros años del rango de búsqueda, lo cual encaja bastante bien con una de las explicaciones acerca del origen del término que lo sitúa en el entorno de la Francia medieval de donde pudo pasar a Inglaterra y a España respectivamente . La relación del país galo e Inglaterra hasta el fin de la Guerra de los Cien años es literalmente de vecindad, ya que parte del suelo francés está ocupado por señores feudales del otro lado del Canal de La Mancha. Y por otro lado todos los reinos norteños de la Península Ibérica mantienen también a través de toda la Edad Media un flujo de comunicación intensísima tanto a nivel cultural, dinástico, comercial, religioso etc.

También tenemos el vocablo ''dogo’’ que lo hallamos entre las primeras referencias de las búsquedas en lengua española, francesa y alemana, si bien es cierto que en esta última aparece mucho más tarde. La historia de este término es bastante curiosa, ya que se cree que procede de la antigua voz anglosajona ''docga’’ (perro fuerte o poderoso) y que pasó al continente a través de Francia – haciendo el camino inverso al del anterior caso- para diseminarse después por toda Europa. Lo interesante es que en suelo británico parece ser que desaparece pronto con el sentido original, ya que simplemente da lugar al genérico ''dog’’ (perro), y por eso mismo no la podemos rastrear en Ngram Viewer ya que sólo llega hasta el año 1500 –y no parece que de momento se vayan a escanear documentos medievales, que por otro lado al ser anteriores al nacimiento de la imprenta son proporcionalmente escasísimos y limitados principalmente a temas religiosos.

Por tanto estos dos términos: mastín y dogo, son con todo merecimiento las dos piedras de toque de la cinofilia de la Europa continental- Alemania, Francia y España- en el campo de los molosos y perros de presa. En el caso inglés, desde su aislamiento insular,  también incluiríamos el vocablo ''mastín’’(mastiff) pero emparejado con el mítico ''bulldog’’ que da la impresión de que, al menos en el registro bibliográfico -y de 1500 en adelante- es un término que sustituye al ''dogo’’ del otro lado del Canal de La Mancha.

Tras esto el vocablo ‘’bulldog’’, tanto en el inglés original como en sus formas francesa y alemana, no aparece fuera de las Islas Británicas con verdadera fuerza hasta el siglo XIX.

Y en resumen estas son las principales líneas argumentales que se pueden extraer del pequeño experimento estadístico que Ngram Viewer me ha permitido realizar. Queda en en proyecto la realización de un estudio mucho más serio y exhaustivo. 

8 comentarios:

  1. Buena tarea de análisis de datos. Por un fin leo algo con aspecto profesional en un blog de perros.

    Un saludo desde Zaragoza.

    ResponderEliminar
  2. Alsaciano10/9/12 14:05

    Este comentario ha sido eliminado por un administrador del blog.

    ResponderEliminar
  3. Nacimiento del Ebro9/10/12 11:19

    Deja de meter tus narices donde no te llaman, Reinosa está muy cerca de Torrelavega, sigue así y igual un dia de stos te rompen las piernas. Payaso, sabemos donde vives.

    ResponderEliminar
    Respuestas
    1. Esto suena a amenaza. Yo lo denunciaría.

      Eliminar
  4. Antonio Zorrilla es probablemente la mayor autoridad en cinofilia de toda europa, a su lado tu eres un copleto gilipollas.

    ResponderEliminar
    Respuestas
    1. Mira, chico. El mundo de la cinofilia está lleno de autoridades que se reconocen entre ellas como tales. De vez en cuando, muy a menudo diría yo, se enfrentan y se ponen verdes. Es un grupo de gente, estas autoridades, que se lo tienen muy creido. La gente que les reconoce como autoridades suele ser bastante ignorante y cualquier cosa les deja con la boca abierta.

      Eliminar
    2. Las autoridades en cualquier campo deben ser reconocidas de una forma mas objetiva y no por mera amistad o por intereses comunes en algún negocio común. Por lo menos, nuestras (bueno, las mías no) autoridades en cinofilia deberían publicar sus sesudos trabajos en Science, por ejemplo. La comunidad científica les estaría muy agradecida por sus aportaciones a la cinofilia. Éstas autoridades son muy corporativistas: al final, se apoyan entre ellos y todo queda en familia, negocio, coto...

      Eliminar
  5. Para 'Pesquera' (por cierto, bonito pueblo campurriano) y para 'Nacimiento del Ebro' (supongo que te refieres a Fontibre, no¿? que también es un paraje muy bonito): no tengo muy claro si detrás de vuestros mensajes está el trastornado de 'Alberto Alsaciano', la gente del perro lobo cántabro o ese señor tan peculiar que se dedica a montar federaciones caninas..., de cualquier manera sé que un mensaje ha salido desde Madrid y el otro desde la ciudad de Santander.

    Parece que habéis aprovechado que ya no modero el blog para hacer un poquito el troll, y la verdad es que encuentro muy divertidas vuestras amenazas y vuestros comentarios absurdos, pero ya sabéis: lo poco gusta y lo mucho cansa...

    No volveré a permitir más insultos ni cualquier otro tipo de gilipollez. Si no sois capaces de rebatir un argumento con otro mejor y tenéis que recurrir al insulto y a la amenaza... no pontáis nada aquí. Volved al cubil de donde nunca tendríais que haber salido.

    ResponderEliminar

Related Posts Plugin for WordPress, Blogger...