“Me sorprende que muchos me están referenciando en otros países”

ImprimirEnviar a un amigoPDF
Mg. Viviana Mercado
Galería de fotos

La Mg. Viviana Mercado, flamante graduada de la Maestría en Informática y Sistemas de la UNPA, desarrolló en el marco de su tesis un proyecto, centrado en la minería de datos, para determinar la orientación política en textos periodísticos. La aplicación generó repercusiones en México, Chile y España. El corpus se encuentra disponible como contribución científica.

En el marco de la Maestría en Informática y Sistemas, la flamante graduada  Mg. Viviana Beatriz Mercado, defendió el lunes pasado su tesis titulada ‘El proceso de extracción de conocimiento en la determinación de la orientación política en artículos periodísticos’.
En dialogo con FM UNPA,  Mercado brindó detalles del trabajo desarrollado, el cual se enfoca en la presentación de un dataset para tareas de perfilado de autor, especialmente en la determinación de la orientación política de periodistas argentinos, distinguiendo entre oficialistas y opositores.
La flamante graduada, que integra el cuerpo docente de la Unidad Académica Caleta comentó que “siempre me interesó la parte de minería de datos y dentro de esa área está la extracción de conocimiento y en particular la minería de texto”.

Felicitaciones, la devolución del Tribunal a tu tesis fue muy buena
Sí, muy agradecida también por esta oportunidad que me dio la UNPA de hacer un avance más  en mi formación.  Hacer un posgrado para mí siempre fue muy importante y aparte tener esa posibilidad tan cercana geográficamente, porque para mi disciplina siempre se encuentra en el centro del país, se hace difícil por ahí hacer un posgrado a distancia y tener que viajar.
Esta posibilidad para mí fue muy importante y muy anhelada. Estoy muy contenta y  por otro lado también por el feedback que obtuve de parte del jurado. Además, por el acompañamiento de mis directores que siempre  estaban ahí,  me ajustaban y me decían ‘tenés que ir para este lado,  para el otro’,  me supieron guiar correctamente. También agradecida con cada uno de mis compañeros de la unidad académica Caleta Olivia, de la que soy integrante del cuerpo docente, que pusieron su granito de arena y me ayudaron mucho.

Hablanos de tu formación de base, tu historia, tu desempeño académico actual.
Si bien yo soy nacida en Comodoro Rivadavia, desde muy chica me fui a vivir a otras provincias. Primaria y secundaria  las hice en Tartagal, Salta, la universidad la cursé en la Universidad Tecnológica Nacional de Tucumán. Una vez recibida vine a Pico Truncado y empecé a trabajar en Yacimiento. Después ya me mudé para para Comodoro y en ese momento empecé ad honorem en la Unidad Académica Caleta Olivia. Además trabajé en terciario, en fábricas, pero siempre mantenía mis  dos horitas en las tardes para poder hacer docencia; ya en la UNPA tengo veinte años. En Tucumán hice beca de alumnos, servicio de docencia, siempre me gustó ese clic entre la teoría y la práctica, por eso estoy en UNPA. Normalmente viajo de Comodoro a Caleta en el día voy y doy clases y vuelvo a mi lugar de residencia.
Cuando se abrió la posibilidad de esta maestría me anoté, por ahí se hizo largo en el sentido de que pasaron ciertas contingencias en el medio, una serie de cuestiones entre personales y laborales.
Siempre me interesó mucho el área de minería de datos, si bien yo hice un trabajo que es bastante multidisciplinar, abarca comunicación y ciencias políticas. Lo que yo trabajé tiene que ver con un aprendizaje supervisado y no supervisado de cuestiones de periodistas argentinos sobre un período dado, 2012- 2015, que era muy marcado  el alineamiento hacia una u otra postura.
En base a eso se trataba determinar a partir de los términos o las palabras que tenían a nivel discursivo,  cuál era su postura ideológica. Obviamente para obtener todo eso tuve que buscar material porque no lo hice de las redes sociales. Tomé como base las redes sociales para saber quiénes eran los más preponderantes de una postura o la otra, utilicé libros, artículos, editoriales.
A posteriori salieron otros trabajos, como los que se hicieron en particular con editoriales, pero en el momento que yo lo hice había de otros idiomas, pero no de español. Eso también sirvió de base, que al menos de España me  referenciaron, ellos hicieron también algo similar pero con sus orientaciones de centro, derecha e izquierda, tomaron de base mi corpus como una contribución a esta línea de trabajo.

Tu tesis tiene que ver con artículos periodísticos, con este proceso de extracción de conocimiento en la determinación de la orientación política ¿Cómo surge esta temática y a qué conclusiones llegaste?
Como comentaba recién siempre me interesó la parte de minería de datos y dentro de esa área está la extracción de conocimiento y en particular la minería de texto. Cuando salió esta propuesta uno de mis directores tenía realizando varias líneas de trabajo, en Argentina tampoco hay mucha gente trabajando en estos temas. El tenía a alguien dirigiendo sobre Estados represivos,  ahí surgió esta propuesta y me pareció interesante más allá de que la línea me gustaba.
Esta situación del proceso de extracción de conocimientos desde la recopilación, de los artículos, la limpieza, la depuración para usarlo en texto plano sin imágenes incrustadas, después cada una de esas etapas hasta llegar hasta el resultado que se tiene el conocimiento en sí.
Por ahí hay algunas que fueron más difíciles, más intrincadas, en el sentido que requería un trabajo adicional, porque si bien la herramienta lo hacía de forma automática había algunas cosas que tenía que hacer de tipo manual hasta llegar a esas dos posturas que eran muy claras en ese momento, que era con adhesión al gobierno nacional y otra que era totalmente opuesta.
Inclusive hicimos alguna publicación que se llama ‘El lenguaje de la grieta’ y se lo propuse a mi director, quedó muy lindo y se envió a un Journal. También fue interesante en ese sentido de poder descubrir qué términos usaba la clase oficialista o  el opositor. Ahí marcamos algunos términos o palabras combinadas o caracteres que usaban uno u otro.
Nuestro gobierno es bastante pendular,  lo que yo hice en un período después fue al revés.  Fue interesante descubrir, qué término utilizaban,  cuáles eran los sentimientos, las emociones que ponían sobre los términos, la connotación,  poder descubrir que algunos tenían términos muy propios: derechos,  mujeres, deuda, deuda externa.

En el período que analizaste estaba Cristina Kirchner, previo  al inicio de la presidencia de Mauricio Macri.  Era una época bastante caliente hablando en términos políticos. Contanos qué periodistas, qué medios tomaste como referencia para para marcar y cuál fue tu estratificación en lo político.
Tomé los periodistas más resonados en ese momento que tenían una postura muy marcada,  el  anti-K o el pro K, además utilicé de base libros. También para tener equilibrado el corpus o dataset  incluí la misma cantidad de periodistas masculinos y femeninos y de blog de noticias fue con editoriales con posturas muy marcadas, como La Nación o Clarín o Página 12.
De los periodistas la idea es después a trabajo futuro tomar un artículo cualquiera y procesarlo en el programa y conocer sí determina realmente quién lo escribió, porque cada persona  tiene una forma de escribir, es única.  Hay ciertos patrones lingüísticos en cuanto a la escritura,  uno puede saber qué términos son más  propios de una persona que de otra. Por eso también esto se puede llegar a utilizar en cuanto a la inconsistencia estilística, es decir, yo tengo un texto cualquiera y determinar esto lo escribió tal persona o lo hizo otra. Uno se da cuenta si existe o no plagio.
Durante mi trabajo tuve que tomar una muestra para ver si realmente funcionaba y estaba discriminando bien la línea o esa clase del pro y  del opositor.  También me encontré con que algunos habían cambiado de postura ideológica, algunos habían fallecido y que tuvo que tomar otros.  Podía discriminar correctamente si pertenecía a una clase o no, tenía también tipos de representación si eran de tipo fijas, estáticas, porque hay una opción en la herramienta que categoriza emociones , cuestiones afectivas, las características psicológicas - introvertido, extrovertido- o a través de letras mayúsculas minúsculas, signos de puntuación. Tenía algunas palabras que se cifraban,  por ejemplo, normalmente cuando se utiliza los artículos se dejan de lado y en este caso, tenía su peso dejar el artículo porque teníamos por ejemplo  ‘el flaco’,  ‘la pingüina’, tenía otro peso más grave  que no era descartable en ese caso el artículo.
Después algunos términos como mirar, sentir que son procesos perceptuales que estaban muy marcados de una línea y del otro eran más casos de corrupción, leyes, deudas, en sí  otros términos negativos.
Se trató de hacer de cada uno un análisis de todas las representaciones, de todas las formas, de todas las miradas. Hubo mucho de experimentación para ver si realmente podía clasificar correctamente ese corpus.

¿Es un programa al que uno le puede poner el texto de cualquier periodista y a raíz de eso puede definir la orientación política?
Deberías primero refinar el texto. Sé que lo están utilizando en otras universidades, se debe dar un tratamiento previo al corpus  y debería poder clasificar correctamente.

¿Has continuado utilizando la herramienta?
La idea  es extender el período y después este hacer otras pruebas.  Yo trabajé el texto formal. También se pueden incorporar como trabajo futuro los tuits y a partir de eso hacer un análisis de sentimientos o las connotaciones  de los términos positivos o negativos, qué es lo que comunican, cómo lo comunican, también se puede hacer algo así a nivel discursivo.
Hay un trabajo sobre Ciencias Políticas donde el autor tomó de base mi trabajo, él trabaja con una editorial que se sabía abiertamente si era  oficialista u opositor y ellos analizaban  precisamente qué comunican, cómo lo comunican, qué interpretación y qué opiniones ponen ciertos periodistas en lo que tienen referido a lo político. Su trabajo es a nivel discursivo, no hizo un software.
¿En el país no hay nada similar?
Hasta donde nosotros estábamos trabajando no había nada en español, así que por eso ahora me sorprende que muchos me están referenciando en otros países; de México, Chile y España están leyendo este trabajo porque en la Argentina no hay nada parecido. Sobre esta línea de trabajo son muy pocos los que están trabajando.

¿Está disponible este recurso?
Si yo dejé un repositorio, dejé el Corpus como para que si alguno quiera experimentar. Como parte de una contribución científica sé que algunos ya lo están usando porque me lo han comentado, inclusive uno de los jurados me comentó que lo estaba usando.

¿Dónde se encuentra?
Tendría que pasarte el link  es un repositorio de GitHub que tiene mis iniciales ‘vbmercado’  me parece que le puse ‘Corpus periodistas argentinos’. GitHub es una herramienta que usamos mucho los desarrolladores para tener controles de cambios lo dejamos ahí para que quede en forma colaborativo y abierto.

¿Te encontraste en artículos periodísticos de llegada nacional o también has investigado sobre los medios de Santa Cruz?
Lo manejé a nivel nacional.

¿Qué sigue después de esto?
Estos días acomodar un poco la cabeza, ponerme al día con mis clases porque suspendí un poco mis actividades la semana pasada, estaba un poco nerviosa. Mi idea es continuar y realizar algún doctorado. 
En el tema de pandemia justo me inscribí en una especialización en docencia universitaria, mi intención es este año o el año que viene a más tardar en marzo presentar el trabajo final integrador.
Estoy trabajando con apropiación de tecnologías, en este caso con Chatbot  con intencionalidad educativa. Hay una serie de desafíos, iniciativas y cosas por revisar tengo ganas de concluir eso y después continuar con el doctorado. Capaz que lo hago en forma paralela, y armo  el borrador para ingresar a un doctorado y ya empezar a trabajar para en un par de años sacar un doctorado.
Seguir investigando es parte de nuestro rol como como docente hacer investigación, hacer  extensión, es algo que me apasiona.

 

Formulario para denuncias de violencia de género

Carreras de Postgrado