Comunidad CONICET
VALENTINI, FRANCISCO TOMÁS

Beca interna doctoral

Especialidad
Procesamiento de Lenguaje Natural e Inteligencia Artificial
Disciplina Científica
Informática y Comunicaciones
Tema
Procesamiento del Lenguaje Natural para la cuantificación de sesgos en textos: estudio y desarrollo de métodos computacionales
Lugar de Trabajo
INSTITUTO DE INVESTIGACION EN CIENCIAS DE LA COMPUTACION (ICC, CONICET-UBA)
Depende de
Ver más información Ver menos información
Dirección:
INT. GÜIRALDES 2160, C1428EGA - Capital Federal - Argentina
Ver mapa
Resumen Información suministrada por el agente en SIGEVA
Mi experiencia académica se centra en el desarrollo y evaluación de técnicas de medición de sesgos y, más recientemente, en sistemas de recuperación de información (IR), con especial atención en mejorar la interpretabilidad y reducir la brecha de disponibilidad de recursos en español. En el campo de la medición de sesgos, mi trabajo con las métricas basadas en la información mutua puntual (PMI) da una alternativa interpretable y con base estadística a los word embeddings para medir sesgos socia... Mi experiencia académica se centra en el desarrollo y evaluación de técnicas de medición de sesgos y, más recientemente, en sistemas de recuperación de información (IR), con especial atención en mejorar la interpretabilidad y reducir la brecha de disponibilidad de recursos en español. En el campo de la medición de sesgos, mi trabajo con las métricas basadas en la información mutua puntual (PMI) da una alternativa interpretable y con base estadística a los word embeddings para medir sesgos sociales en textos, sin las distorsiones de frecuencia de las métricas basadas en embeddings. Mi investigación reciente responde a los desafíos para hacer IR en español, donde la falta de conjuntos de datos de gran escala y alta calidad impide el desarrollo de sistemas robustos. En vista de esta brecha con respecto a otros idiomas, hemos creado nuevos conjuntos de datos para IR en español, que incluyen tópicos de relevancia para los hispanohablantes. El objetivo de esta línea de investigación es, en última instancia, mejorar el acceso a información precisa y relevante para los hispanohablantes.
Ver más Ver menos
Líneas de Investigación

Procesamiento de Lenguaje Natural, Word embeddings, Information retrieval

Ciencias naturales y exactas

  • Ciencias de la computación e información
  • Otras ciencias de la computación e información
Capacidades Tecnológicas

1 - Electrónica, TICs y telecomunicaciones

1.2 - Procesado de información, Sistemas de información, Gestión de la carga de trabajo

  • 1.2.3 - Inteligencia artificial (IA)
Palabras Clave
PROCESAMIENTO DEL LENGUAJE NATURALVECTORES DE PALABRASRECUPERACIÓN DE LA INFORMACIÓNNATURAL LANGUAGE PROCESSINGWORD EMBEDDINGSINFORMATION RETRIEVAL
Formación Académica

2011 - 2016

Licenciado en Economía

FACULTAD DE CIENCIAS ECONOMICAS, UNIVERSIDAD DE BUENOS AIRES

Formación de RRHH
Dirigido por:
FERNANDEZ SLEZAK, DIEGO
Carrera Investigador
FERNANDEZ SLEZAK, Diego Carrera Investigador