Propuestas de TFMI de Daniel Gayo (Octubre de 2007)

50 %
50 %
Information about Propuestas de TFMI de Daniel Gayo (Octubre de 2007)

Published on March 10, 2008

Author: daniel.gayo

Source: slideshare.net

Description

Jornada de presentación de propuestas de Proyectos Fin de Máster Investigador "Máster e
Ingeniería Web" - EUITIO
Propuestas de Daniel Gayo
Oviedo, 10 de Octubre de 2007

Jornada de presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Propuestas de Daniel Gayo Oviedo, 10 de Octubre de 2007

Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

En pocas palabras… 4+1 proyectos fin de máster Relacionados con recuperación de información , semántica en la Web, “crowd intelligence” , etc. Características comunes a todos los proyectos: Problema realista y totalmente actual Susceptible de evaluación rigurosa Posibilidad de participación en congresos o workshops Desarrollo de prototipos (Java, C#, Python, Ruby, etc.) Publicación de, al menos, un artículo Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

4+1 proyectos fin de máster

Relacionados con recuperación de información , semántica en la Web, “crowd intelligence” , etc.

Características comunes a todos los proyectos:

Problema realista y totalmente actual

Susceptible de evaluación rigurosa

Posibilidad de participación en congresos o workshops

Desarrollo de prototipos (Java, C#, Python, Ruby, etc.)

Publicación de, al menos, un artículo

5% Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

Web Spam Challenge The goal of the Web Spam Challenge is to identify and compare Machine Learning (ML) methods for automatically labelling structured data represented as graphs . More precisely, we focus on the problem of labelling all nodes of a graph from a partial labelling of them. The application we study is Web Spam Detection , where we want to detect deliberate actions of deception aimed at the ranking functions used by search engines. The challenge will explore the web spam detection problem through a series of tests performed on Web Spam Labelling tasks using ML techniques. En 2007 primera edición, en 2008 es más que probable que haya una segunda… Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

The goal of the Web Spam Challenge is to identify and compare Machine Learning (ML) methods for automatically labelling structured data represented as graphs . More precisely, we focus on the problem of labelling all nodes of a graph from a partial labelling of them. The application we study is Web Spam Detection , where we want to detect deliberate actions of deception aimed at the ranking functions used by search engines.

The challenge will explore the web spam detection problem through a series of tests performed on Web Spam Labelling tasks using ML techniques.

En 2007 primera edición, en 2008 es más que probable que haya una segunda…

5% Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

5% Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

CLEANEVAL CLEANEVAL is a shared task and competitive evaluation on the topic of cleaning arbitrary web pages , with the goal of preparing web data for use as a corpus , for linguistic and language technology research and development. A prize of £250.00 (GBP) will be awarded for the best student entrant for each task (Chinese and English). Se celebró por primera vez en 2007 primera edición, en 2008 es probable que se repita… Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

CLEANEVAL is a shared task and competitive evaluation on the topic of cleaning arbitrary web pages , with the goal of preparing web data for use as a corpus , for linguistic and language technology research and development.

A prize of £250.00 (GBP) will be awarded for the best student entrant for each task (Chinese and English).

Se celebró por primera vez en 2007 primera edición, en 2008 es probable que se repita…

5% … 2940149 american cancer institute 2940149 cancer institute 2940149 clinical trials 2940149 pharmaceutical company 2940149 national cancer institute 2940149 dr. elmer huerta 2940149 big boy discrography 2940149 big boy discrography 2940149 big boy discography 2940149 gilberto santa rosa la conciencia lyrics 2940149 www.lib.um.edu 2940149 food and drug administration 2940149 translator … Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo We record everything you write here. Seco, N. y Cardoso, N. 2006, “Detecting User Sessions in the Tumba! Query Log”

Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo Generación de taxonomías/ontologías a partir de query logs Un query log es un archivo que contiene las consultas que los usuarios envían a un buscador. Dicha información puede segmentarse en sesiones mediante distintos tipos de algoritmos. Una vez obtenidas las sesiones pueden tratar de establecerse relaciones semánticas entre los términos usados en las consultas. Relaciones de sinonimia e hiponimia/hiperonimia (i.e relaciones IS-A ) pueden ser un buen punto de partida para construir taxonomías automáticas. ¿Relación con folksonomías y ontologías?

Un query log es un archivo que contiene las consultas que los usuarios envían a un buscador.

Dicha información puede segmentarse en sesiones mediante distintos tipos de algoritmos.

Una vez obtenidas las sesiones pueden tratar de establecerse relaciones semánticas entre los términos usados en las consultas.

Relaciones de sinonimia e hiponimia/hiperonimia (i.e relaciones IS-A ) pueden ser un buen punto de partida para construir taxonomías automáticas.

¿Relación con folksonomías y ontologías?

5% Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo Generación de redes semánticas mediante aprendizaje Hebbiano El modelo de aprendizaje Estimulo-Respuesta-Refuerzo es sencillo pero muy interesante. Aquellas parejas estímulo-respuesta más frecuentes se refuerzan mientras que las menos frecuentes se fijan con menor intensidad. Cuando un estímulo se asocia a otras respuestas la asociación inicial se debilita. Potencialmente tiene múltiples aplicaciones (folksonomías, traducción automática, …)

El modelo de aprendizaje Estimulo-Respuesta-Refuerzo es sencillo pero muy interesante.

Aquellas parejas estímulo-respuesta más frecuentes se refuerzan mientras que las menos frecuentes se fijan con menor intensidad.

Cuando un estímulo se asocia a otras respuestas la asociación inicial se debilita.

Potencialmente tiene múltiples aplicaciones (folksonomías, traducción automática, …)

5% Y cualquier otra idea que se os pueda ocurrir… Presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Oviedo, 10 de Octubre de 2007 Propuestas de Daniel Gayo

Jornada de presentación de propuestas de Proyectos Fin de Máster Investigador Máster en Ingeniería Web - EUITIO Turno de preguntas

Add a comment