Categorización de texto sensible al coste para el filtrado de contenidos inapropiados en Internet

  1. Puertas Sanz, Enrique
  2. Carrero García, Francisco
  3. Buenaga Rodríguez, Manuel de
  4. Gómez Hidalgo, José María
Aldizkaria:
Procesamiento del lenguaje natural

ISSN: 1135-5948

Argitalpen urtea: 2003

Zenbakia: 31

Orrialdeak: 13-20

Mota: Artikulua

Beste argitalpen batzuk: Procesamiento del lenguaje natural

Laburpena

El creciente problema del acceso a contenidos inapropiados de Internet se puede abordar como un problema de categorización automática de texto sensible al coste. En este artículo presentamos la evaluación comparativa de un rango representativo de algoritmos de aprendizaje y métodos de sensibilización al coste, sobre dos colecciones de páginas Web en español e inglés. Los resultados de nuestros experimentos son prometedores.