Puede usar el Análisis de clúster para ayudarlo con esto.
Ejecuta un algoritmo de agrupación en sus artículos de noticias y crea agrupaciones compuestas de artículos. La idea es que los grupos que se forman representan historias y los artículos en un grupo particular son sobre la misma historia. También puede inferir de qué historia trata un grupo en particular a través de otras técnicas de procesamiento del lenguaje natural.
Agrupar artículos de noticias de esta manera es un área bien explorada. Google News, entre otros, intenta resolver este problema en sus sistemas de grado de producción.
Una simple búsqueda en la web para “agrupar artículos de noticias” arroja:
- ¿Los estadounidenses se identifican más con las noticias que ven que con la fiesta para la que dicen ser?
- Cómo crear una compañía de medios en línea, cuyo único propósito es cubrir noticias difíciles
- ¿Por qué la televisión estadounidense no tiene requisitos de imparcialidad o precisión?
- ¿Cómo puedo aprender a consumir más información a un ritmo más rápido?
- ¿Es el New York Times una fuente imparcial (internacional)? ¿Por qué o por qué no?
- http: //googlenewsblog.blogspot.c…
- http://cs229.stanford.edu/proj20…
- http://faculty.cs.byu.edu/~denni…
- http://www.cs.cornell.edu/people…