Dado que las colecciones de trabajos publicados pueden ser muy grandes y los criterios pueden ser muy específicos (‘encontrar una oración que contenga un perro y un vegetal relacionado a través del verbo’), los métodos computacionales pueden ser la mejor manera de hacerlo.
En este caso, lo siguiente puede ser útil: una ontología o taxonomía que describe las diferentes instancias de perros y zanahorias, una lista de verbos o parte del marcador de voz para identificar verbos, una forma de generar un árbol de análisis para asegurar que el verbo relaciona al perro y vegetales, y un marco de desambiguación de sentido de palabra para asegurarse de que realmente se trata de caninos y plantas en lugar de salchichas y personas paralizadas. (existen muchas otras tecnologías que resultan en una mejora de la búsqueda, como la resolución de referencia conjunta, pero no iremos allí).
Los enfoques computacionales actualmente pueden encontrar oraciones que contienen indicadores de ciertas necesidades o emociones (‘Tengo ganas de comer’ -> hambre), oraciones que terminan o contienen alguna palabra que rima con una palabra dada, oraciones de varias longitudes, oraciones que contienen errores tipográficos y oraciones que coinciden con muchos otros criterios.
- Tengo la intención de publicar un pequeño libro de ideas / citas en inglés sobre una variedad de temas. ¿Dónde debo comenzar el proceso?
- En total, ¿cuántos libros sobre The Beatles solo se han escrito y publicado?
- ¿Cuáles son los editores que dan oportunidad a nuevos autores?
- Cómo encontrar un escritor fantasma talentoso
- Pregunta de la encuesta: ¿en qué formato prefiere leer libros antiguos (tapa dura o rústica) o el nuevo formato electrónico (iPads y kindles)?