¿Por qué hay tantos artículos en el idioma Cebuano en Wikipedia?

Las raíces de cómo la Wikipedia de Cebuano obtuvo tantos artículos hoy se remontan a una década, mucho antes de Sverker Johansson y Lsjbot.

A finales de 2006, notamos que había un gran salto en la cantidad de artículos en la Wikipedia de Cebuano. Esta fue una época en que la Wikipedia en tagalo solo tenía unos pocos miles de artículos, las otras Wikipedias en idioma filipino solo tenían unos pocos cientos o un par de miles, y la gran mayoría de los Wikipedia filipinos en ese momento solo contribuían en inglés.

Cuando intentamos determinar la causa, descubrimos que el Wikipedian líder en el proyecto, Usuario: Bentong Isles, escribió un bot para descargar artículos en todas las comunas de Francia (más de 50,000) en una Wikipedia de Cebuano que en ese entonces solo tenía un par de mil artículos. Hay un (tipo de) precedente para esto: Rambot, escrito por Derek Ramsey (Usuario: Ram-Man), hizo esto para las ciudades de EE. UU. En la Wikipedia en inglés en 2002 y 2003. ¿Pero las comunas francesas en una Wikipedia en idioma filipino?

El efecto fue inmediato: la Wikipedia de Cebuano pasó de tener ese par de miles a convertirse en la Wikipedia en idioma filipino más grande en términos de conteo de artículos. Estoy seguro de que los motivos de Bentong eran y son nobles, y aunque ya no está activo en Wikipedia, seguimos en contacto, manteniéndolo informado sobre lo que sucede en la comunidad. Sin embargo, hubo un par de problemas con el basurero masivo que me preocuparon a mí y a muchos otros Wikipedia. Éstas eran:

  • El contenido local fue ahogado . Básicamente, cada vez que hace clic en “Artículo aleatorio”, obtiene un artículo sobre una comuna francesa la mayor parte del tiempo (si no todo el tiempo), y no sobre un tema relevante para un hablante de cebuano. En los círculos de Wikipedia, la Wikipedia de Cebuano se llamaba “la Wikipedia de las comunas francesas”, para vergüenza de la comunidad local (particularmente cuando se reunía con otros wikipedistas en el extranjero), y la Wikipedia indonesia en un momento tenía un mecanismo de monitoreo para artículos aleatorios para asegurar que hubiera Una variedad de artículos que muestran en lugar de varios artículos sobre un tema singular en una sola sesión.
  • Se desencadenó una guerra de números entre Wikipedias locales . Las Wikipedias en idioma filipino comenzaron a superarse unas a otras en términos de perseguir recuentos de números, con Waray (algo que explico con más detalle aquí) y Tagalog como los culpables más atroces. Por lo tanto, hubo un enfoque alejado de la calidad hacia la cantidad, con un gran número de artículos de una sola línea inundando estas tres Wikipedias. Afortunadamente para nosotros, el problema fue menos grave en las Wikipedias de Kapampangan, Chavacano y Pangasinan, y Bikol e Ilokano lograron escapar por completo.

La llegada de Lsjbot a la escena no cambió mucho las cosas, pero sí cambió el cálculo de cómo se agregaron los artículos. Antes de que llegara Lsjbot, en las tres Wikipedias que mencioné, se agregaron a mano trozos de una línea, decenas o cientos a la vez. Ahora tenía un bot capaz de arrojar miles de artículos de una sola vez, como juguetes que salen de una línea de ensamblaje totalmente automatizada, y la comunidad (para entonces ya no dirigida por Bentong) le dijo que sí.

Hace un par de años, yo y otros Wikipedia filipinos le preguntamos a Sverker Johansson fuera de la wiki (bueno, en Facebook) por qué hizo Lsjbot en primer lugar. Su argumento básicamente se redujo a una premisa bastante simple: atraer a la gente para que edite con contenido que ya está allí .

Creo que la premisa de Lsjbot es noble, y realmente creo que Sverker realmente quiere ayudar a las Wikipedias de Cebuano y Waray de cualquier manera que pueda. Dicho esto, como alguien que ha estado tratando de descubrir por qué tan pocos filipinos contribuyen a Wikipedia, y aún más por qué tan pocos filipinos contribuyen en otros idiomas además del inglés, tengo problemas importantes con la forma en que se relaciona con la realidad en el terreno, y más aún esta obsesión por la cantidad sobre la calidad.

El mayor problema que tengo con el enfoque de “construirlo y vendrán” es que puede ser muy exigente para las pequeñas comunidades mantener todo ese contenido . La Wikipedia en tagalo tiene la comunidad más grande de todas las Wikipedias en idioma filipino, pero no tenemos los números que la Wikipedia en inglés tiene en términos de mano de obra.

Gracias a varios vertederos a lo largo de los años, hoy tenemos alrededor de 65,000 artículos, pero muchos de los artículos arrojados al proyecto no se han actualizado y probablemente no se tocarán hasta que la comunidad crezca más allá de su tamaño actual. Estamos buscando formas de abordar este problema, incluida la ampliación de trozos cuando vemos uno, pero una ventaja para evitar el vertido en las Wikipedias de Cebuano y Waray es que tenemos un conteo de profundidad más alto: una hazaña solo superada por la Wikipedia de Ilokano (que tiene un editor súper prolífico que se toma su tiempo escribiendo artículos).

Imagine lo que sucedería si tuviéramos más de tres millones de artículos, como es el caso de Cebuano hoy, y solo diez editores para mantenerlo todo. Sería una tarea gigantesca, con nosotros abrumados con todos los nuevos artículos que tendríamos que mantener. Esto eliminaría nuestra capacidad de ampliar los temas relevantes para los hablantes locales (ergo, temas relacionados con Filipinas), y es una razón muy importante por la que nos negamos a firmar el proyecto de Sverker o los vertederos de otros Wikipedia que lo precedieron. (En un momento, casi celebramos una votación sobre si todos los talones deberían eliminarse o no para “normalizar” la situación).

Esto puede sonar egoísta, pero ¿quién tiene que lidiar con la masa de artículos que se quedan atrás? La comunidad central lo hace. La observación anecdótica a lo largo de los años me ha llevado a concluir que la Wikipedia de Cebuano nunca tuvo la masa de editores que Lsjbot prometió que vendría una vez que hiciera su trabajo. Ahora Sverker, en su haber, también ha dirigido talleres de edición en Cebú (con y sin el apoyo de Wikimedia Filipinas), pero una cosa que yo y otros hemos llegado a lidiar con los años es cómo podemos hacer que los editores de Wikipedia se queden y se conviertan en Wikipedia. ¿Es algo cultural que los filipinos no quieren contribuir? ¿Creen que la curva de aprendizaje es demasiado empinada o que el rigor de Wikipedia es demasiado para ellos? ¿Debemos recurrir a darles incentivos (aparte de pagarles, ya que la edición paga es un anatema para el movimiento Wikimedia) para que puedan quedarse? Todavía estamos tratando de encontrar respuestas a estas preguntas.

Dicho esto, estoy seguro de una cosa: tirar millones de artículos para atraer editores no ha funcionado ni funciona. Tiene que haber una mejor manera, y tenemos que trabajar juntos para encontrar ese camino, el infierno o el apogeo.

Además de lo que escribieron Uri Granta y Richard Morris, en su mayoría son trozos traducidos por máquina agregados por LSJbot (originalmente creado para WP sueco), porque la esposa del creador de LSJ Johansson, Smiley, es Cebuano .

Casi ninguno de ellos trata sobre temas filipinos, y mucho menos sobre Cebuano.

Si busca un tema filipino popular, por ejemplo, “Anne Curtis”, solo obtiene dos hits en filipinos, el resto son características geográficas en todo el mundo de habla inglesa que simplemente contienen la palabra “Anne”.

Hay algunas discrepancias extrañas:

  • Artículos como Gwen Garcia (ceb) tienen mucho menos contenido que Gwendolyn Garcia (en), aunque ambos se actualizaron en 7/2016. Lsjbot debe haber estado trabajando en una versión anterior o no ha traducido algunas secciones por alguna razón.
  • El artículo para la ciudad de Carcar (ceb) enumera varios habitantes más notables que Carcar (en).

Al igual que otras Wikipedias con recuentos de artículos demasiado inflados (como sueco, holandés, Waray-Waray y kazajo), la gran mayoría de los artículos fueron creados por bots y traducción automática en lugar de por humanos. En el caso de Cebuano, los artículos fueron creados principalmente por el programa Lsjbot y comprenden principalmente especies de animales y ubicaciones en Filipinas.

La Lista de Wikipedias de Wikipedia intenta tener esto en cuenta enumerando, además del recuento de artículos, una medida de profundidad heurística que se supone que es un indicador aproximado de la calidad, en función de la frecuencia con la que se actualizan los artículos. Si bien es posible jugar a esto también, la mayoría de los Wikis no lo hacen y hace que sea fácil diferenciar proyectos maduros como Wikipédia, l’encyclopédie libre y Wikipedia, la enciclopedia libre de bases de datos generadas por computadora como el proyecto Cebuano.

Mirando una página aleatoria Monts Sutton – Wikipedia parece que la página fue creada por un bot y se parece al artículo en la wikipedia sueca Monts Sutton – Wikipedia. El bot en cuestión es el Användare sueco: Lsjbot – Wikipedia y el algoritmo para generar los artículos se discute en Användare: Lsjbot / Algoritmer – Wikipedia. Por qué LSJ decidió apuntar al Cebuano está más allá de mí.