¿Cómo logran los canales de noticias almacenar su gran cantidad de datos?

A2A: y esto es el núcleo de lo que hago para vivir, así que intentaré mantener el nivel de detalle manejable. Digo esto porque es complicado …

Intentaré comenzar con el verano aunque:

Cada sistema que puede ser autónomo es, todo el texto sobre historias, guiones, etc., se encuentra en bases de datos comerciales especializadas que no son tan grandes.

Los flujos de trabajo de video se centran en un sistema de almacenamiento de producción que es uno o más volúmenes SAN o NAS en el rango de 90 TB a 1 PB, que se archivan en un robot de cinta local que puede expandirse al rango de múltiples PB si es necesario.

Oh pero los detalles!

Primero, hablemos de sus datos.

Los registros comerciales, incluido el seguimiento de ventas publicitarias, recursos humanos, etc., son principalmente texto y se almacenan en las bases de datos de los paquetes de software comercial especializado que han seleccionado. Todo esto se realiza como implementaciones de TI estándar. Tal vez también haya alguna migración a servicios en la nube para este tipo de cosas. En cualquier caso, estos sistemas generan niveles de datos de GB, principalmente en forma de copias de seguridad, y se implementan como sistemas independientes.

En términos de producción de contenido, antes de llegar al video (y al audio), notaré que la mayoría de las operaciones de TV usan algún tipo de gestión de listas de reproducción, ya sea en el Control maestro o en un NRCS (Sistema de control de NewsRoom) compatible con Media Object Server. estos sistemas son altamente redundantes, también en su mayoría simplemente deslizan texto (scripts, comandos MOS, XML, etc.) incluso cuando están a cargo de descargar cables de noticias (las agencias de noticias producen cables de noticias), por lo que, al igual que los sistemas de TI anteriores, generan principalmente niveles de GB de copias de seguridad sobre una base regular.

Obviamente, el video es la parte de los leones del almacenamiento. Pero también hay muchas categorías de esto.

En términos generales, H.264 no se usa como códec editorial , y nunca lo he visto como códec interno o predeterminado. A menudo, se hace un h.264 de alta calidad para su envío al sitio web, que usa su propio sistema de almacenamiento , y a menudo se encarga de crear sus propias ‘representaciones’: versiones duplicadas de H.264 a resoluciones más bajas que están disponibles basado en la velocidad de conexión de un cliente. Esto es administrado por el reproductor web, y aunque los flujos de trabajo de la sala de noticias alimentan los sistemas de publicación web, generalmente no administran directamente su almacenamiento. El almacenamiento para los servicios web de noticias variará enormemente con su afiliación a la red: todo esto se hace de manera centralizada ya sea Hearst o Scripps o CBS o ABC o Star News o BBC o Al J. Confía en mí cuando te digo que los administradores de estaciones de TV reales son feliz de no estar administrando sus servidores web …

También puede ver los sistemas de ‘cumplimiento’ basados ​​en h264 : estos registran la señal de retorno al aire y generalmente desde el aire 24/7 365 para evidencia de lo que realmente se transmitió , principalmente para anunciantes. Una vez más, los sistemas autónomos, pueden o no estar respaldados, en este caso el bajo rango de almacenamiento de TB, generalmente en un RAID en el servidor.

A medida que avanzamos para hablar sobre el video muy grande y completo de ‘calidad editorial’, vale la pena señalar que la mayoría de las salas de redacción ahora usan algún tipo de Sistema de Gestión de Activos de Medios (MAM) (divulgación completa: esto es en lo que me especializo) para catalogar su video y administrar flujos de trabajo, y la mayoría de estos generará un archivo proxy de baja resolución para obtener una vista previa del contenido dentro de la aplicación de gestión de activos. Esto es cada vez más, pero no siempre, h.264. Los sistemas NRCS aceptarán cada vez más las vistas previas de h264 para ver dentro de la lista de reproducción.

Los sistemas que usan video de resolución completa son generalmente:

  • Edición de estaciones de trabajo: tan solo 2 o 3 en operaciones pequeñas, hasta 50-100 en grandes, ejecutando Adobe Premiere, Avid, más probablemente FCP7 luego X, tal vez Edius o Sony Vegas en ocasiones.
  • Servidores de video: que graban HD-SDI (interfaz digital en serie) en archivos de video o reproducen archivos de video como señales HD-SDI. Muchos servidores de video en realidad reproducen el almacenamiento interno, pero R / W al almacenamiento central también.
  • Transcodificadores: nodos de procesamiento que convierten formatos de video
  • Archivos: copie nodos para migrar contenido a niveles inferiores de almacenamiento o distribución externa. (Estoy agrupando cosas como Aspera con Archive por simplicidad …)

Todo esto se conectará al Sistema de almacenamiento de nivel 1 : una red de área de almacenamiento (SAN) de canal de fibra o un almacenamiento conectado a la red (NAS) muy rápido y especializado como MediaGrid Shared Media Storage o EMC Isilon.

El contenido de Edición y Air Ready puede ser una amplia gama de combinaciones de códec y envoltorio. MXF ha asumido lentamente el control de MOV en términos de envoltorios, pero para los códecs, hay muchas operaciones diferentes que utilizan muchos códecs diferentes. XDCAM en sus muchos sabores son todos algo comunes (35Mbit y 50Mbit en particular) Reglas DNxHD en entornos Avid, AVC-Intra también sucede, las personas también corren en Apple ProRes, aunque no tanto. Los tamaños varían de 35Mbit a 400Mbit, siendo 50, 100 y 225 los más comunes.

(Ya no digo Editar o “Calidad” del aire, porque el video del teléfono celular sale al aire todo el tiempo, primero se transcodifica al formato de calidad completa, incluso si no se ve mejor, reproduce y edita más de manera confiable cuando coincide con el códec de la casa).

En un entorno de noticias moderno, en particular con las últimas versiones de Adobe Premiere, que maneja una gama más amplia de códecs en general, y líneas de tiempo de formato mixto, OKish, hay menos presión que nunca para procesar TODAS las imágenes entrantes en el códec de la casa. Esto me ha facilitado la vida, ya que tenemos menos recursos con 2 instancias de formato de calidad completa, que siempre fueron difíciles de manejar, especialmente porque a los productores de noticias les gusta quedarse con todo. Ciertamente, todos los activos creados en las bahías de edición se ajustan al códec interno, generalmente definido como el formato que escriben los servidores de video, y prefieren leer.

Todo esto se reduce a muchas TB de video, con Asset Management sentado en la parte superior para administrarlo, y agregando un 20% al tamaño de cada activo administrado para un archivo Proxy.

Las SAN y NAS generalmente se implementan para estas aplicaciones en función del ancho de banda requerido para servir a todos los nodos: usted calcula cuántas unidades necesita para alimentar a la bestia, y eso determina cuántos TB tiene. Algunas operaciones de bolsillo pueden agregar más almacenamiento de nivel 1 por razones de capacidad, pero rara vez. Por lo tanto, el Nivel 1 se llena rápidamente y debe ser administrado activamente, generalmente por el MAM.

Los departamentos de gráficos y promociones a menudo obtienen su propia SAN o NAS.

El nivel 2 y más allá ve mucha variedad. Nadie que conozco usa la nube como su único Nivel 2. Algunos lo usan como un Nivel 3. El Nivel 2 a menudo son solo robots de cinta LTO, algunas veces es el Nivel 3 y hay un NAS más grande y más lento como el Nivel 2. A menudo, el Nivel 1 volumen se refleja para la redundancia, por lo general a algo así como un volumen de clase de nivel 1.5; a menudo, este es el “viejo san” con un nuevo propósito. Para algunas operaciones, el Nivel 3 es un centro de datos remoto; a menudo, las operaciones de cinta grandes están centralizadas, pero en esos casos generalmente hay una copia de seguridad de cinta local del Nivel 1.

(Los archivos difieren de las copias de seguridad en que están diseñados para la restauración de activos individuales donde las copias de seguridad se dirigen a volúmenes y directorios para la recuperación ante desastres. El MAM invoca los archivos como parte de los flujos de trabajo, las copias de seguridad se realizan automáticamente y no se pueden usar para recuperar videos individuales archivos a través de la automatización.)

La mayoría de los lugares, todo, cada archivo de video, usado o no, se graba en cinta. Scalar i500 es lo que he visto con mayor frecuencia, mientras que otros proveedores hacen modelos equivalentes. Estos se pueden usar para archivos o copias de seguridad, incluso si las unidades y cintas individuales dentro del robot están dedicadas a una aplicación u otra.

Los sistemas son ciertamente de alta disponibilidad, pero también de muy alto rendimiento. A escalas más grandes, el ajuste de las redes de canales de fibra y las estrategias de creación de bandas de disco es complejo. Los editores de video son exigentes y no les gustan los cuadros caídos más que los operadores de reproducción en la sala de control.

Por lo general, estoy diseñando y administrando los flujos de trabajo, y si bien puede observar un crecimiento promedio de datos de operaciones durante 6 meses, la verdad es que varía enormemente e impredeciblemente. Los grandes eventos de noticias generan muchos más datos, y no sabes cuándo van a suceder, por lo que más TB en todas partes siempre es mejor. Dicho esto, todas estas operaciones se ejecutan con su almacenamiento al 75-90% lleno porque a nadie le gusta eliminar noticias que podrían aparecer nuevamente, y aunque los archivos crecen constantemente, incluso la restauración del archivo a menudo se ve dolorosamente lenta (ya que no es instantáneo) si se requiere contenido para una noticia de última hora. Estos sistemas nunca pueden ser demasiado grandes o demasiado rápidos.

More Interesting

¿Cuál es la definición de integración discursiva en relación con las noticias de televisión y las noticias de comedia?

¿En qué se diferencia el canal de noticias Mirror Now de Times Now?

¿Cuáles son los periódicos más imparciales en Estados Unidos?

¿Por qué los periódicos siguen funcionando incluso si tenemos un canal de noticias para ver noticias instantáneas?

En canales de noticias como CNN o redes de cable como CNBC, Bloomberg, etc., ¿se les paga a los invitados / expertos que están invitados a hablar o responder preguntas? Si es así, ¿típicamente cuánto?

¿Por qué los presentadores de noticias usan la frase 'en el aire'? ¿Cuál es el origen de esta frase?

¿Las noticias por cable y por red influyen en si realmente votarás? ¿Por qué?

¿Cómo se desarrollaría la sociedad si se prohibieran todos los canales de noticias en cualquier forma?

¿El contenido que los canales de noticias indios están mostrando para TRP o estos canales son genuinos en su enfoque?

¿Hay alguna API india de noticias para noticias y fotos diarias?

¿Cuáles son algunas diferencias de estilo y contenido entre las noticias vespertinas de los Estados Unidos (y los informes de noticias en general) y las noticias comparables en los países desarrollados?

¿Cómo se pueden recibir canales de noticias y deportes sin cable?

¿Por qué los periodistas de televisión y los presentadores de noticias tienden a hablar en un canto artificial?

¿Qué grupos de publicaciones de noticias indias son muy partidarios de vender propaganda de BJP?

Si pudiera otorgar un premio a la persona que considera el peor experto político en noticias por cable, ¿quién sería y por qué?