transcribir vídeo a texto

Ya llevamos unos años oyendo lo de “el vídeo es el rey de los contenidos”. Cierto, pero cuando generamos vídeo necesitamos transcribirlo a texto para los subtítulos o para permitir que los lectores que no vean el vídeo no se pierdan el contenido. La pregunta es lógica: ¿cómo transcribir vídeo a texto automáticamente y gratis (si puede ser)?

Estos días estoy grabando y editando los vídeos del Festival Digital y me he visto obligada a hacer pruebas de múltiples sistemas de transcripción, así que he aprovechado para escribir el post y compartir los resultados.

¿Cómo he probado los sistemas de transcripción de vídeo automáticos?

He usado el mismo clip (este aquí abajo) que son los primeros segundos de Festival Digital :). He pasado el mismo clip por todos los sistemas, para ser justa.

Se trata de un clip en Español con acento de España con dos personas diferentes hablando.

¿Qué y cómo he valorado los sistemas para transcribir vídeo a texto?

  • Facilidad del proceso de darse de alta/empezar a usarlo
  • Facilidad de uso, es decir, si lo he podido usar sin buscar un tutorial en Youtube
  • Transcripción obtenida (allí donde hay resultado, os lo he copiado tal cual)
  • Precio de la aplicación
  • Resultado final

¿Qué sistemas he probado?

Los que aparecen en la página 1 de Google al poner “transcripción de vídeo a texto” y después “transcribe a video to text”. Como Google es listo, puede ser que no te salgan las mismas opciones con las mismas palabras.

Además he repasado los grupos de Facebook donde había surgido la pregunta y he valorado las opciones que se habían propuesto.

Resultados de las pruebas (al detalle)

Sistema de transcripción de vídeo 1: LIGRE

Facilidad del proceso de darse de alta/empezar a usarlo:

Un HORROR. Cuando veo un botón de “sign in with Google” lo uso porque me ahorra una contraseña. ¡Lo he hecho tres veces antes de darme cuenta que el botón no funciona! He seguido porque era un test para ti, en mi estándar, las webs con botones en la Home que no funcionan, no merecen que siga adelante.

Facilidad de uso:

Buena. Pantalla limpia con una sola opción. Muy bien. No me ha desconcertado en ningún momento.

Transcripción obtenida:

Es como si hubiera mezclado dos columnas de texto en una. Sale la mitad del texto del principio seguido de texto del medio.

Precio:

https://ligresoftware.com/premium/ Tiene una versión “free” que no es tan “free” porque es gratis para media hora, luego hay que pagar. Me da rabia la gente que ofrece un “gratis” falso.

Resultado final: NO APROVECHABLE

Sistema de transcripción de vídeo 2: AMAZON TRANSCRIBE

Facilidad del proceso de darse de alta/empezar a usarlo:

La usabilidad de AWS no es la mejor. Hay que saber moverse por dentro, pero una vez sabes como va, es manejable. Yo ya tengo cuenta en AWS para usarlo como “disco externo” así que no me he dado de alta, solo he añadido este servicio.

Facilidad de uso:

Hay que subir el fichero a S3 (y crear un bucket), si no lo has hecho antes, puedes ver tutoriales en YouTube que es fácil de hacer. He tenido que repetirlo porque solo funciona con ficheros subidos al servidor US-West y yo lo tengo en Europa.

Transcripción obtenida:

Pues. Bienvenidos a esta primera entrevista. El Festival Digital. Empezamos a lo grande. Hablando de estrategia y como no tenía traer año había esa persona que ya con perdón de la palabra dos hostias, cuando las necesito, se ella es mentora de negocias. Que perdón ellas, mentor, tenencias rentables, que para eso estamos. Lo había. Para los que no tengo dos Can. Presenta de por favor, basta ya de ser la persona que le atizó. Bueno, bueno, como todas dicho, vale, yo soy mentora de y de negocios, y a veces matizó para la transformación de negocios, para que funcionen

Precio:

Baratísima. Como todo en Amazon pagas lo que usas. Es decir que si lo usas mucho un mes pagas mucho y si no lo usas, no pagas. El precio es de 0,0004$/segundo. Para facilitarte el cálculo, 1,44$ por cada hora. Imbatible. 

Resultado final: ACEPTABLE

Sistema de transcripción de vídeo 3: VOICEBASE

Tenía buena pinta, me registré pero nunca me llegó el mail para activar mi cuenta. Fin.

Sistema de transcripción de vídeo 4: HAPPYSCRIBE

Facilidad del proceso de darse de alta/empezar a usarlo:

Ganador. Muy fácil y eficiente.

Facilidad de uso:

Excelente. Alguien que sabía mucho de usabilidad hizo un magnífico trabajo.

Transcripción obtenida:

Pues bienvenidos a esta primera entrevista del festival digital empezamos a lo grande hablando de estrategia y como no quería traer la palabra ellas mezcla de negocios ellas vendrán es rentable que para eso estamos gloria para los que no te conozcan preséntate por favor más allá de ser la persona que te hizo bueno de negocios y a veces me atizo para la transformación de negocios para que funcionen

Precio

Me parece caro porque el resultado no es mucho mejor que Amazon, pero el precio es 40 veces más elevado. El coste de una hora sería de 9€ vs 2 dólares de Amazon.

Resultado final: NO VALE LA PENA

Sistema de transcripción de vídeo 5: SONIX

Facilidad del proceso de darse de alta/empezar a usarlo:

Muy bien. Rápido y eficaz.

Facilidad de uso:

Muy bien. Al entrar tienes un botón grande que dice: sube tu fichero. Puede parecer simple, pero es altamente eficaz.

Transcripción obtenida:

Pues bienvenidos a esta primera entrevista del festival digital empezamos a lo grande ahondando la estrategia y como no quería traer gloria es esa persona querida con perdón de la palabra cuando la necesito.: Ella es mentora de negocios.Pero con ellas me entrego a negocios rentables que para eso estamos gloría para que no te conozcan preséntate por favor. Más allá de ser la persona Que a ti no como tú has dicho vale. Yo soy mentora de negocios y a veces más para la transformación de negocios para que funcionen.

Precio:

Son 15$ al mes por tener acceso y luego 5$ por cada hora convertida. Si empiezas a sumar es una burrada de dinero.

Resultado final: BUENO PERO CARO

Sistema de transcripción de vídeo 6: GOOGLE DOCS

Facilidad del proceso de darse de alta/empezar a usarlo:

Pues si tienes cuenta de Gmail, facilísimo.

Facilidad de uso:

En un clic. Sin instalar y sin altas.

Transcripción obtenida:

Tengo que hacer un aparte. La calidad si le hablas a Google Docs es EXCELENTE. Verdaderamente lo mejor con muchísima diferencia. No se ha equivocado ni en una coma

El problema es que no “oye” el vídeo si lo reproduzco en el ordenador. He probado reproduciendo desde el móvil delante del micro y tampoco lo pilla. Es decir: no sirve para vídeos. Tengo que hacer la prueba con el vídeo en directo.

Precio:

Gratis total.

Resultado final: NO ACEPTABLE PARA VÍDEOS, EXCELENTE PARA DICTARLE A GOOGLE. A las malas, puedes volver a “hablarle” los vídeos para que los transcriba sin error ninguno. Es más rápido que editar algunas transcripciones de las de más arriba. 

Otros sistemas y comentarios

  1. OTranscribe: es como el transcriptor de YouTube pero sin sincronizar. No me sirve
  2. Extensión de Google Docs “Transcribe”: tampoco oye los vídeos, le pasa como a la funcionalidad de escritura por voz. Muy bien en directo pero no en grabado
  3. YouTube tenía una funcionalidad para poner subtítulos automáticos (aunque no fueran perfectos) pero ya no está disponible :(

Conclusión: ¿Cuál es el mejor sistema para transcribir vídeo a texto?

En contra de lo establecido: ¡lo barato es lo mejor!

Para un vídeo más formal, como un curso online, donde habla una persona sola y no “conversa alegremente”, Amazon té dará buen resultado. Si vas a transcribir de vídeo a texto una entrevista… creo que te saldrá más a cuenta “dictársela” a Google Docs que aprovechar las transcripciones automáticas online.

¿Lo has probado? ¿Me cuentas cómo te ha ido?

36 comentarios en “6 sistemas para transcribir video texto, con sus resultados”

  1. Hola Alba. Pues ando en las mismas y encontre una programa que procesa los audios extensos y los transcribe. Es el Adobe Premier Pro el cual puede extraer un texto de un video o de un audio y al seleccionar la opcion de procesamiento utiliza un programa que viene junto el Adobe Encore que se encarga de analizar los audios. Te lo recomiendo bastante y estan empezando a subir videos de como hacerlo y tambien tiene diccionarios de diferentes idiomas.

    1. Hola Oriol
      Mil gracias por la recomendacion! Lo probaré y te comento! A ver si encontramos una solución que nos sirva para resolver este tema a todos los que lo necesitan :)
      Un abrazo!

  2. Hola Alba,,me interesa transcribir unas conferencias en directo o grabadas a texto, ¿es posible a voz también? aparte de los costes por segundo que otro coste hay,disculpa es a nivel particular, hay tutoriales en castellano de como usarlo.
    un saludo y muchas gracias

    1. Hola Victor,
      Para voz en directo el transcriptor de Google es lo mejor. Par ala voz grabada sigo sin una solución ideal. Si son en inglés los transcriptores funcionan mucho mejor que en castellano!
      Un abrazo

  3. Hola, tienes alguna recomendación de software que transcriba una grabación en audio a texto, que reconozca distintos hablantes y que sea medianamente fiel al audio? He probado Watson Speech to Text de IBM y es un desastre para este punto, transcribe cualquier cosa!
    Me cuentas que recomiendas

    1. Hola FRancisca
      La verdad es que escribí el post movida por mi propia experiencia y no acabé de encontrar ninguno que funcionara todo lo bien que necesitaba. Vistos los comentarios, creo que seguimos igual :) Con audio grabado, la verdad es que no tengo nada que funciona bien bien. Si alguien lo tiene que lo comente aquí así todos podemos ayudarnos!

  4. HOla Alba, Voicebase mudó a Cielo24.. por eso no contestan….En castellano no funciona muy bien, y desde que dejaron de ser VOice base el inglés tampoco lo hace muy bien…
    tambien he probado Amberscript que funciona bien y fácil, pero es carisísimo….

  5. Gracias Alba, me has dado una idea y ahora te doy yo una a ti!
    Si configuras tu pc para que el micro que usa sea la «mezcla estéreo», entonces el PC usa el sonido de la tarjeta de sonido (es decir, lo que reproduces con el pc) como si fuera un micrófono. Es algo que uso mucho para otros menesteres.
    Pues bien, con el dictado de Google Docs y esta sencilla configuración tienes un resultado bueno, bonito y gratis ;)

    Un saludo

    1. Saludos Alba, muchas gracias por tu artículo, ya a Miguel por la idea.

      Buscando un poco más en la red, encontré otro artículo que trata este mismo tema, y utilizan la aplicación VB-Cable, se instala en la PC como un dispositivo de audio virtual, que funciona como un cable de audio virtual. Todo el audio que entra por la entrada CABLE se envía simplemente a la salida CABLE, es decir, simula ser el microfono (entrada CABLE) para transferir el sonido de manera interna y sin perder calidad hacia el altavoz (salida CABLE).

      Al configurar tanto la entrada y salida de audio, se activa la reproducción de video o audio de cualquier reproductor de multimedia, ya sea web (youtube, vimeo, entre otros) o de escritorio (VLC, windows media player, footbar, winamp, MPC-HC) y activas el dictado por voz de Google Docs.

      El único inconveniente, que no puedes escuchar el audio mientras se reproduce, pero si puedes leer el texto que procesa Google Docs, posterior a esto, realizar las correcciones respectivas al texto. Por último y muy importante, es volver a configurar la entrada y salida de audio en el PC, y de esta reconocer nuevamente el micrófono y altavoces.

      Fuentes:
      Cómo transcribir el audio de un vídeo a texto – https://www.elgrupoinformatico.com/tutoriales/como-transcribir-audio-video-texto-t77423.html
      VB-Cable – https://www.vb-audio.com/Cable/

  6. ¡Hola! Muchas gracias por la entrada! Acabo de probar Google Docs y sí que me reconoce el sonido de un vídeo desde VLC, aunque el resultado no es perfecto. No sé si el micro de mi ordenador ya estaba configurado en «mezcla estéreo» como dice Miguel, pero a mí sí me funciona. Quería probar Amazon para ver qué tal. ¡Gracias!

    1. Si, funciona! Es una primera pasada para no tener que transcribir a mano y va mejor que Amazon. Siempre hay que editar pero es un trabajo más ligero. Me alegro de que te sirva!!

  7. queridoas amigos cuando deseo trasncribir a texto un video.audio de youtube y no aprece el icoino de subtitulos no puedo hacerlo. nO ME LO PERMITE. Con el icono de subtitu EN LA PARTE INFERIOR DERECHA DE LA CARATULA SI ME LO PERMITE ????????
    PUEDE ALGUIEN DECIRME PORQUÉ »????

  8. Hola… Interesante. He llegado buscando para la solucion a los videos grabados en camara o conferencias.
    Te cuento que intente con google docs y aunque vi tutoriales donde si salio… en mis varios intentos no se pudo.

    Encontre una opcion que, aunque tu la citas de cierta manera no es la misma de subtitulos y es el youtube, lo que hago es subir el video al canal que tengo y pedir la transcripcion. Hay que hacer una edicion y acomodado del texto por docs o word pero es la que mejor me ha salido para mi caso. Esta opcion la encuentras esquina baja derecha en los tres punticos. Espero sirva a alguien y felicidades

  9. Estupendo el artículo, gracias por dar tu conocimiento a la red.
    Voy a probar lo del Google docs con la opción del micro mezclado.

    También he probado Happy scribe pero es lo que dices que se va de precio.

    Saludos desde Invirtiendo a la Buena.

  10. Hola Alba! Muchas gracias por los datos, yo queria preguntar a ver si consigo una ayuda, me han dado un video de una entrevista en ingles y necesito traducirlo al espanol, que programa o pagina me podrian recomendar para hacer el transcript, tengo que colocar las traducciones segundo por segundo.
    Muchas gracias!

    1. Hola Mauricio, No toco mucho el tema de traducción automática, porque solo trabajo en español. Subtitulos de YouTube? Estoy pensando en voz alta. Sorry no poder ser de más ayuda.

  11. Hola Alba,

    Para que el reconocimiento vocal de google docs «oiga» los videos puedes probar a hacerle un puente a la tarjeta de sonido, con un cable minijack minijack (se encuentra hasta en los chinos) conectas la salida de los auriculares con la entrada audio (la del micro) y así «engañas» al programa y puedes reproducir el video desde el mismo ordenador. Mis estudiantes de árabe lo hacen siempre para evitar trabajar cuando les mando tareas de transcripción y el resultado es bueno (y si con el árabe dialectal funciona con el español peninsular tiene que volar)

  12. Leonidas Cajar Cabrera

    Alba, escribo desde Panamá y te felicito por facilitar informacion valiosa. Tengo entrevists en videos para transcribir a texto y volver a revistals coon los entrevistados. Probare SONIX y te dejo saber. Muchas gracias Que bueo que la pandemia dejo buenas cosas en pie, como tu blog. Salud

  13. Para que un doc de Google Drive te detecte el audio del video hay que configurar lo siguiente:

    – clik derecho sobre icono de altavoz, en barra inferior, a la derecha.
    – «Dispositivos de grabacion»
    – En el listado de dispositivos elegir el «Mezcla estéreo».
    – clic derecho sobre Este : elegir «Establecer como dispositivo predeterminado»

    – Con este paso hacemos que el micrófono sea lo que se reproduzca en video.

    No olvidéis revertir la configuración cuando acabes el trabajo, de lo contrario la entra de micro del PC no funcionará, por ejemplo en videoconferencias.

    1. pablo intento hacer lo que dices pero no se me activa al mezcla de stereo, sera porque la maquina que tengo de mi oficina esta viejita, trae windows 7

      1. En esos casos, creo que YouTube tendrá mejores respuestas, porque dependerá de la configuración. Si buscas en YouTube, asegurate si es windows de 32 o de 64 y ahi seguro encuentras respuesta.

  14. Quiero que mi madre deje de estar transcribiendo por horas los datos de los videos q realiza por zoom para su jefe.. quisiera una herramienta que lo haga fácil para ella,.. Sabes alguna herramienta q sea descargable, al español y sea offline

    1. Hola Leo, No tengo una solucion descargable, pero sí que Zoom tiene Apps adicionales y hay varias que transcriben el texto, igual eso la puede ayudar?

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *