Ir al contenido

💬 Guía de Transcripciones

Esta guía cubre todo lo que necesita saber sobre la transcripción de archivos de audio y video en Uspeech Analytics.


Uspeech Analytics utiliza IA avanzada para convertir sus grabaciones de audio y video en texto preciso y búsqueable. El motor de transcripción:

  • Soporta múltiples idiomas (inglés, español, ucraniano y más, con detección automática)
  • Identifica automáticamente a diferentes hablantes
  • Proporciona marcas de tiempo a nivel de turno (opcional)
  • Maneja diversas calidades de audio y acentos

  1. Navegue a la pestaña Transcripción
  2. Haga clic en Crear Proyecto en el menú desplegable Proyecto Crear nuevo proyecto
  3. Elija la configuración del proyecto:
    • Título del Proyecto - ingrese un nombre para su proyecto
    • Tipo de archivo de audio - seleccione el tipo de archivos de audio que desea transcribir. Los tipos disponibles son: Entrevista para entrevistas en profundidad, Grupo Focal para discusiones grupales, Llamada para llamadas telefónicas/video
    • Retomar marcas de tiempo - seleccione esta opción si desea incluir marcas de tiempo en la transcripción
    • Idioma - seleccione el idioma de sus archivos de audio. La única opción disponible es Automático Configuración del proyecto
  1. Navegue a su proyecto de Análisis de Audio
  2. Haga clic en Subir Archivos y seleccione un o más archivos de audio/video
  3. Espere a que se complete la carga. Los archivos aparecerán en la tabla Mis archivos con el estado Subido (o Transcrito en caso de archivos SRT)
  4. Selecciona uno o más archivos que necesitas transcribir y haga clic en el botón Transcribir También puedes hacer clic en tres puntos cerca del nombre del archivo y seleccionar Transcribir
  5. El estado cambiará a “Transcribiendo” - el procesamiento típicamente toma aproximadamente 1/8 de la duración del audio
  6. Una vez completado, el estado cambiará a “Transcrito” y haga clic en el nombre del archivo para revisar Archivos transcritos

💡 Consejo: recibirás un correo electrónico cuando el proceso de transcripción se complete. Para activar las notificaciones por correo electrónico, ve a Perfil, marque “Notificar finalización de trabajo” y haga clic en Guardar.

⚠️ Importante: cualquier archivo de audio transcribido se facturará por su duración, después de que se complete la transcripción, independientemente del número de tipos de análisis. Sin embargo, los archivos de transcripción subidos no se facturan hasta que se realice el análisis sobre ellos.

  1. Haga clic en el nombre del archivo para abrir los detalles del archivo o la vista de transcripción
  2. Revise la transcripción
  1. Elija uno o más archivos con estado “Transcrito”
  2. Haga clic en el botón Descargar. La transcripción se descargará en formato Word Document (docx).

FormatoExtensiónNotas
MP3.mp3Más común, ampliamente soportado
WAV.wavSin compresión, mayor calidad
M4A.m4aFormato Apple, buena compresión
AAC.aacCodificación de Audio Avanzada
OGG.oggFormato abierto
FLAC.flacCompresión sin pérdida
FormatoExtensiónNotas
MP4.mp4Formato de video más común
MOV.movFormato Apple QuickTime
AVI.aviFormato Windows
WebM.webmFormato optimizado para web
FormatoExtensiónNotas
SRT.srtSubRip Subtitle format
  • Duración máxima: 2 horas por archivo
  • Tamaño máximo de archivo: 500 MB
  • Calidad mínima: Se recomienda tasa de bits de audio de 16 kbps

Al crear o editar un proyecto de Análisis de Audio, puede configurar ajustes predeterminados que se aplican a todas las nuevas cargas.

Elija el tipo de contenido que está transcribiendo para optimizar los resultados:

Tipo de AudioIdeal ParaCómo Ayuda
EntrevistaConversaciones uno a unoOptimizado para 2 hablantes, turnos claros
Grupo FocalDiscusiones grupalesMejor manejo de múltiples hablantes, habla superpuesta
LlamadaLlamadas telefónicas/videoManeja calidad de audio variable, eco
OpciónDescripción
AutoDetecta automáticamente el idioma hablado (recomendado para contenido multilingüe)

💡Consejo: Use la detección automática a menos que experimente problemas de reconocimiento con un idioma específico.

ConfiguraciónDescripción
Desactivado (predeterminado)La transcripción muestra turnos de hablantes sin marcas de tiempo — más limpio para lectura
ActivadoIncluye marcas de tiempo a nivel de palabra — útil para edición de video, citas precisas

El sistema identifica automáticamente a diferentes hablantes y los etiqueta. Si es posible, también intenta identificar el rol de cada hablante (interviewer, participant):

Interviewer: Gracias por acompañarnos hoy. ¿Puede contarme sobre su experiencia?
Participant: Por supuesto. He estado usando el producto durante unos seis meses...

Nota: Las etiquetas de hablantes son consistentes dentro de un archivo (el Hablante 1 siempre es la misma persona), pero pueden variar entre diferentes archivos.

Su transcripción incluye:

  1. Etiquetas de hablantes — Quién está hablando
  2. Contenido del habla — Lo que se dijo
  3. Marcas de tiempo (si están habilitadas) — Cuándo se dijo

EstadoSignificadoAcción
SubidoArchivo subido, listo para transcripciónHaga clic en “Transcribir” para comenzar
ProcesandoProcesamiento en progresoEspere a que se complete
TranscritoTranscripción completadaVer o descargar transcripción
FallidoOcurrió un errorIntente volver a subir o contacte soporte

  1. Use equipo de calidad — Un micrófono decente hace una gran diferencia
  2. Minimice el ruido de fondo — Grabe en ambientes silenciosos
  3. Posicione los micrófonos correctamente — Asegúrese de que todos los hablantes sean audibles
  4. Pruebe los niveles — Haga una grabación de prueba corta primero
  1. Recorte secciones innecesarias — Elimine silencios largos o partes irrelevantes
  2. Use formatos comunes — MP3 o M4A funcionan mejor
  3. Mantenga archivos bajo 2 horas — Divida grabaciones más largas
  4. Asegure volumen consistente — Normalice el audio si es necesario
  1. Revise la transcripción — La IA es precisa pero no perfecta
  2. Verifique las etiquetas de hablantes — Verifique la identificación de hablantes
  3. Note cualquier corrección — Mantenga registro de términos especializados o nombres

La transcripción está tardando demasiado

  • Archivos grandes (>1 hora) pueden tomar 15-30 minutos
  • Verifique su conexión a internet
  • Audio de muy mala calidad requiere más procesamiento

Precisión deficiente

  • Asegure que la calidad del audio sea suficiente (habla clara, ruido mínimo)
  • Intente configurar el idioma correcto manualmente en lugar de detección automática
  • Música de fondo o ruido impactan significativamente la precisión

Hablantes no identificados correctamente

  • Voces muy similares pueden confundirse
  • El habla superpuesta puede causar atribución incorrecta
  • Expresiones cortas pueden no atribuirse correctamente

El archivo no se sube

  • Verifique que el formato de archivo sea compatible
  • Asegúrese de que el archivo esté bajo 500 MB
  • Intente convertir a formato MP3
ErrorCausaSolución
”Archivo demasiado grande”Excede el límite de 500 MBComprima o divida el archivo
”Formato no soportado”Tipo de archivo no reconocidoConvierta a MP3 o WAV
”Procesamiento fallido”El audio no pudo procesarseVerifique calidad del audio, vuelva a subir
”Horas insuficientes”Límite de uso alcanzadoActualice suscripción o espere el reinicio

P: ¿Qué tan precisas son las transcripciones? R: La precisión típicamente varía del 90-98% dependiendo de la calidad del audio, acentos y ruido de fondo. Las grabaciones claras en inglés logran la mayor precisión.

P: ¿Puedo editar la transcripción? R: Actualmente, las transcripciones son de solo lectura en la aplicación. Descargue en formato Word para hacer ediciones.

P: ¿Están seguras mis grabaciones? R: Sí. Los archivos están encriptados en tránsito y en reposo. Las grabaciones se almacenan de forma privada y solo son accesibles para su equipo.

P: ¿Qué pasa con mis archivos de audio después de la transcripción? R: Los archivos se conservan en su proyecto hasta que los elimine. Puede eliminar archivos en cualquier momento.

P: ¿Puedo transcribir en múltiples idiomas en un archivo? R: Sí, use la configuración de idioma “Auto”. El sistema detectará y transcribirá contenido multilingüe.


Una vez que tenga transcripciones, puede:

  • Analizar conversaciones para extraer insights
  • Exportar transcripciones para usar en otras herramientas
  • Compartir resultados con su equipo