Whisper Mate
Speech Podcast Audio To Text
Sólo para Mac
Gratis · Compras dentro de la app
Whisper Mate es compatible con la transcripción por lotes de archivos de audio o películas en texto con el modelo de IA de Whisper de. Con un editor de subtítulos integrado para previsualizar el resultado de la transcripción segmento por segmento.
Todas las operaciones de transcripción se realizan en la máquina local. Mantenga su privacidad segura.
Características
- Transcribir archivos de audio o video
- Soporte para capturar y transcribir audio en otras aplicaciones como (Zoom/Skype/Teams/Otras aplicaciones, solo macOS13.0+ y se necesita permiso de grabación de pantalla)
- Usar la API gratuita de DeepL para traducir subtítulos
- Editor de subtítulos integrado para corregir la transcripción
- Exportar a SRT, VTT, CSV, JSON, SEGMENT
- Soporte para asignar un orador a cada subtítulo
- La mayoría de las operaciones admiten la selección por lotes para invocar. Como ejecutar tareas por lotes, traducir filas por lotes, establecer el orador de filas por lotes
- Soporte para arrastrar y soltar archivos para iniciar la transcripción
- Soporte para escribir en la búsqueda de la transcripción
- El editor puede previsualizar el archivo de audio o video sincronizando el rango de reproducción
- Exportar el rango de medios de los subtítulos seleccionados a un nuevo archivo de clip de medios
- Exportar video con subtítulos quemados al video original y estilo de subtítulos personalizado
- Previsualizar directamente los subtítulos dentro de la previsualización del video (el estilo de los subtítulos se puede personalizar en el panel de preferencias)
- Grabar audio del micrófono y admitir la transcripción en tiempo real (solo macOS13+)
- Funciones de fusión de subtítulos. El rango de segmento y los subtítulos se fusionarán en una fila.
- Grabar audio de la aplicación se guardará automáticamente en un archivo y se puede convertir en un nuevo proyecto de transcripción.
- Duplicar fila de subtítulo y permitir modificar su contenido o rango de tiempo para ajustar los subtítulos completos
- Soporte para personalizar la velocidad de reproducción en la vista previa de medios
- Soporte para ⌘+V para pegar archivos copiados en la cola de procesamiento
- Mostrar el porcentaje de uso de la CPU cuando whisper está procesando
- Soporte para archivar proyectos mediante el menú contextual (Mantener limpio el listado de proyectos en curso)
- Soporte para traducir subtítulos con Google Translate
- Vista previa de tamaño completo de medios con diseño de subtítulos
- Soporte para abrir archivos multimedia dentro de la función "Abrir con" del Finder
- Soporte para la conversión multiidioma
- Soporte para idiomas de uso frecuente personalizados para convertir o traducir
Más This is the best translation app for macOs ever
Respuesta del desarrollador Thank you very much for your supportive feedback
This is the best translation app for macOs ever
Thank you very much for your supportive feedback
- Añadido un módulo TTS independiente
- Nuevo módulo de generación TTS en el editor de subtítulos para sintetizar voz a partir del texto traducido con mayor comodidad
- Compatibilidad con el motor de transcripción WhisperMLX (macOS 14.0 o posterior)
- Motor de diarización WhisperKit (separación de hablantes)
- Motor FluidAudio actualizado a la versión V0.13.7
- Motor WhisperKit actualizado a la versión V0.17.0
- La transcripción en tiempo real puede exportarse directamente a archivos compatibles con OBS
- Varias herramientas para limpiar por lotes caracteres especiales en las líneas de subtítulos
- La supervisión de carpetas permite vincular grupos de proyectos concretos
- La ventana flotante de transcripción en tiempo real puede mostrarse y moverse entre espacios de aplicaciones a pantalla completa
- Corregidos varios problemas de la función de ajustes predefinidos
- Corregido un fallo por el que la exportación de segmentos de vídeo podía no completarse
12.0 27 abr
- Se actualizó el motor whisper.cpp a la versión v1.8.3, con Silero VAD habilitado por defecto
- Se actualizó el motor WhisperKit a la versión v0.15.0
- Se actualizó el motor FluidAudio a la versión v0.12.0
- La versión mínima del sistema compatible se ha elevado a macOS 13.3+
- Las miniaturas de las líneas de subtítulos ahora pueden generarse automáticamente al cambiar de hablante
- Las miniaturas de las líneas de subtítulos ahora permiten exportar capturas de pantalla en la resolución original del vídeo
11.0 12 feb
- Se agregó soporte para coreano, japonés y cantonés como idiomas secundarios al usar el motor de transcripción de Apple para transcripción en tiempo real
- Se corrigieron varios problemas al cambiar el reproductor rápido al modo de pantalla completa
- Se corrigió un problema donde la opción de traducción no se podía habilitar al usar el motor de Apple para transcripción en tiempo real
10.1 29 ene
- La barra lateral de la lista de proyectos ahora admite la vista previa directa de vídeos
- Se corrigieron problemas de UI relacionados con el componente de traducción
- FluidAudio actualizado a v0.10.0
10.0 22 ene
- Se refactorizó la lógica de control para las opciones de VAD y reducción de ruido
- Se refactorizó el flujo de trabajo de procesamiento para archivos de audio multipista
- Se actualizó FluidAudio a v0.8
- Se corrigió un problema donde la exportación de archivos MP3 podía fallar
- Se corrigieron problemas de marca de tiempo al usar WhisperKit en modo VAD
- Se corrigieron otros problemas de bloqueo
9.9.9 2 ene
- Se agregó soporte para traducir líneas de subtítulos usando el nuevo motor de traducción integrado en macOS 26
- Se mejoraron diversos detalles relacionados con la transcripción en tiempo real
- Se restauraron los ajustes de parámetros del modelo para whisper.cpp y WhisperKit en el panel de ejecución
- La barra lateral del proyecto ahora puede abrir directamente la ventana flotante de transcripción en tiempo real
- Se actualizó el motor de transcripción FluidAudio a la versión V0.7.10
- Se corrigió un problema donde no se podía iniciar la ventana flotante de transcripción desde la barra de estado del sistema
- La transcripción en tiempo real solo de audio ahora también admite el motor de transcripción integrado de Apple
- Se corrigió un problema ocasional donde hacer doble clic en un elemento de la tabla no abría el proyecto
- Se corrigieron varios problemas de interfaz de usuario observados en macOS 26
9.9.8 07/12/2025
- Añadida la exportación con un solo clic a Obsidian
- Añadido soporte para añadir carpetas a la lista de proyectos, que se convierten automáticamente en grupos para sumar proyectos en lote rápidamente
- Añadida la opción de exportar audio y subtítulos como un archivo MP4 que solo contiene pistas de audio
- Añadida una automatización posterior a la transcripción que ejecuta automáticamente la diarización de hablantes
- Mejorada la barra de control para sustituir hablantes y gestionar los ajustes de hablantes comunes
- Tras el reconocimiento de hablantes, los subtítulos de cada hablante ahora aparecen con colores diferenciados
- Añadida una opción en la exportación automática para incluir el archivo de audio WAV extraído del medio durante la transcripción
- Actualizado el motor de transcripción FluidAudio a la versión V0.7.8
- Optimizada la gestión al arrastrar proyectos a los grupos de la barra lateral
- Corregido un problema por el que el texto en coreano mostraba un espaciado incorrecto al usar el modelo de transcripción con IA integrado de Apple
- Varias correcciones de errores menores y mejoras de rendimiento
9.9.7 11/11/2025
- Se mejoró la interfaz para volver a transcribir segmentos de transcripción, facilitando la comparación de los nuevos resultados.
- Se agregó la generación de voz Kokoro, que puede crear archivos de voz basados en subtítulos (actualmente disponible solo en inglés).
- Se mejoró la función de monitoreo de directorios para vigilar también los nuevos archivos agregados en subdirectorios y activar automáticamente la transcripción, incluidos los archivos sincronizados desde dispositivos móviles a través de iCloud.
- Se actualizó el motor de transcripción FluidAudio a la versión V0.7.7.
- Se corrigió un problema en el que el previsualizador de video producía sonido distorsionado al abrirse por primera vez.
- Se corrigió un problema en el que el primer fotograma de los videos exportados con subtítulos podía saltar fotogramas.
9.9.6 30/10/2025
- Las acciones automatizadas ahora admiten la ejecución automática de operaciones de IA predefinidas al completar un proyecto
- Las operaciones de IA automatizadas ahora admiten el uso del modelo de lenguaje grande integrado de Apple para resúmenes de proyectos
- La retranscripción de segmentos ahora es compatible con el motor FluidAudio
- Se corrigió un problema por el cual los segmentos seleccionados no se podían retranscribir varias veces
- Se corrigió un problema de discrepancia de marcas de tiempo al retranscribir con el motor de transcripción integrado de Apple
- Se eliminaron varios complementos que ya no se pueden adaptar
- Otras correcciones de errores menores
9.9.5 26/10/2025
- La transcripción en tiempo real se puede iniciar directamente desde la interfaz principal
- La función de exportación automática ahora admite exportar en el directorio del archivo original
- Se ha añadido un plugin QuickLook para previsualizar el contenido de archivos SRT
- Los archivos SRT ahora se pueden traducir directamente
- Se ha corregido un problema donde el final de las oraciones en la transcripción en tiempo real se duplicaba
- Se han corregido varios errores en la función de exportación automática
- Se han corregido algunas anomalías de la interfaz en macOS 26
- Se ha corregido un problema donde el modelo de transcripción AI integrado de Apple no aparecía en la lista de selección de motores de transcripción
9.9.3 21/10/2025
- Se agregó soporte para usar el modelo de transcripción IA integrado de Apple en macOS 26+ para transcripción
- Se cambió la configuración de parámetros del modelo a formato de barra lateral (se puede revertir al estilo popup anterior en configuración)
- La exportación automática ahora admite seleccionar múltiples plantillas simultáneamente
- Se corrigieron algunos problemas de interfaz de usuario en macOS 26
9.9 14/10/2025
- En macOS 15 y versiones posteriores, la grabación en tiempo real ahora admite la captura y transcripción simultánea del audio del micrófono
- La transcripción en tiempo real en modo solo audio ya no requiere permisos de ScreenKit (macOS 14+)
- Se corrigió un problema en el que los recursos no se liberaban correctamente después de cerrar la ventana de transcripción en tiempo real
- Se actualizó el motor de transcripción FluidAudio a la versión 0.6.1
- Interfaz de usuario adaptada para macOS 26
- Otras correcciones menores y mejoras
9.8 29/09/2025
- Agregada barra lateral de grupo de proyectos para organizar proyectos en diferentes grupos
- Agregado modo de vista previa flotante de subtítulos de video
- Rediseñada la interfaz de configuración de la aplicación
- Actualizado el motor de transcripción whisper.cpp a v1.7.6
- Actualizado el motor de transcripción whisperkit a v0.13.1
- Actualizado el motor de transcripción fluidaudio con soporte para parakeet-tdt-0.6b-v3 y visualización de marcas de tiempo
- El motor de transcripción Deepgram ahora soporta el último modelo nova-3
- El editor de subtítulos ahora puede mostrar solo el contenido de transcripción (útil para proyectos que no requieren marcas de tiempo o marcadores)
- El previsualizador de subtítulos ahora escala automáticamente el tamaño de fuente de los subtítulos según la resolución del video
- El previsualizador de subtítulos ahora soporta espaciado de líneas personalizable
- Solucionado un problema donde las acciones de automatización no se ejecutaban al usar los motores fluidaudio y whisperkit
- Simplificada la interfaz de usuario del componente de traducción
- Solucionados varios problemas de interfaz de usuario en macOS 12 y 13
- Otras correcciones menores
9.7 09/09/2025
- Se añadió compatibilidad para usar el modelo parakeet-tdt-0.6b-v2 en el motor de transcripción
- Al usar el motor Whisper, ahora se puede habilitar VAD para dividir el audio automáticamente y reducir las alucinaciones
- Se corrigieron varios problemas de la función de preajustes
- Se optimizaron los estilos de los botones en el modo oscuro
- Se solucionó un problema por el que algunos vídeos no se mostraban correctamente en la ventana de recorte rápido
- Se corrigió un problema que impedía exportar solo las filas seleccionadas al exportar vídeos
- Se solucionó el retraso de rendimiento en la pestaña de exportación de vídeos
- Correcciones de errores y mejoras de rendimiento
9.6 12/08/2025
- Se agregó la capacidad de guardar la configuración del modelo de transcripción del proyecto actual como un preajuste para reutilizar en nuevos proyectos
- La transcripción automática a través del monitoreo de directorios ahora admite múltiples directorios
- Las herramientas de traducción y LLM ahora admiten el protocolo Ollama local
- Mejora del monitoreo de directorios para detectar mejor el estado de descarga de archivos en directorios de iCloud, con registros claros que muestran la actividad de descarga de archivos en la nube
- Simplificación del uso del modo de texto sin formato
- Se corrigieron problemas de rendimiento en el modo de chat LLM al manejar grandes volúmenes de datos
- Se agregó una opción para volver a PyAnnote para la integración de diarización
- La transcripción en tiempo real ahora admite el uso de motores de traducción basados en GPT
- El monitoreo de directorios ahora activa automáticamente la transcripción sin necesidad de habilitar el "inicio automático"
9.5 02/08/2025
- Optimizada la interfaz de configuración LLM y los registros de depuración para una presentación más clara y depuración más fácil
- Añadido soporte para aumentar o disminuir el volumen de audio durante la exportación de video
- Introducidas nuevas herramientas de post-procesamiento en el panel de Herramientas; por ejemplo, al usar el modelo large-v2-dv1a-diarization, los subtítulos ahora pueden reordenarse basándose en las etiquetas de hablante detectadas
- Corregido un problema donde la vista previa de subtítulos no se actualizaba automáticamente después de ejecutar herramientas LLM o de post-procesamiento
- Corregido un problema donde la tecla ESC no funcionaba en la ventana de transcripción en tiempo real
- Corregidos varios problemas encontrados durante el primer uso
- Correcciones menores de errores y mejoras
9.4 23/07/2025
- Se optimizó la interfaz de configuración de propiedades para formatos de subtítulos SRT y ASS, añadiendo más parámetros para controlar los estilos de subtítulos.
- Se mejoró la interfaz de exportación de video con soporte para exportar videos en resoluciones reducidas.
- Se mejoró el método de fusión y división de subtítulos basado en signos de puntuación comunes.
- Se añadió una herramienta de postprocesamiento en el panel de herramientas rápidas para ajustar automáticamente las líneas de subtítulos según la longitud.
- Se habilitó la importación directa de archivos de subtítulos FCPXML al editor de subtítulos para edición.
- Se añadió una opción para grabar videos o GIFs sin subtítulos durante la codificación en video.
- Se corrigió un problema donde la ventana se comportaba de manera anormal al restaurar desde pantalla completa al tamaño original.
- Se corrigió el problema donde el tamaño del video de vista previa no se guardaba después de cerrar el proyecto.
- Se corrigieron los problemas de temblor al editar saltos de línea en el editor rápido de subtítulos.
9.3 20/07/2025
- Se añadió un nuevo método de diarización para mejorar la separación de hablantes.
- Se integraron las funciones del modelo de lenguaje grande (LLM) en el nuevo panel Inspector con opciones de configuración simplificadas.
- El LLM ahora admite la traducción del archivo completo de subtítulos SRT o devuelve una versión SRT revisada para reemplazo directo en el editor de subtítulos.
- La exportación de video ahora admite exportar segmentos como animaciones GIF.
- Se mejoró el diseño del editor de subtítulos.
- Se añadió la funcionalidad de edición rápida para texto de subtítulos, disponible en la pestaña inferior del Inspector en el lado derecho.
- La traducción basada en GPT y las funciones LLM ahora son compatibles con las APIs de Gemini, DeepSeek y OpenRouter.
- Se añadió la extracción por lotes de miniaturas de video en los tiempos de inicio de los subtítulos, mostradas dentro del editor de subtítulos.
- Se añadió la detección de fotogramas clave para cambios de escena, con marcadores mostrados en el editor de forma de onda.
9.2 07/07/2025
- Se agregó una función de visualización basada en barras de energía de audio, que permite a los usuarios arrastrar y ajustar los tiempos de inicio y fin de los subtítulos (para diálogos y audio sin música de fondo, se admite una función de alineación automática para ajustar automáticamente el tiempo de los subtítulos)
- Se agregó una función de borrado de líneas; las líneas de subtítulos borradas se mostrarán como eliminadas y no aparecerán en vistas previas de subtítulos o archivos exportados
- Se solucionó un problema donde algunos proyectos no podían iniciar la ejecución por lotes después de ser seleccionados en masa
- Al guardar archivos de transcripción en tiempo real, el nombre de la instantánea se usa automáticamente como nombre de archivo
- Se agregó un botón de acceso rápido en la lista de proyectos para acceder directamente al modo de texto
- Se solucionó un problema donde el modo de texto durante la transcripción del proyecto no se desplazaba automáticamente a la última línea
- Se agregó una función de post-procesamiento de texto para dividir líneas que contienen múltiples viñetas "-" en líneas separadas
- Se optimizaron las funciones de exportación y corte de medios: si las líneas de subtítulos seleccionadas no son continuas, el sistema omitirá las líneas no seleccionadas durante la operación de corte
9.1 16/06/2025
- Se añadió la función para agregar capítulos a los videos. La información de capítulos existente puede importarse automáticamente, editarse y exportarse nuevamente junto con el archivo de video
- Se ha añadido un nuevo motor de traducción gratuito
- Se ha actualizado el motor de transcripción WhisperKit a la última versión
- Se ha añadido una opción automática para volver a transcribir líneas con resultados repetidos después de la primera transcripción
- Se ha reescrito la función de transcripción segmentada: ahora admite la segmentación automática basada en pausas para videos largos como películas y animaciones, y corrige el problema anterior de desalineación de tiempos de segmentos
- La transcripción en tiempo real ahora admite Flash Attention para un mejor rendimiento
- Ahora se puede personalizar el nombre del proyecto al crear un nuevo proyecto de transcripción en tiempo real
- Se ha añadido la opción de ocultar los motores de traducción no utilizados
- Se ha corregido el problema de parpadeo al desplazarse automáticamente a la última línea durante la transcripción en tiempo real
- Se rediseñó y optimizó la interfaz de configuración para la transcripción en tiempo real
- Se ha corregido un problema donde el módulo de traducción no recordaba el último idioma seleccionado
- Se ha corregido un problema donde la retranscripción fallaba después de cambiar el motor para un segmento seleccionado
- Otras mejoras de la interfaz de usuario y correcciones de errores
9.0 24/04/2025
- El archivo guardado después de la transcripción en tiempo real ahora muestra directamente los subtítulos transcritos correspondientes.
- Los subtítulos en el formato ASS se pueden configurar cómodamente para mostrarse en un diseño de arriba y abajo.
- Si el archivo de video incluye archivos de subtítulos basados en texto, se convertirán automáticamente en instantáneas de proyecto.
- Los idiomas CJK en videos con subtítulos incrustados ahora admiten el control del límite máximo de caracteres por línea.
- Se añadió una herramienta para realizar saltos de línea masivos en las líneas de subtítulos.
- El texto traducido se puede fusionar directamente con la transcripción original. (Menú contextual del editor de subtítulos)
- Se solucionó un problema que impedía acceder a algunos archivos al intentar leerlos.
- Se corrigió un error que provocaba el cierre inesperado al detener la transcripción en tiempo real mientras se grababa con un micrófono.
8.5 04/01/2025
- Función de retroalimentación actualizada (las versiones anteriores no podían recibir correctamente los comentarios de los usuarios, por favor intente contactar nuevamente)
- Se corrigieron varios errores de bloqueo
- Se solucionó un problema que causaba bloqueos en macOS 13
- Se corrigieron algunos bloqueos en el visor de vista previa
- Se solucionaron anomalías de audio durante la transcripción en tiempo real y la grabación de video
8.1 13/12/2024
- Se rediseñó la lógica para usar el complemento LLM y se añadió la funcionalidad de depuración en tiempo real para los efectos de LLM.
- Se añadió soporte para fuentes personalizadas en el contenido de transcripción y traducción.
- Se optimizaron los parámetros de transcripción en tiempo real y la interfaz de gestión de archivos.
- Los archivos exportados ahora son compatibles con el formato .mp4 con subtítulos.
- Se soporta pegar directamente el texto de resultados de pyannote en la interfaz del editor de subtítulos y analizarlo.
- Se soporta el uso de simple-one-api como puente para el formato OpenAI.
- Durante la transcripción en tiempo real, el contenido de transcripción idéntico se fusionará automáticamente en uno solo.
- El modo de ventana pequeña de transcripción en tiempo real ahora soporta el modo de visualización en orden inverso.
- Se añadieron múltiples opciones de cambio de estilo para la ventana pequeña de transcripción en tiempo real.
- Se solucionó el problema donde no se podían descargar archivos.
- Se optimizó la funcionalidad de búsqueda global.
8.0 02/12/2024
- Se ha añadido soporte para WhisperKit como nuevo motor de transcripción. (macOS 13+)
- La ejecución de LLM soporta operaciones sobre texto en el Modo de Texto
- Se ha cambiado el acceso directo para cambiar rápidamente al Modo de Texto a ⌃+z
- Se ha solucionado el parpadeo de los subtítulos en el visor.
- Se han solucionado problemas con la retranscripción en el rango.
7.0 18/11/2024
- Se agregó la función de comentarios para que los usuarios puedan proporcionar sugerencias o pasos detallados para los problemas.
- Se agregó la opción de abrir automáticamente en Final Cut Pro después de exportar un archivo en formato .fcpxml.
- Se agregó el acceso directo 'z' para cambiar rápidamente entre la vista de texto y la vista de tabla en el editor.
- Se solucionó el problema en el que presionar ESC cerraba la ventana flotante de transcripción en tiempo real.
- Se solucionó el problema al exportar el rango de medios con archivos de grabación en tiempo real (.caf).
- Se solucionó un problema por el cual el proyecto de URL no se podía acceder al mover el archivo a una nueva ubicación.
- Se solucionó un problema en el que ciertos archivos de medios con formato específico no podían ser exportados.
- Se solucionó un problema en macOS 12 y 13 que impedía el inicio de la aplicación después de actualizar a la última versión.
6.9 12/11/2024
- Añadido un módulo TTS independiente
- Nuevo módulo de generación TTS en el editor de subtítulos para sintetizar voz a partir del texto traducido con mayor comodidad
- Compatibilidad con el motor de transcripción WhisperMLX (macOS 14.0 o posterior)
- Motor de diarización WhisperKit (separación de hablantes)
- Motor FluidAudio actualizado a la versión V0.13.7
- Motor WhisperKit actualizado a la versión V0.17.0
- La transcripción en tiempo real puede exportarse directamente a archivos compatibles con OBS
- Varias herramientas para limpiar por lotes caracteres especiales en las líneas de subtítulos
- La supervisión de carpetas permite vincular grupos de proyectos concretos
- La ventana flotante de transcripción en tiempo real puede mostrarse y moverse entre espacios de aplicaciones a pantalla completa
- Corregidos varios problemas de la función de ajustes predefinidos
- Corregido un fallo por el que la exportación de segmentos de vídeo podía no completarse
Más Versión 12.0 27 abr
Datos no asociados con tu identidad Los siguientes datos pueden recopilarse, pero no están asociados con tu identidad: