ivanlmh/NATI_audio
Viewer • Updated • 25 • 12
How to use ivanlmh/iidi-adapted-whisper_medium with Transformers:
# Use a pipeline as a high-level helper
from transformers import pipeline
pipe = pipeline("automatic-speech-recognition", model="ivanlmh/iidi-adapted-whisper_medium") # Load model directly
from transformers import AutoProcessor, AutoModelForSpeechSeq2Seq
processor = AutoProcessor.from_pretrained("ivanlmh/iidi-adapted-whisper_medium")
model = AutoModelForSpeechSeq2Seq.from_pretrained("ivanlmh/iidi-adapted-whisper_medium")This model is a fine-tuned version of openai/whisper-medium on the NATI_audio dataset. It achieves the following results on the evaluation set:
This project is for the Instituto Interamericano para Discapacidad y Desarrollo Inclusivo (iiDi).
| Transcripción manual (objetivo) | Transcripción obtenida por whisper | Transcripción de whisper adaptado |
|---|---|---|
| Mi nombre es Natalia, | y no me nada | Mi nombre es Natalia. |
| soy de Uruguay del iiDi. | Soy de Uruguay. | Soy de Uruguay, de Lili. |
| viene por el lado, de algo que trabajamos durante toda la semana, | por el lado de algo que trabajamos durante todas las semanas. | En el por el lado de algo que trabajamos durante todas las semanas. |
| Uno es Danceability | una enganchabilidad | Una en danzability? |
| Hola Iván, mirá, vamos en camino. Voy con Eliana también. Llegaremos... Eli, ahora te cuento, es una compañera que me está apoyando. Llegaremos y cuarto, por ahí, perdón la demora. Beso. | Hola, ya miraba más el camino Voy con Eliana también Cerótimo, Eliana de Cuantos es una compañía larga metaforsana, ella misma Cerótimo y Cuantos por ahí, para donde mola el reto | Hola Jan, miraba más el camino, voy con Eliana también. Seguiremos el i ahora te cuento, es una compañera que me está apoyando. Seguiremos i cuarto por ahí, para donde mola verse. |
The model is fine-tuned for use on target speaker Natalia F.
It is intended for research purposes, neither this model nor the dataset should be used without explicit permission from iiDi or Natalia.
The following hyperparameters were used during training:
| Training Loss | Epoch | Step | Validation Loss | Wer |
|---|---|---|---|---|
| 2.1185 | 1.5385 | 20 | 5.2113 | 70.2194 |
| 1.101 | 3.0769 | 40 | 3.4953 | 67.3981 |
| 0.2713 | 4.6154 | 60 | 2.8417 | 64.5768 |
| 0.0238 | 6.1538 | 80 | 2.0258 | 66.4577 |
| 0.0189 | 7.6923 | 100 | 2.2078 | 72.4138 |
| 0.0012 | 9.2308 | 120 | 2.2116 | 67.3981 |
| 0.0113 | 10.7692 | 140 | 2.2311 | 66.4577 |
| 0.0004 | 12.3077 | 160 | 2.2437 | 67.7116 |
| 0.0003 | 13.8462 | 180 | 2.2415 | 66.7712 |
| 0.0003 | 15.3846 | 200 | 2.2439 | 66.7712 |
Base model
openai/whisper-medium