AFRIA-Speech

Modelo de transcrição de áudio baseado no whisper-large-v3-turbo, otimizado para múltiplos idiomas.

Teste o Modelo

Configurações do Modelo

Parâmetros Padrão

  • Modelo Base: whisper-large-v3-turbo
  • Response Format: json
  • Temperature: 0.0
  • Language: pt

Formatos Suportados

  • Áudio: .mp3, .wav, .m4a, .ogg
  • Tamanho Máximo: 25MB

Exemplos de Uso

curl -X POST https://apiafria.mtevolution.tech/transcribe \
  -H 'X-API-Key: SUA_CHAVE_API' \
  -F 'file=@/caminho/para/seu/audio.mp3'
import requests

url = 'https://apiafria.mtevolution.tech/transcribe'
headers = {'X-API-Key': 'SUA_CHAVE_API'}
files = {'file': open('audio.mp3', 'rb')}
response = requests.post(url, headers=headers, files=files)

print(response.json())
fetch('https://apiafria.mtevolution.tech/transcribe', {
    method: 'POST',
    headers: {
        'X-API-Key': 'SUA_CHAVE_API'
    },
    body: new FormData().append('file', fileInput.files[0])
}) 
.then(response => response.json())
.then(data => console.log(data))