Introdução ao afria-vision

O afria-vision é nosso modelo de análise de imagens baseado no llama-3.2-11b-vision-preview, capaz de entender e descrever conteúdo visual com alta precisão.

Capacidades Principais:

  • Descrição detalhada de imagens
  • Detecção de objetos e cenas
  • Análise de contexto visual
  • Resposta a perguntas sobre imagens
  • Identificação de texto em imagens
  • Análise de cores e composição

Endpoints

POST /chat

Corpo da Requisição:

{
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "O que está nesta imagem?"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://exemplo.com/imagem.jpg"
          }
        }
      ]
    }
  ],
  "modelo": "afria-vision",
  "tipo": "visao",
  "parametros": {
    "temperature": 1.0,
    "max_tokens": 1024
  }
}

Formatos Suportados

Formatos de Imagem

  • • JPEG/JPG
  • • PNG
  • • WebP
  • • GIF (primeiro frame)

Requisitos

  • • URL pública acessível
  • • Tamanho máximo: 20MB
  • • Dimensão mínima: 100x100px
  • • Dimensão máxima: 4096x4096px

Exemplos

Python

import requests

def analisar_imagem(api_key, imagem_url, pergunta="O que está nesta imagem?"):
    url = "https://api.afria.ai/chat"
    
    headers = {
        "Content-Type": "application/json",
        "X-API-Key": api_key
    }
    
    payload = {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "type": "text",
                        "text": pergunta
                    },
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": imagem_url
                        }
                    }
                ]
            }
        ],
        "modelo": "afria-vision",
        "tipo": "visao"
    }
    
    response = requests.post(url, headers=headers, json=payload)
    return response.json()

# Exemplo de uso
api_key = "sua_api_key"
imagem_url = "https://exemplo.com/imagem.jpg"
resultado = analisar_imagem(api_key, imagem_url)
print(resultado)

JavaScript

async function analisarImagem(apiKey, imagemUrl, pergunta = "O que está nesta imagem?") {
    const response = await fetch('https://api.afria.ai/chat', {
        method: 'POST',
        headers: {
            'Content-Type': 'application/json',
            'X-API-Key': apiKey
        },
        body: JSON.stringify({
            messages: [
                {
                    role: 'user',
                    content: [
                        {
                            type: 'text',
                            text: pergunta
                        },
                        {
                            type: 'image_url',
                            image_url: {
                                url: imagemUrl
                            }
                        }
                    ]
                }
            ],
            modelo: 'afria-vision',
            tipo: 'visao'
        })
    });
    
    return await response.json();
}

// Exemplo de uso
const apiKey = 'sua_api_key';
const imagemUrl = 'https://exemplo.com/imagem.jpg';
analisarImagem(apiKey, imagemUrl)
    .then(resultado => console.log(resultado))
    .catch(erro => console.error(erro));

Limites

Rate Limits

  • • Plano Gratuito: 50 imagens/dia
  • • Plano Pro: 1000 imagens/dia
  • • Máximo de 10 requisições/minuto

Limites Técnicos

  • • Tamanho máximo: 20MB
  • • Resolução máxima: 4096x4096
  • • Tempo máximo de análise: 30 segundos

Melhores Práticas

Otimização

  • • Otimize imagens antes do envio
  • • Use perguntas específicas
  • • Cache resultados frequentes
  • • Valide URLs antes do envio

Qualidade

  • • Use imagens de boa qualidade
  • • Evite imagens muito pequenas
  • • Prefira iluminação adequada
  • • Evite imagens borradas

Veja também

AFRIA-01

Modelo de linguagem natural

AFRIA-Speech

Transcrição de áudio