AFRIA-Vision - Documentação

Introdução ao afria-vision

O afria-vision é nosso modelo de análise de imagens baseado no llama-3.2-11b-vision-preview, capaz de entender e descrever conteúdo visual com alta precisão.

Capacidades Principais:

Descrição detalhada de imagens
Detecção de objetos e cenas
Análise de contexto visual
Resposta a perguntas sobre imagens
Identificação de texto em imagens
Análise de cores e composição

Endpoints

POST /chat

Corpo da Requisição:

{
  "messages": [
    {
      "role": "user",
      "content": [
        {
          "type": "text",
          "text": "O que está nesta imagem?"
        },
        {
          "type": "image_url",
          "image_url": {
            "url": "https://exemplo.com/imagem.jpg"
          }
        }
      ]
    }
  ],
  "modelo": "afria-vision",
  "tipo": "visao",
  "parametros": {
    "temperature": 1.0,
    "max_tokens": 1024
  }
}

Formatos Suportados

Formatos de Imagem

• JPEG/JPG
• PNG
• WebP
• GIF (primeiro frame)

Requisitos

• URL pública acessível
• Tamanho máximo: 20MB
• Dimensão mínima: 100x100px
• Dimensão máxima: 4096x4096px

Exemplos

Python

import requests

def analisar_imagem(api_key, imagem_url, pergunta="O que está nesta imagem?"):
    url = "https://api.afria.ai/chat"
    
    headers = {
        "Content-Type": "application/json",
        "X-API-Key": api_key
    }
    
    payload = {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "type": "text",
                        "text": pergunta
                    },
                    {
                        "type": "image_url",
                        "image_url": {
                            "url": imagem_url
                        }
                    }
                ]
            }
        ],
        "modelo": "afria-vision",
        "tipo": "visao"
    }
    
    response = requests.post(url, headers=headers, json=payload)
    return response.json()

# Exemplo de uso
api_key = "sua_api_key"
imagem_url = "https://exemplo.com/imagem.jpg"
resultado = analisar_imagem(api_key, imagem_url)
print(resultado)

JavaScript

async function analisarImagem(apiKey, imagemUrl, pergunta = "O que está nesta imagem?") {
    const response = await fetch('https://api.afria.ai/chat', {
        method: 'POST',
        headers: {
            'Content-Type': 'application/json',
            'X-API-Key': apiKey
        },
        body: JSON.stringify({
            messages: [
                {
                    role: 'user',
                    content: [
                        {
                            type: 'text',
                            text: pergunta
                        },
                        {
                            type: 'image_url',
                            image_url: {
                                url: imagemUrl
                            }
                        }
                    ]
                }
            ],
            modelo: 'afria-vision',
            tipo: 'visao'
        })
    });
    
    return await response.json();
}

// Exemplo de uso
const apiKey = 'sua_api_key';
const imagemUrl = 'https://exemplo.com/imagem.jpg';
analisarImagem(apiKey, imagemUrl)
    .then(resultado => console.log(resultado))
    .catch(erro => console.error(erro));

Introdução ao afria-vision

Capacidades Principais:

Endpoints

Corpo da Requisição:

Formatos Suportados

Formatos de Imagem

Requisitos

Exemplos

Python

JavaScript

Limites

Rate Limits

Limites Técnicos

Melhores Práticas

Otimização

Qualidade

Veja também

AFRIA-01

AFRIA-Speech