O AFRIA-01 é um modelo de linguagem natural avançado baseado no LLaMA 3.1, especialmente otimizado para o português. Com capacidade de processar e gerar texto de forma natural, é ideal para uma ampla gama de aplicações, desde chatbots até análise de texto e geração de conteúdo.
Performance superior em tarefas em português
Compreensão contextual avançada
Fácil integração via API REST
curl -X POST https://apiafria.mtevolution.tech/chat \
-H "Content-Type: application/json" \
-H "X-API-Key: SUA_CHAVE_API" \
-d '{
"mensagem": "Olá, como você está?",
"sistema": "Você é um assistente prestativo e amigável.",
"temperatura": 0.7,
"max_tokens": 50
}'
}'
import requests
url = "https://apiafria.mtevolution.tech/chat"
headers = {
"Content-Type": "application/json",
"X-API-Key": "SUA_CHAVE_API"
}
dados = {
"mensagem": "Olá, como você está?",
"sistema": "Você é um assistente prestativo e amigável.",
"temperatura": 0.7,
"max_tokens": 50
}
try:
response = requests.post(url, json=dados, headers=headers)
if response.status_code == 200:
print("Resposta do modelo:", response.json().get("resposta"))
else:
print("Erro:", response.json())
except Exception as e:
print("Erro ao fazer a requisição:", str(e))
https://apiafria.mtevolution.tech/chat';
const dados = {
mensagem: "Olá, como você está?",
sistema: "Você é um assistente prestativo e amigável.",
temperatura: 0.7,
max_tokens: 50
};
const headers = {
"Content-Type": "application/json",
"X-API-Key": "SUA_CHAVE_API"
};
fetch(url, {
method: 'POST',
headers: headers,
body: JSON.stringify(dados)
})
.then(response => response.json())
.then(data => {
if (data.resposta) {
console.log('Resposta do modelo:', data.resposta);
} else {
console.log('Erro:', data);
}
})
.catch(error => {
console.error('Erro ao fazer a requisição:', error);
});
}
Array de mensagens que formam a conversa. Cada mensagem deve ter um 'role' (system, user, ou assistant) e um 'content' (texto da mensagem).
Controla a criatividade das respostas. Valores mais altos (ex: 0.8) geram respostas mais criativas, enquanto valores mais baixos (ex: 0.2) geram respostas mais focadas e determinísticas.
Limite máximo de tokens na resposta. Um token representa aproximadamente 4 caracteres em português.