Atendentes de IA para voz e WhatsApp

Atendentes virtuais que falam como humanos — em qualquer canal.

A Voxmize é a plataforma da Mediatize para criar agentes de IA que conduzem conversas reais por 0800, telefone fixo, celular, SIP/VOIP e WhatsApp. Latência abaixo de 1,5s, totalmente em português, sem amarras de fornecedor.

< 1,5s latência ponta a ponta
24/7 atendimento ininterrupto
Multi‑provedor STT · LLM · TTS plugáveis
Canais de atendimento

Um único cérebro. Todos os canais da sua operação.

Conecte sua linha 0800, número fixo, celular, trunk SIP ou WhatsApp Business. O atendente Voxmize atua em qualquer um deles com a mesma personalidade e base de conhecimento.

Linhas 0800

Receba ligações gratuitas dos seus clientes com IA conversacional 24/7. Escala ilimitada sem fila de espera.

  • Streaming bidirecional em tempo real
  • Barge‑in (cliente interrompe a fala)
  • Transferência para humano

Telefone fixo

Atenda chamadas de DDD locais ou nacionais. Compatível com números Twilio ou trunk SIP da sua operadora.

  • DDD local em todo o Brasil
  • Identificação de chamada
  • Roteamento por horário

Celular

Números de celular dedicados para campanhas ativas e receptivas. Ideal para SAC móvel e cobrança.

  • Discagem ativa e receptiva
  • Detecção de caixa postal
  • Rediscagem inteligente

WhatsApp Business

Atenda mensagens de texto, áudio (PTT), imagem e documento. Responda por texto ou voz sintetizada.

  • Texto, áudio e mídia
  • Resposta em voz opcional
  • Templates aprovados
Mais usado

SIP / VOIP

Aponte seu trunk SIP existente direto para a Voxmize. Sem trocar operadora, sem fricção.

  • Compatível com qualquer PBX
  • Codecs G.711, Opus
  • TLS e SRTP

Discagem ativa

Campanhas outbound para cobrança, pesquisa, agendamento e qualificação de leads em escala.

  • Listas e priorização
  • Janela de horário permitido
  • Compliance LGPD
Pipeline de conversação

Como a Voxmize conversa em tempo real

Cada turno da conversa percorre três etapas em streaming. O orquestrador é agnóstico e troca de provedor sem reescrever nada.

01

Voz para texto · STT

O áudio do cliente é transcrito em tempo real, com detecção de fim de fala (endpointing) e pontuação automática.

DeepgramWhisperAssemblyAIGoogleAzure
Meta: < 200ms parcial
02

Modelo de linguagem · LLM

Recebe prompt do atendente, histórico, base de conhecimento (RAG) e a fala do cliente. Devolve a resposta em streaming token a token.

GPT‑4.1GPT‑4oClaudeGemini
Meta: 600–700ms total
03

Texto para voz · TTS

Sintetiza a resposta em áudio natural conforme os tokens chegam, com suporte a barge‑in e cancelamento instantâneo.

ElevenLabsCartesiaAuraOpenAIPlayHT
Meta: < 300ms primeiro chunk
Base de conhecimento (RAG) PDF, DOCX, MD e TXT indexados em banco vetorial. Trechos relevantes são injetados no LLM a cada turno.
Fallback automático Cada camada (STT, LLM, TTS) pode ter provedor secundário. Se o primário falhar, o sistema troca dentro da mesma chamada.
BYO Keys Use suas próprias chaves de API para cada provedor — armazenadas criptografadas — ou repasse o consumo para a Voxmize.
Recursos

Tudo o que sua operação precisa, sem improviso

Construído para empresas que dependem de atendimento em alto volume.

Personalidade configurável

Defina nome, tom, regras, objetivo e jeito de encerrar. Use variáveis dinâmicas como {{nome}}.

Mensagem inicial inteligente

Atendente abre a conversa ou aguarda o cliente. TTS pré‑gerado para resposta instantânea.

RAG com seus documentos

Anexe PDFs, manuais, FAQs e políticas. A IA responde com base nos seus dados — sem alucinar.

Multi‑provedor sem lock‑in

Misture Deepgram + GPT‑4.1 + ElevenLabs. Troque a qualquer momento sem reescrever fluxos.

Latência abaixo de 1,5s

Streaming em todas as etapas. O cliente sente uma conversa fluida, não um robô esperando.

Barge‑in natural

Se o cliente falar por cima, o atendente para imediatamente. Sem aquela pausa robótica.

Compliance e LGPD

Consentimento de gravação, retenção configurável, modo "sem retenção" e dados em servidores no Brasil.

Transferência para humano

Configure gatilhos (palavra‑chave, sentimento, intenção) para passar a chamada a um atendente real.

Métricas e custo por chamada

Painel mostra duração, taxa de transferência, custo de Twilio + STT + LLM + TTS por sessão.

Webhooks e API

Receba eventos de início, fim, transcrição, transferência. Integre com seu CRM, ERP ou data lake.

Fallback inteligente

Provedor primário caiu? O secundário assume na mesma ligação. Sem queda, sem cliente irritado.

Simulador de conversa

Teste o atendente por chat antes de colocar em produção. Refine o prompt sem gastar minutos de voz.

Casos de uso

Operações que não param com a Voxmize

Substitua URAs ultrapassadas, escale o SAC e qualifique leads sem contratar mais gente.

Cobrança

Recuperação de crédito

Negociações de boletos, parcelamentos e segunda via. Atende milhares de devedores em paralelo, sem fila.

  • Tom respeitoso e LGPD‑compliant
  • Geração de boleto via webhook
  • Agendamento de pagamento
Vendas

Qualificação de leads

Recebe lead novo, liga, qualifica perfil e agenda reunião com o time comercial humano. SDR 24h.

  • BANT/CHAMP automático
  • CRM integrado por webhook
  • Hand‑off com contexto
Suporte

SAC nível 1

Resolve dúvidas frequentes consultando sua base de conhecimento. Encaminha para humano só quando necessário.

  • RAG com manuais e FAQs
  • Abertura de chamado por API
  • NPS pós‑atendimento
Agendamento

Reservas e consultas

Confirma horários, remarca, lembra e cancela. Sincroniza com Google Calendar, Outlook ou agenda própria.

  • Disponibilidade em tempo real
  • Confirmação por SMS/WhatsApp
  • Reagendamento automático
Pesquisa

NPS e satisfação

Liga para clientes pós‑atendimento, coleta nota e comentário, classifica sentimento e gera relatório.

  • Análise de sentimento
  • Tags automáticas
  • Dashboard consolidado
Receptivo

URA inteligente 0800

Substitui menus chatos por conversa natural. O cliente fala o que precisa e é resolvido na hora.

  • Sem "digite 1 para…"
  • Roteamento por intenção
  • Atendimento 24/7
Ecossistema

Os melhores provedores do mercado, no mesmo painel

Escolha por camada, por workspace ou por atendente. Use as chaves da Voxmize ou as suas (BYO).

STT
Deepgram OpenAI Whisper AssemblyAI Google Speech Azure Speech ElevenLabs Scribe + BYO endpoint
LLM
OpenAI GPT‑4.1 OpenAI GPT‑4o Anthropic Claude Google Gemini Mistral + BYO endpoint
TTS
ElevenLabs Cartesia Sonic Deepgram Aura OpenAI TTS PlayHT Azure / Google + BYO endpoint
Telefonia
Twilio Voice Twilio WhatsApp SIP Trunk + Operadora própria
Por que Voxmize

Pensado para o Brasil.
Construído para escalar.

Existem boas plataformas globais. Nenhuma fala português como a sua avó, integra com Twilio Brasil, atende a LGPD, emite NF, e tem suporte falando o seu idioma — tudo no mesmo lugar.

  • Vozes naturais em português brasileiro com sotaque regional
  • Suporte e onboarding pela equipe da Mediatize, em Cuiabá‑MT
  • Servidores no Brasil, contratação em Real, NF‑e
  • Sem lock‑in: troque qualquer provedor sem refazer o atendente
  • Modelo BYO Keys para quem quer otimizar custo direto na fonte
  • Roadmap aberto: priorizamos o que clientes pedem
7+
provedores STT/LLM/TTS plugáveis
< 1,5s
latência ponta a ponta
24 / 7
disponibilidade do atendente
chamadas simultâneas
Perguntas frequentes

Dúvidas comuns

Quanto tempo leva para colocar um atendente no ar?

Em média, de 2 a 5 dias úteis, dependendo da complexidade. Atendentes de FAQ simples ficam prontos em horas; cenários com integração a CRM e regras de negócio levam um pouco mais. A Mediatize acompanha o onboarding.

Como funciona a cobrança? Tenho que pagar para cada provedor separadamente?

Você escolhe. Pode usar as chaves da Voxmize (cobramos consumo + assinatura mensal em uma única fatura, em Real, com NF‑e) ou cadastrar suas próprias chaves de cada provedor (BYO Keys) e pagar diretamente a eles, mantendo apenas a assinatura da plataforma conosco.

O atendente fala português brasileiro de verdade?

Sim. Trabalhamos com vozes neurais em PT‑BR de provedores como ElevenLabs, Cartesia e Azure, com possibilidade de clonagem da voz da sua marca. STT é otimizado para PT‑BR via Deepgram Nova‑3 ou Azure Speech.

Atende à LGPD?

Sim. Oferecemos consentimento de gravação configurável, retenção de áudios e transcrições com prazo definido por você, modo "sem retenção" para dados sensíveis, criptografia em trânsito e em repouso, e DPA disponível.

E se o provedor de IA cair durante uma ligação?

Cada camada (STT, LLM, TTS) pode ter um provedor secundário configurado. Se o primário falhar, a Voxmize troca automaticamente dentro da mesma chamada e registra o evento nos logs. O cliente nunca percebe.

Preciso trocar de operadora telefônica?

Não. Você pode comprar números pela Voxmize (Twilio) ou apontar seu trunk SIP existente — Vivo, Claro, Algar, qualquer operadora SIP. Mantemos sua numeração e portabilidade.

Posso transferir para um atendente humano quando necessário?

Sim. Configure gatilhos por palavra‑chave (ex.: "atendente"), sentimento (cliente irritado), intenção detectada pelo LLM ou tempo de conversa. A transferência preserva o contexto e pode ser para um número, ramal SIP ou fila do seu PBX.

Qual o custo aproximado por minuto de chamada?

Varia conforme provedores escolhidos, mas a faixa típica fica entre R$ 0,40 e R$ 1,20 por minuto somando Twilio + STT + LLM + TTS. O painel mostra custo real por chamada e total por atendente. Falamos números exatos na demonstração.

Tem API e webhooks?

Sim. API REST para criar/editar atendentes, iniciar chamadas ativas, listar histórico. Webhooks para eventos de início, fim, transcrição em tempo real, transferência e custos. Integração nativa com CRMs populares no roadmap.

Pronto para automatizar seu atendimento?

Marque uma demonstração com nosso time. Mostramos um atendente atendendo o seu caso real em menos de 30 minutos.