O model flash é online ou roda direto na máquina? Uso muito o claude pra programar com lua pra um programa muito específico, ele é muito conciso, mas o maior problema é que realmente gasta muito rápido os tokens para atividades mais pesadas...

Replies (2)

É on-line, uso com mcps tipo o Context7 pra docs e passo as descrições com regras bem definidas pra ele não se perder. E é só criar um token de uso vinculado a um email do Gmail pra funcionar via Cli, bem prático.
Mas, nesse sentido, o "token infinito" é pela forma como você faz o envio dos docs e ela consegue filtrar bem o que processar, né? Não é literalmente fazer varias requisições e mesmo assim nunca acaber com os tokens.