Replies (11)

Eu vi umas coisas um tempo atrás por causa do AwesomeWm, mas já esqueci tudo. Gemini no model flash tem tokens infinitos, Claude ainda não hehehe.
O model flash é online ou roda direto na máquina? Uso muito o claude pra programar com lua pra um programa muito específico, ele é muito conciso, mas o maior problema é que realmente gasta muito rápido os tokens para atividades mais pesadas...
É on-line, uso com mcps tipo o Context7 pra docs e passo as descrições com regras bem definidas pra ele não se perder. E é só criar um token de uso vinculado a um email do Gmail pra funcionar via Cli, bem prático.
Mas, nesse sentido, o "token infinito" é pela forma como você faz o envio dos docs e ela consegue filtrar bem o que processar, né? Não é literalmente fazer varias requisições e mesmo assim nunca acaber com os tokens.
O limite oficial é 1 milhão de tokens de input, eu uso o dia todo quase e nunca bati isso.