Fastino: Modelos de IA Treinados em GPUs de Jogos Recebem US$ 17,5 Milhões da Khosla Ventures

Por Mizael Xavier
Fastino: Modelos de IA Treinados em GPUs de Jogos Recebem US$ 17,5 Milhões da Khosla Ventures

Fastino Revoluciona o Treinamento de IA com GPUs de Jogos e Garante Investimento de US$ 17,5 Milhões Liderado pela Khosla Ventures

Em um cenário onde gigantes da tecnologia ostentam modelos de inteligência artificial com trilhões de parâmetros, exigindo enormes e caros clusters de GPUs, uma startup de Palo Alto, Califórnia, chamada Fastino AI, está trilhando um caminho notavelmente diferente. A empresa anunciou que desenvolveu uma nova arquitetura de modelos de IA intencionalmente menores e específicos para tarefas. Esses modelos são tão compactos que podem ser treinados utilizando GPUs de jogos de baixo custo, totalizando menos de US$ 100.000 em hardware, de acordo com a Fastino. Essa abordagem inovadora atraiu a atenção de investidores significativos, resultando em um aporte de US$ 17,5 milhões em uma rodada de financiamento seed liderada pela Khosla Ventures, conhecida por ser a primeira investidora de capital de risco na OpenAI. Este investimento eleva o financiamento total da Fastino para quase US$ 25 milhões, após uma rodada pré-seed de US$ 7 milhões em novembro de 2023, liderada pelo braço de capital de risco da Microsoft, M12, e pela Insight Partners.

A Estratégia da Fastino: Modelos de Linguagem Específicos para Tarefas (TLMs)

A Fastino está introduzindo os chamados "Task-Specific Language Models" (TLMs), ou Modelos de Linguagem Específicos para Tarefas. A ideia central é que, para a maioria das aplicações empresariais, modelos de propósito geral massivos são um exagero. "Nossos modelos são mais rápidos, mais precisos e custam uma fração para treinar, superando modelos de ponta em tarefas específicas", afirma Ash Lewis, CEO e cofundador da Fastino. A empresa construiu um conjunto de pequenos modelos que são vendidos para clientes corporativos, cada um focado em uma necessidade específica, como redação de dados sensíveis ou resumo de documentos corporativos. De acordo com a Fastino, seus TLMs podem fornecer inferência 99 vezes mais rápida que os LLMs tradicionais.

A equipe por trás da Fastino inclui pesquisadores com experiência em empresas como Google DeepMind, Apple Intelligence, Stanford e Carnegie Mellon University. Eles desenvolveram uma arquitetura de modelo inovadora que, apesar de ser treinada em GPUs de jogos NVIDIA de baixo custo e sem o uso das cobiçadas H100s, supera os LLMs tradicionais em benchmarks específicos para tarefas.

Vantagens das GPUs de Jogos no Treinamento de IA da Fastino

A utilização de GPUs de jogos para treinar modelos de IA representa uma mudança significativa em relação à dependência de hardware especializado e caro. As GPUs, originalmente projetadas para renderização gráfica em jogos, possuem alta capacidade de processamento paralelo, o que as torna eficientes para as operações simultâneas necessárias no treinamento de redes neurais. Embora tradicionalmente as GPUs de data center de alta performance fossem a escolha para IA, a Fastino demonstra que, para modelos menores e focados, as GPUs de consumo são uma alternativa viável e econômica. Essa abordagem não apenas reduz drasticamente os custos de treinamento, mas também torna a tecnologia mais acessível. Além disso, os TLMs da Fastino são projetados para rodar em hardware de baixo custo, como CPUs ou as mesmas GPUs de jogos, permitindo implantação local (on-premise), na borda (edge) ou na nuvem privada da empresa, oferecendo maior controle sobre os dados e menor latência.

Casos de Uso e Acesso aos Modelos da Fastino

A Fastino já disponibiliza uma API para desenvolvedores com um nível gratuito que permite até 10.000 requisições por mês. Os primeiros modelos disponíveis através da API incluem:

  • Summarization (Sumarização): Gera resumos concisos e precisos de textos longos ou ruidosos.
  • Function Calling (Chamada de Função): Converte entradas do usuário em chamadas de API estruturadas, ideal para sistemas de agentes.
  • Text to JSON (Texto para JSON): Converte texto não estruturado em JSON limpo e pronto para produção.
  • PII Redaction (Redação de PII): Remove informações de identificação pessoal (PII) de forma zero-shot, com suporte para tipos de entidades definidos pelo usuário.
  • Text Classification (Classificação de Texto): Um modelo zero-shot versátil para tarefas de rotulagem, com salvaguardas de nível empresarial.
  • Profanity Censoring (Censura de Profanidade): Identifica e remove linguagem profana.
  • Information Extraction (Extração de Informação): Extrai dados estruturados como entidades e atributos de texto.

Empresas da Fortune 500 já estão utilizando os TLMs da Fastino para acelerar a adoção de IA em seus fluxos de trabalho, abrangendo desde a análise de documentos nos setores financeiro e de saúde até a inteligência de consultas de pesquisa em tempo real no comércio eletrônico.

O Papel da Khosla Ventures e o Futuro da Fastino

O investimento da Khosla Ventures é um forte endosso à abordagem da Fastino. A Khosla Ventures tem um histórico de identificar empresas com potencial disruptivo no setor de IA, como evidenciado por seu investimento inicial na OpenAI. Jon Chu, Sócio da Khosla Ventures, comentou que "grandes empresas que usam modelos de fronteira normalmente só se preocupam com o desempenho em um conjunto restrito de tarefas". Essa percepção se alinha perfeitamente com a estratégia da Fastino de focar em modelos especializados.

Com o novo capital, a Fastino planeja expandir sua equipe de pesquisa, refinar ainda mais o desempenho de seus modelos e aumentar a lista de tarefas suportadas. A empresa busca ativamente por pesquisadores que desafiem o pensamento convencional sobre como os modelos de linguagem devem ser construídos. "Nossa estratégia de contratação é muito focada em pesquisadores que talvez tenham um processo de pensamento contrário à forma como os modelos de linguagem estão sendo construídos no momento", explicou Lewis. Essa filosofia pode dar à Fastino uma vantagem competitiva em um mercado onde a tendência predominante tem sido simplesmente aumentar o tamanho dos modelos e o poder computacional.

A Fastino também se destaca por seu modelo de precificação. A empresa oferece um preço fixo mensal e o primeiro nível de API gratuito do setor para seus modelos, visando tornar a IA de alta velocidade e baixo custo acessível a desenvolvedores globalmente.

Enquanto os gigantes da tecnologia continuam sua corrida por modelos cada vez maiores, a Fastino aposta na especialização, eficiência e acessibilidade, provando que inovações significativas podem surgir de abordagens mais enxutas e focadas. A trajetória da Fastino será acompanhada de perto, pois tem o potencial de democratizar o acesso a soluções de IA poderosas e personalizadas para empresas de todos os tamanhos.

Mizael Xavier

Mizael Xavier

Desenvolvedor e escritor técnico

Ver todos os posts

Compartilhar: