Versão aberta do ChatGPT é liberada, mas treiná-lo pode sair caro

Um desenvolvedor de engenharia reversa de sistemas criou um modelo alternativo do ChatGPT e o liberou em código aberto, porém sem treinamento

Jorge Marin

schedule08/01/2023, às 12:00

Fonte: Shutterstock

Imagem de Versão aberta do ChatGPT é liberada, mas treiná-lo pode sair caro no tecmundo

Com o grande sucesso do gerador de texto ChatGPT da OpenAI, uma versão “genérica” foi lançada em código aberto no finalzinho de 2022. Teoricamente, o novo sistema é capaz de realizar qualquer uma das tarefas que o famoso chatbot de inteligência artificial executa, como rascunhos de email, sugestões de código de computador e textos acadêmicos.

Criado por Philip Wang, o desenvolvedor responsável pela engenharia reversa do sistema de criação de imagens Make-A-Video da Meta, o novo modelo é uma combinação do PaLM do Google com a técnica Aprendizagem por Reforço com Feedback Humano (RLHF na sigla em inglês).

smart_display

Nossos vídeos em destaque

Mas há um porém: esse combinado de PaLM com RLHF não vem pré-treinado. Isso significa que os usuários da IA de Wang deverão, eles próprios, compilar os corpus de dados e usar o seu hardware pessoal para treinar o modelo e processar posteriormente as solicitações. Só que estamos falando aqui em gigabytes de texto e um hardware que dê conta dessa tarefa.

Como treinar uma inteligência artificial?

Fonte: Shutterstock/Reprodução.

De acordo com o TechCrunch, o novo modelo de gerador de texto funciona de forma análoga ao ChatGPT, mas, por ser uma ferramenta estatística que prevê palavras, precisa ser alimentada por um grande número de exemplos, como postagens das redes sociais, textos noticiosos e ebooks variados.

Para aprender a probabilidade de ocorrência de palavras, o RLHF treina um modelo de linguagem produzindo uma enorme gama de respostas a um determinado prompt humano. Essas respostas têm então que ser classificadas por voluntários humanos para criar uma espécie de "sistema de recompensa" que criará um ranking de preferências.

Naturalmente, não se trata de um processo acessível para a maioria dos usuários. O modelo de linguagem natural PaLM do Google, por exemplo, demandou 540 bilhões de parâmetros de linguagem. Um estudo de 2020 do AI21 Labs calculou as despesas para treinar um modelo com apenas 1,5 bilhão de parâmetros em até US$ 1,6 milhão (R$ 8,8 milhões).

TechCrunch

Jorge Marin

Especialista em Redator

Redator do Mega Curioso e do TecMundo, Jorge Marin escreve sobre Ciências e Tecnologia desde 2019, conectando conhecimento acadêmico com experiências humanas do dia a dia. É psicólogo, cinéfilo e botafoguense inveterado.

local_mall