OpenAI treinou um modelo GPT-4 para gerar respostas e apontamentos em aprendizagem de IA, com feedbacks dos treinadores.
A OpenAI desenvolveu o CriticGPT, uma ferramenta baseada no GPT-4, com o objetivo de detectar falhas nas respostas produzidas pelo ChatGPT. Segundo a empresa, ao contar com a CriticGPT para revisar os textos gerados pelo ChatGPT, os usuários conseguem resolver os possíveis equívocos sem assistência adicional em 60% das situações. O conjunto de modelos GPT-4 que alimenta o ChatGPT é aprimorado por meio do ‘aprendizado de reforço a partir do feedback humano’ (RLHF), o que implica que a plataforma aprimora seu desempenho à medida que os usuários, também conhecidos como treinadores de inteligência artificial, avaliam as respostas fornecidas pelo ChatGPT e apontam possíveis erros.
Essa abordagem de correção contínua por meio do CriticGPT e do RLHF demonstra a importância da revisão constante no desenvolvimento de modelos de inteligência artificial. A detecção de falhas e a correção ativa dos erros contribuem significativamente para a melhoria da qualidade das respostas geradas pelo ChatGPT, fornecendo um valioso auxílio aos usuários na interação com a plataforma.
CriticGPT: Uma Ferramenta de Revisão e Correção
À medida que a inteligência artificial avança, é crucial aprimorar as ferramentas que a sustentam. Nesse contexto, o CriticGPT surge como uma valiosa adição ao arsenal de auxílio aos treinadores de IA. Enquanto o modelo ChatGPT evolui, é natural que seus erros se tornem mais complexos, o que pode dificultar a detecção por parte dos especialistas. É aí que entra o CriticGPT, oferecendo uma abordagem refinada para a revisão de respostas geradas.
A empresa responsável pelo desenvolvimento do CriticGPT planeja integrar modelos semelhantes ao processo de Refresco de Aprendizagem por Reforço (RLHF), visando enriquecer os feedbacks humanos com as contribuições da IA. Embora as sugestões do CriticGPT não sejam infalíveis, elas representam uma ferramenta valiosa para identificar erros que poderiam passar despercebidos.
Assim como o modelo GPT-4, o CriticGPT também se aprimora com o uso contínuo e os feedbacks dos usuários. Um exemplo prático desse aprimoramento é a capacidade do CriticGPT de apontar possíveis falhas no ChatGPT, conforme divulgado pela OpenAI. Os testes realizados entre os dois modelos revelaram que as correções sugeridas pelo CriticGPT superaram as do ChatGPT em 63% das vezes.
Além de oferecer correções mais precisas, o CriticGPT também se destaca por reduzir ocorrências de alucinações, onde a IA gera informações incorretas. No entanto, é importante ressaltar que o CriticGPT possui limitações e pode não ser capaz de lidar com tarefas extremamente complexas.
Em um cenário em constante evolução, o CriticGPT se destaca como uma ferramenta promissora para aprimorar a qualidade das respostas geradas pela inteligência artificial. Seu papel como auxílio aos treinadores de IA é fundamental para garantir a precisão e confiabilidade das interações geradas pelos modelos de linguagem.
Fonte: © CNN Brasil
Comentários sobre este artigo