banner
Lar / Notícias / A Ascensão do Aberto
Notícias

A Ascensão do Aberto

Dec 15, 2023Dec 15, 2023

Seth Grief-Albert

Seguir

Revisão da Tecnologia QMIND

--

Ouvir

Compartilhar

A tecnologia é um fenômeno interessante. Pode existir de uma forma ou de outra por um bom tempo, escondido ou inacessível, até que um dia parece emergir totalmente formado e então é vorazmente consumido pelo público. A mais nova corrida do ouro do século 21 está chegando. A era da Inteligência Artificial (IA) mercantilizada está avançando e, com ela, a batalha por seu potencial de poder e lucros está sendo travada.

A 'IA' que alcançou uma prevalência extraordinária é mais apropriadamente rotulada como seu subconjunto específico, Large Language Models (LLMs), mas a cultura popular tem uma maneira de atribuir chavões que se prendem a todo o campo. Muitos podem ter ouvido falar sobre "esta nova tecnologia de IA" pela primeira vez pela mídia ou por um membro da família, em vez de seu feed habitual do Twitter ou blog técnico - tal é a velocidade de sua disseminação no mercado. O campo da IA ​​vem fazendo um progresso incrível há anos, mas o ponto de explosão do consumidor parece ter sido no início de meados de dezembro de 2022, quando a OpenAI lançou o ChatGPT ao público em uma página da web. O quadro a seguir fala por si:

É claro que as pessoas estão ansiosas para interagir e usar a tecnologia de IA. Imagine-se como um desenvolvedor que vê esse visual, ou o executivo de uma corporação gigante de tecnologia, ou o fundador de uma startup. Tomando emprestado da história, podemos comparar a era atual da IA ​​ao período medieval. Os governantes detinham o poder e as riquezas e guardavam seus castelos, enquanto os plebeus eram excluídos. De tempos em tempos, bárbaros errantes tentavam usurpar os governantes. Grandes corporações (Google, Meta, Microsoft, etc.) ocupam o lugar do trono, enquanto desenvolvedores e acadêmicos desempenham o papel de outsiders. Como essa história se desenrola? Voltemos ao início de 2023.

O ChatGPT estava no ar há mais de um mês, e o hype em torno dos Large Language Models estava em pleno andamento. Mas o que exatamente é um LLM? Eles se originam como 'modelos de fundação' ou algoritmos especializados que passaram por longos períodos de treinamento em grandes quantidades de dados textuais. O resultado desse processo é um modelo que pode responder a consultas de linguagem com respostas razoáveis. Esses modelos possuem um grande número de pesos e parâmetros que, para nossos propósitos, podem ser pensados ​​como todos os padrões aprendidos no treinamento. Esses pesos e parâmetros são maleáveis ​​e podem ser ajustados. Aqui, os LLMs são expostos a uma tarefa mais específica do que a reconstrução geral do texto. A tarefa mais popular e ajustada que vimos até agora foi a conversa natural, mas a segunda colocada é o modelo de linguagem seguir instruções de texto.

O modelo básico do ChatGPT é o GPT-3, que foi aprimorado para interagir por meio de conversação usando o Aprendizado por Reforço com Feedback Humano (RLHF), tornando-se o GPT-3.5. Em essência, pessoas reais analisaram várias respostas que o LLM havia dado e selecionaram as que eram mais semelhantes às conversas reais. Esse ajuste fino humano em loop transformou um modelo de texto preditivo (que já existia há mais de um ano) na maravilha global que conhecemos hoje. O ajuste fino é uma ferramenta poderosa que pode transformar o caos de dados em aparência de ordem.

Mas OpenAI não era o único jogador no jogo. Trabalhando silenciosamente, a Meta preparava o lançamento de seu próprio modelo de fundação. Em 24 de fevereiro de 2023, o LLaMA (Large Language Model Meta AI) foi lançado no mundo. Não demorou muito para que as coisas desmoronassem.

Avanço rápido menos de uma semana. A tarde de 2 de março de 2023 marcou um novo começo para a descentralização da IA: um arquivo contendo os pesos do LLaMA vazou ao público por um usuário anônimo no site de mídia social 4chan. Isso provocou uma explosão de interesse que tomou de assalto o mundo da IA. Não demorou muito para os pesos abrirem caminho pela Internet para o território do GitHub e do HuggingFace – essencialmente a primeira página de software e IA da Internet, respectivamente.