PNL

Escritores: por que os robôs não estão vindo para seus trabalhos (ainda)

Malicioso, perigoso, assustador e apocalíptico. O novo modelo de geração de texto da OpenAI, conhecido como GPT-2, foi sensacionalizado. Alarmes estão sendo tocados sobre notícias falsas, deslocamento de jornalistas e até extinção. Por um lado, a inteligência artificial – o Processamento de Linguagem Natural (PNL) em particular – deu saltos incríveis nos últimos anos, abordando problemas considerados insolúveis há apenas uma década. Por outro lado, muitas das conquistas foram reduzidas a um binário: os algoritmos são inúteis ou nossos novos senhores. Qual é o estado da inteligência artificial na compreensão da linguagem? E como isso afetará nossas vidas?

O que é PNL?

O Processamento de Linguagem Natural, ou PNL, é um subcampo da inteligência artificial que visa permitir que as máquinas entendam a linguagem humana. Quer seja a Siri a responder ao seu pedido de indicações para a mercearia mais próxima ou o chatbot da companhia aérea que tenta negociar o reembolso, os modelos de PNL estão em todo o lado.

Esses modelos usam tokens – unidades de texto como palavras ou frases – e usam isso para tomar decisões, como o que a tradução francesa de “donut” é, ou se “amado” é um sentimento positivo ou negativo.

A última tendência de aprendizagem profunda revolucionou o campo. Usando redes neurais profundas com milhões de parâmetros, esses modelos de aprendizagem profunda podem reconhecer padrões com uma precisão surpreendente, inicialmente com reconhecimento de imagem e agora também com linguagem e sintaxe. As razões para o avanço são um tanto complexas, mas geralmente são atribuídas a três fatores principais. Primeiro, os conjuntos de dados são maiores e com maior qualidade do que nunca. O Snapchat tem acesso a bilhões de fotos de rostos de pessoas em resolução relativamente alta – um fato antes insondável. Os recursos computacionais também cresceram exponencialmente, com Unidades de Processamento Gráfico (Graphics Processing Units – GPUs) permitindo que os modelos treinassem magnitudes mais rapidamente. Por fim, descobrimos novos e melhores algoritmos (explorados abaixo) que melhoraram muito os dados que temos.

Vamos ampliar a imagem anterior da palavra “amada”. Como um modelo de PNL entende a palavra? Por meio de incorporação de palavras ou de um vetor de números que mapeiam exclusivamente uma palavra. Você pode imaginar um gráfico 2D onde as palavras têm coordenadas específicas e as palavras com coordenadas mais próximas têm significados mais próximos. Para realmente aprender o conjunto correto de números por palavra, os embeddings de palavras devem ser treinados em enormes quantidades de texto. O modelo de incorporação de palavras do Google foi treinado em 100 bilhões de palavras (o equivalente a cerca de 120 milhões de artigos da wikipedia).

Essas palavras “embeddings” são usadas como entradas para o modelo, que normalmente usa uma arquitetura Transformer, introduzida pela primeira vez em 2017 pelo Google. Essencial para quase todos os desenvolvimentos recentes da PNL, o Transformer inspirou uma grande quantidade de modelos de PNL que alcançaram resultados de última geração. Esses modelos se baseiam no aprendizado de transferência: os modelos são inicialmente treinados em conjuntos de dados enormes uma vez e depois adaptados com base em aplicativos específicos. Isso permite que um modelo seja usado em uma variedade de tarefas sem precisar treinar todo o modelo.

Automação Baseada em NLP

i) Curto Prazo

Mas com que medo devemos ser da automação baseada em linguagem? Esta é uma questão conceitualmente nuançada que deve ser dividida em pelo menos dois componentes: curto prazo e longo prazo. O primeiro é mais fácil de responder, enquanto o segundo é mais interessante de se especular.

Jornalistas como Hannah Parkinson, do The Guardian, responderam, ainda que de maneira irônica, aos últimos desenvolvimentos da PNL com alarmismo. Ela aponta para o uso de texto gerado por máquinas da Bloomberg e da Reuters como evidência de que os jornalistas serão rapidamente deslocados em um futuro próximo. Além disso, um relatório da empresa de pesquisa CB Insights aponta startups como a Narrative Science – com sua “plataforma de geração de linguagem natural avançada” Quill para automatizar artigos – e startup de tecnologia legal ROSS Intelligence, cuja própria plataforma ajuda equipes legais a encontrar detalhes relevantes de casos, como evidência de tendências de curto prazo na tecnologia de processamento de linguagem. Enquanto poucas pessoas esperam que os jornalistas sejam substituídos por algoritmos nos próximos dois anos, há uma verdadeira apreensão sobre o impacto de curto prazo da PNL sobre os trabalhadores que lidam com a língua como sua ocupação.

A conta de Parkinson é convincente até que analisemos a capacidade atual das redes atuais e consideremos a possibilidade de o espaço mudar. Os computadores agora se destacam em condensar fatos e números e aplicar um fino verniz de prosa, tudo em algumas centenas de milissegundos. Isso ainda tem que incluir qualquer forma de inferência lógica ou raciocínio. Até mesmo o GPT-2, com os gigantescos recursos computacionais e informações que serviram para treinar o modelo, faz pouco melhor do que responder à pergunta “que palavras soam certas diante desse alerta?”. É nosso cérebro humano que fica surpreso por poder sustentar um narrativa através de vários parágrafos e parece dizer algo parecido com uma história. Isto não é para depreciar o estado da PNL; Realizaram-se progressos reais desde os velhos tempos do caso específico de ordem das palavras. No entanto, o que vemos com o GPT-2 é pouco mais do que correspondência estatística extravagante em grande escala.

Para substituir adequadamente um jornalista – os investigadores e formadores de opinião – teremos que construir uma mente. O bom jornalismo requer uma ampla variedade de crenças sobre o mundo e um conjunto de observações que podem ser recombinados com essas crenças em um conjunto de etapas inferenciais para chegar a uma conclusão.

No momento, não temos como fazer com que um computador faça qualquer coisa além do nível mais elementar de deduções lógicas. (A programação probabilística, um campo que tenta permitir que os computadores realizem tipos mais complexos de inferência matemática, é promissor, mas incipiente, sem resultados empíricos que rivalizem com os do atual paradigma da rede neural profunda).

Há também o fato de que a PNL muda o panorama do jornalismo de maneiras potencialmente enriquecedoras. Um relatório de 2017 divulgado após uma conferência no Centro Tow para o Jornalismo Digital na Columbia Journalism School refere-se a um “espectro de autonomia” para a inteligência artificial.

De um lado, há programas que não precisam de intervenção humana para gerar texto, enquanto, do outro lado, alguns programas apenas suportam a criação de artigos de maneira periférica. O relatório do Tow Center argumenta convincentemente que a mudança do jornalismo para os tipos de artigos que podem ser totalmente automatizados resultará em um enriquecimento do jornalismo; em vez de escrever os mesmos artigos de resumo do evento, os jornalistas podem se concentrar em peças que exigem mais pensamento analítico.

O relatório aponta para casos como o uso de classificadores pelos repórteres do Los Angeles Times para detectar a subnotificação sistemática do crime por parte de LAPD, a aplicação de raspagem na web e a PNL para relatar casos de abuso sexual por médicos e a investigação do New York Times. de dados de financiamento de campanha usando ferramentas semelhantes.

A menos que haja um grande avanço conceitual no campo do processamento de linguagem natural em um futuro próximo, é improvável que nada, a não ser os artigos resumidos mais simples de jornalistas, seja escrito por programas.

ii) longo prazo

Ao considerar o prazo mais longo, no entanto, as coisas são muito mais controversas, no que diz respeito ao aprendizado de máquina / automação / tecnologia, sem falar no subcampo da PNL. Os professores do Massachusetts Institute of Technology, David Autor e Andrew McAfee, são duas vozes significativas sobre o tema da tecnologia e automação.

Ambos apresentam diferentes visões do futuro. Autor argumenta que, como mais empregos são automatizados, os seres humanos são liberados para implantar sua ingenuidade em outros lugares e criar empregos para preencher nossa demanda. Nosso desejo insaciável por bens e serviços é em parte porque os humanos sempre terão algum tipo de trabalho.

Uma advertência importante que ele acrescenta, porém, é que não há garantia de que teremos empregos que sejam gratificantes ou que paguem um salário digno. A McAfee, em contrapartida, cita a parcela cada vez menor do capital investido em mão-de-obra, como prova de que estamos à beira da curva de crescimento. As empresas estão investindo mais em tecnologia da informação às custas dos seres humanos; A McAfee acredita que isso reflete a relevância decrescente dos seres humanos no ambiente de trabalho.

Um modelo útil para tentar entender os impactos da automação, explicou-me o professor Autor em seu escritório, é pensar em uma escala de duas dimensões: produtividade e deslocamento. As melhores tecnologias para a força de trabalho são tecnologias que aumentam muito a nossa produção sem colocar ninguém fora do trabalho.

A máquina de escrever elétrica é um exemplo disso; as pessoas podiam escrever mais rápido com menos congestionamentos e poucos trabalhos eram substituídos. As piores tecnologias são o que o colega de autor Daron Acemoglu se refere como “tecnologias so-so”, que deslocam muitos trabalhadores sem aumentar nossa capacidade de produção.

Pense no seu atendimento automatizado, que oferece um serviço um pouco pior e desloca diretamente muitos funcionários. Grande parte do desacordo gira em torno de saber se os desenvolvimentos atuais em tecnologia (especialmente no que diz respeito ao aprendizado de máquina) são mais do que “tecnologias so-so”.

A alegação de prever os efeitos a longo prazo da automação não deveria ser tão surpreendente; há uma divergência de opinião semelhante quando se pergunta aos especialistas em inteligência artificial quanto tempo poderemos esperar uma “inteligência artificial geral” que rivalize com a inteligência humana.

Parte disso é a dificuldade inerente em prever a atividade de alta variância. Por enquanto, se uma conclusão pode ser feita, é que o futuro do jornalismo será de propriedade dos jornalistas tecnicamente mais competentes.


Marketing para Psicólogos