O que é a Aprendizagem por Poucos Tiros?

19 de agosto de 2024 | 10 minutos de leitura

Índice

Na IA, a capacidade de aprender eficazmente com dados limitados tornou-se crucial. A aprendizagem de poucos disparos é uma abordagem que está a melhorar a forma como os modelos de IA adquirem conhecimentos e se adaptam a novas tarefas.

Mas o que é exatamente a Aprendizagem de Poucas Oportunidades?

Índice

Definir a aprendizagem de poucos disparos

O Few Shot Learning é um projeto inovador aprendizagem automática paradigma que permite aos modelos de IA aprender novos conceitos ou tarefas a partir de apenas alguns exemplos. Ao contrário dos métodos tradicionais de aprendizagem supervisionada, que requerem grandes quantidades de dados de treino rotulados, as técnicas de aprendizagem de poucos disparos permitem que os modelos generalizem eficazmente utilizando apenas um pequeno número de amostras. Esta abordagem imita a capacidade humana de apreender rapidamente novas ideias sem a necessidade de repetição extensiva.

A essência do Few Shot Learning reside na sua capacidade de aproveitar o conhecimento prévio e adaptar-se rapidamente a novos cenários. Ao utilizar técnicas como a meta-aprendizagem, em que o modelo "aprende a aprender", os algoritmos de Aprendizagem de Poucas Oportunidades podem lidar com uma vasta gama de tarefas com um mínimo de formação adicional. Esta flexibilidade torna-os numa ferramenta inestimável em cenários onde os dados são escassos, caros de obter ou estão em constante evolução.

Ye, Han-Jia & Sheng, Xiang-Rong & Zhan, De-Chuan. (2020). Aprendizagem de poucos disparos com otimizador de tarefas inicializado de forma adaptativa: uma abordagem prática de meta-aprendizagem. Machine Learning. 109. 10.1007/s10994-019-05838-7.

O desafio da escassez de dados na IA

Nem todos os dados são iguais, e os dados rotulados de alta qualidade podem ser um bem raro e precioso. Esta escassez representa um desafio significativo para as abordagens tradicionais de aprendizagem supervisionada, que normalmente requerem milhares ou mesmo milhões de exemplos etiquetados para obter um desempenho satisfatório.

O problema da escassez de dados é particularmente grave em domínios especializados como os cuidados de saúde, em que as doenças raras podem ter um número limitado de casos documentados, ou em ambientes em rápida mutação, em que surgem frequentemente novas categorias de dados. Nestes cenários, o tempo e os recursos necessários para recolher e rotular grandes conjuntos de dados podem ser proibitivos, criando um estrangulamento no desenvolvimento e implementação da IA.

Aprendizagem com poucos disparos vs. Aprendizagem supervisionada tradicional

Para apreciar plenamente o impacto da aprendizagem com poucos disparos, é essencial compreender a sua diferença em relação aos métodos tradicionais de aprendizagem supervisionada e por que razão esta distinção é importante em aplicações do mundo real.

Limitações das abordagens convencionais

Tradicional aprendizagem supervisionada baseia-se num princípio simples, mas ávido de dados: quanto mais exemplos um modelo vê durante o treino, melhor se torna a reconhecer padrões e a fazer previsões. Embora esta abordagem tenha conduzido a realizações notáveis em vários domínios, tem vários inconvenientes significativos:

Dependência de dados: Os modelos convencionais têm muitas vezes dificuldades quando confrontados com dados de treino limitados, levando a um sobreajuste ou a uma fraca generalização.
Inflexibilidade: Uma vez treinados, estes modelos têm normalmente um bom desempenho apenas nas tarefas específicas para as quais foram treinados, não tendo a capacidade de se adaptar rapidamente a novas tarefas relacionadas.
Intensidade de recursos: A recolha e rotulagem de grandes conjuntos de dados é morosa, dispendiosa e muitas vezes impraticável, especialmente em domínios especializados ou em rápida evolução.
Atualização contínua: Em ambientes dinâmicos em que surgem frequentemente novas categorias de dados, os modelos tradicionais podem exigir uma reciclagem constante para se manterem relevantes.

Yan, Ma & Liu, Kang & Guan, Zhibin & Xinkai, Xu & Qian, Xu & Bao, Hong. (2018). Redes adversárias geradoras de aumento de fundo (BAGANs): Geração de dados eficaz com base na síntese 3D aumentada por GAN. Symmetry. 10. 734. 10.3390/sym10120734.

Como é que a aprendizagem com poucos disparos responde a estes desafios

A aprendizagem com poucos disparos oferece uma mudança de paradigma na resolução destas limitações, proporcionando uma abordagem mais flexível e eficiente à aprendizagem automática:

Eficiência da amostra: Ao tirar partido das técnicas de meta-aprendizagem, os modelos de aprendizagem de poucos disparos podem generalizar a partir de apenas alguns exemplos, tornando-os altamente eficazes em cenários de escassez de dados.
Adaptação rápida: Estes modelos são concebidos para se adaptarem rapidamente a novas tarefas ou categorias, necessitando muitas vezes apenas de um pequeno número de exemplos para obter um bom desempenho.
Otimização de recursos: Com a capacidade de aprender a partir de dados limitados, o Few Shot Learning reduz a necessidade de uma extensa recolha de dados e rotulagem, poupando tempo e recursos.
Aprendizagem contínua: Poucas abordagens de Aprendizagem por Tiros são inerentemente mais adequadas para cenários de aprendizagem contínua, em que os modelos precisam de incorporar novos conhecimentos sem esquecer a informação previamente aprendida.
Versatilidade: Desde tarefas de visão computacional, como a classificação de imagens de poucos disparos, até aplicações de processamento de linguagem natural, a aprendizagem de poucos disparos demonstra uma versatilidade notável em vários domínios.

Ao abordar estes desafios, a aprendizagem com poucos disparos abre novas possibilidades no desenvolvimento da IA, permitindo a criação de modelos mais adaptáveis e eficientes.

O espetro da aprendizagem eficiente por amostragem

Existe um espetro fascinante de abordagens que têm como objetivo minimizar a quantidade de dados de formação necessários. Este espetro engloba a Aprendizagem Zero Shot, a Aprendizagem One Shot e a Aprendizagem Few Shot, cada uma oferecendo capacidades únicas para enfrentar o desafio da aprendizagem a partir de exemplos limitados.

Aprendizagem Zero Shot: Aprender sem exemplos

No extremo da eficiência das amostras encontra-se a Aprendizagem Zero Shot. Esta abordagem notável permite que os modelos reconheçam ou classifiquem instâncias de classes que nunca viram durante o treino. Em vez de se basear em exemplos rotulados, a Aprendizagem Zero Shot aproveita informações auxiliares, como descrições textuais ou representações baseadas em atributos, para fazer previsões sobre classes não vistas.

Por exemplo, um modelo de Aprendizagem de Tiro Zero pode ser capaz de classificar uma nova espécie animal que nunca encontrou antes, com base apenas numa descrição textual das suas caraterísticas. Esta capacidade é particularmente valiosa em cenários em que a obtenção de exemplos rotulados para todas as classes possíveis é impraticável ou impossível.

Aprendizagem de uma só vez: Aprender a partir de uma única instância

Ao longo do espetro, encontramos a Aprendizagem de uma oportunidade, um subconjunto da Aprendizagem de poucas oportunidades em que o modelo aprende a reconhecer novas classes a partir de um único exemplo. Esta abordagem inspira-se na cognição humana, imitando a nossa capacidade de apreender rapidamente novos conceitos depois de os vermos apenas uma vez.

As técnicas de aprendizagem de uma só vez baseiam-se frequentemente na comparação de novas instâncias com o único exemplo que já viram, utilizando medidas de semelhança sofisticadas. Este método tem demonstrado um sucesso notável em áreas como o reconhecimento facial, em que um sistema pode aprender a identificar uma pessoa a partir de uma única fotografia.

Agarwal, Shivaank & Gudi, Ravindra & Saxena, Paresh. (2022). Image Classification Approaches for Segregation of Plastic Waste Based on Resin Identification Code (Abordagens de classificação de imagens para a segregação de resíduos de plástico com base no código de identificação da resina). Transacções da Academia Nacional de Engenharia da Índia. 7. 10.1007/s41403-022-00324-4.

Aprendizagem com poucas hipóteses: Dominar tarefas com o mínimo de dados

A aprendizagem de poucas oportunidades alarga o conceito de aprendizagem de uma oportunidade a cenários em que está disponível um pequeno número (normalmente 2-5) de exemplos rotulados para cada nova classe. Esta abordagem estabelece um equilíbrio entre a extrema eficiência de dados da Aprendizagem Zero e da Aprendizagem One Shot e os métodos tradicionais de aprendizagem supervisionada que consomem mais dados.

Poucas técnicas de Aprendizagem por Tiros permitem que os modelos se adaptem rapidamente a novas tarefas ou classes com apenas alguns exemplos, tornando-os inestimáveis em domínios onde a escassez de dados é um desafio significativo. Ao tirar partido das estratégias de meta-aprendizagem, estes modelos aprendem a aprender, permitindo-lhes generalizar eficazmente a partir de dados limitados.

Conceitos fundamentais na aprendizagem com poucos disparos

Para compreender plenamente o poder da Aprendizagem de Poucas Oportunidades, é essencial compreender alguns conceitos fundamentais que estão na base desta abordagem inovadora.

Explicação da classificação N-way K-shot

No centro da Aprendizagem de Poucas Oportunidades está a estrutura de classificação N-way K-shot. Esta terminologia descreve a estrutura de uma tarefa de Aprendizagem de Poucas Oportunidades:

N-way refere-se ao número de classes que o modelo precisa de distinguir numa determinada tarefa.
O K-shot indica o número de exemplos fornecidos para cada classe.

Por exemplo, uma tarefa de classificação de 5 vias com 3 disparos envolveria a distinção entre 5 classes diferentes, com 3 exemplos fornecidos para cada classe. Este quadro permite aos investigadores e profissionais avaliarem e compararem sistematicamente diferentes algoritmos de Aprendizagem de Poucas Tiras em condições consistentes.

O papel dos conjuntos de apoio e de consulta

Na Aprendizagem de Poucas Imagens, os dados são normalmente organizados em dois conjuntos distintos:

Conjunto de suporte: Este conjunto contém os poucos exemplos rotulados (K disparos) para cada uma das N classes. O modelo utiliza este conjunto para aprender ou adaptar-se à nova tarefa.
Conjunto de consultas: Este conjunto consiste em exemplos adicionais das mesmas N classes, que o modelo deve classificar corretamente. O desempenho do modelo no conjunto de consulta determina o grau de aprendizagem com os exemplos limitados do conjunto de apoio.

Esta estrutura permite que o modelo aprenda com um pequeno número de exemplos (o conjunto de suporte) e, em seguida, teste imediatamente a sua capacidade de generalizar para novos exemplos não vistos (o conjunto de consulta) dentro da mesma tarefa.

Abordagens à aprendizagem de poucos disparos

Os investigadores desenvolveram várias abordagens para enfrentar os desafios da aprendizagem com poucos disparos, cada uma com os seus pontos fortes e aplicações únicas.

Técnicas ao nível dos dados

As abordagens ao nível dos dados centram-se no aumento ou na geração de dados de formação adicionais para complementar os exemplos limitados disponíveis. Estas técnicas incluem:

Aumento dos dados: Aplicar transformações a amostras existentes para criar exemplos novos e sintéticos.
Modelos generativos: Utilizar modelos avançados de IA para gerar exemplos realistas e artificiais com base nos limitados dados reais disponíveis.

Estes métodos visam aumentar a dimensão efectiva do conjunto de treino, ajudando os modelos a aprender representações mais robustas a partir de dados limitados.

Estratégias ao nível dos parâmetros

As abordagens ao nível dos parâmetros centram-se na otimização dos parâmetros do modelo para permitir uma adaptação rápida a novas tarefas. Estas estratégias envolvem frequentemente:

Técnicas de inicialização: Encontrar pontos de partida óptimos para os parâmetros do modelo que permitam uma adaptação rápida a novas tarefas.
Métodos de regularização: Restringir o espaço de parâmetros do modelo para evitar o sobreajuste dos dados limitados disponíveis.

Estas abordagens têm como objetivo tornar o modelo mais flexível e adaptável, permitindo-lhe aprender eficazmente a partir de apenas alguns exemplos.

Métodos baseados em métricas

As técnicas de aprendizagem de poucos disparos baseadas em métricas centram-se na aprendizagem de uma função de distância ou semelhança que possa comparar eficazmente novos exemplos com os dados rotulados limitados disponíveis. Os métodos populares baseados em métricas incluem:

Redes siamesas: Aprender a calcular pontuações de semelhança entre pares de entradas.
Redes prototípicas: Cálculo de protótipos de classe e classificação de novos exemplos com base na sua distância a esses protótipos.

Estes métodos destacam-se em tarefas como a classificação de imagens de poucos disparos, aprendendo a medir as semelhanças de uma forma que generaliza bem para novas classes.

Meta-aprendizagem baseada em gradientes

As abordagens de meta-aprendizagem baseadas em gradientes, exemplificadas por Model Agnostic Meta-Learning (MAML), têm como objetivo aprender a aprender. Estes métodos envolvem normalmente um processo de otimização a dois níveis:

Laço interior: Adaptação rápida a uma tarefa específica utilizando alguns passos de gradiente.
Anel exterior: Otimização dos parâmetros iniciais do modelo para permitir uma adaptação rápida a uma série de tarefas.

Ao aprender um conjunto de parâmetros que podem ser rapidamente ajustados para novas tarefas, estas abordagens permitem que os modelos se adaptem rapidamente a novos cenários com apenas alguns exemplos.

Cada uma destas abordagens à aprendizagem com poucos disparos oferece vantagens únicas, e os investigadores combinam frequentemente várias técnicas para criar modelos mais poderosos e flexíveis. À medida que continuamos a alargar os limites da IA, estes métodos de aprendizagem eficientes em termos de amostras estão a desempenhar um papel cada vez mais crucial no desenvolvimento de sistemas de aprendizagem automática mais adaptáveis e eficientes.

Aplicações em todos os sectores

Poucos tiros Aprender não é apenas um conceito teórico; é descobrir aplicações práticas em vários sectores, mudando a forma como a IA enfrenta os desafios do mundo real.

Visão computacional: Da classificação de imagens à deteção de objectos

No domínio da visão por computador, a aprendizagem de poucos disparos está a alargar os limites do que é possível fazer com dados limitados:

Classificação de imagens: Poucas técnicas de classificação de imagens captadas permitem que os modelos reconheçam novas categorias de objectos a partir de apenas alguns exemplos, o que é crucial para aplicações como a monitorização da vida selvagem ou o controlo de qualidade industrial.
Deteção de objectos: Poucos métodos de deteção de objectos disparados estão a melhorar a capacidade dos sistemas para localizar e identificar novos objectos em imagens ou fluxos de vídeo, com aplicações que vão desde veículos autónomos a sistemas de segurança.
Reconhecimento facial: As abordagens de aprendizagem one shot melhoraram significativamente os sistemas de reconhecimento facial, permitindo-lhes identificar indivíduos a partir de uma única imagem de referência.

Processamento de linguagem natural: Adaptação de modelos linguísticos

A aprendizagem com poucos disparos também está a fazer ondas no processamento de linguagem natural (PNL), permitindo modelos de linguagem mais flexíveis e eficientes:

Classificação do texto: Os modelos podem adaptar-se rapidamente a novas categorias de texto ou tarefas de análise de sentimentos com exemplos mínimos, o que é crucial para aplicações como a moderação de conteúdos ou a análise do feedback dos clientes.
Tradução automática: Poucas técnicas estão a melhorar a capacidade dos sistemas de tradução para lidar com línguas de poucos recursos ou com terminologia específica de um domínio.
Resposta a perguntas: Poucas abordagens de aprendizagem automática estão a melhorar a capacidade da IA para responder a perguntas sobre novos tópicos com dados de formação limitados.

Robótica: Adaptação rápida em novos ambientes

Na robótica, a capacidade de aprender e adaptar-se rapidamente é crucial. A aprendizagem em poucos instantes está a permitir que os robôs..:

Dominar novas tarefas com demonstrações mínimas, aumentando a sua versatilidade em funções de fabrico e de serviço.
Adaptar-se a novos ambientes ou situações inesperadas, crucial para a implantação em cenários dinâmicos do mundo real.
Aprender novas técnicas de agarrar objectos novos, expandindo a sua utilidade no armazenamento e na logística.

Cuidados de saúde: Lidar com doenças raras com dados limitados

A Aprendizagem por Poucos Tiros é particularmente valiosa nos cuidados de saúde, onde os dados relativos a doenças raras são frequentemente escassos:

Diagnóstico da doença: Os modelos podem aprender a identificar doenças raras a partir de dados limitados de imagiologia médica, acelerando potencialmente o diagnóstico e o tratamento.
Descoberta de medicamentos: Poucas técnicas de injeção estão a ajudar na identificação de potenciais candidatos a medicamentos para doenças raras, em que as abordagens tradicionais com muitos dados podem ser insuficientes.
Medicina personalizada: Ao adaptarem-se rapidamente aos dados individuais dos pacientes, os modelos de Aprendizagem por Poucos Tiros estão a contribuir para planos de tratamento mais personalizados.

Desafios e direcções futuras na aprendizagem com poucos disparos

Embora a aprendizagem com poucos disparos tenha feito progressos notáveis, continuam a existir vários desafios e direcções de investigação interessantes.

Limitações actuais:

Generalização entre domínios: Muitos modelos de Aprendizagem por Tarefas Difíceis têm dificuldades quando a distribuição da nova tarefa difere significativamente das tarefas de treino.
Escalabilidade: Algumas abordagens, nomeadamente os métodos baseados em métricas, podem tornar-se computacionalmente dispendiosas à medida que o número de classes aumenta.
Robustez: Poucos modelos de Aprendizagem por Tiro podem ser sensíveis à escolha dos exemplos do conjunto de suporte, conduzindo potencialmente a um desempenho inconsistente.
Interpretabilidade: Tal como acontece com muitas abordagens de aprendizagem profunda, o processo de tomada de decisão nos modelos de aprendizagem com poucos tiros pode ser opaco, limitando a sua aplicabilidade em domínios sensíveis.

Áreas de investigação promissoras:

Aprendizagem de poucos disparos em vários domínios: Desenvolver métodos que possam ser generalizados em domínios muito diferentes, aumentando a versatilidade dos modelos de Aprendizagem por Poucos Tiros.
Incorporação de dados não rotulados: Explorar abordagens de aprendizagem semi-supervisionada de poucos disparos para tirar partido da abundância de dados não rotulados disponíveis em muitos domínios.
Aprendizagem contínua de poucos disparos: Criar modelos que possam aprender continuamente novas tarefas sem esquecer a informação previamente aprendida, imitando mais de perto a aprendizagem humana.
Aprendizagem explicável com poucos disparos: Desenvolver modelos interpretáveis de aprendizagem por disparo rápido para aumentar a confiança e a aplicabilidade em domínios críticos como os cuidados de saúde e as finanças.
Aprendizagem de poucos disparos na aprendizagem por reforço: Alargamento dos princípios da aprendizagem de poucos disparos a cenários de aprendizagem por reforço para uma adaptação mais rápida em ambientes complexos.

A linha de fundo

A aprendizagem de poucos disparos surgiu como uma força transformadora, reformulando a forma como abordamos os desafios da aprendizagem automática. Ao permitir que os sistemas de IA aprendam de forma eficiente a partir de dados limitados, a Aprendizagem de Poucas Oportunidades está a colmatar a lacuna entre a flexibilidade cognitiva semelhante à humana e a natureza ávida de dados da aprendizagem profunda tradicional. Desde a melhoria da visão computacional e do processamento de linguagem natural até ao avanço da robótica e dos cuidados de saúde, a Few Shot Learning está a provar o seu valor em diversas indústrias, abrindo novas fronteiras de inovação.

À medida que os investigadores continuam a enfrentar as actuais limitações e a explorar direcções promissoras, podemos antecipar sistemas de IA ainda mais poderosos e versáteis no futuro. A capacidade de aprender e de se adaptar rapidamente a partir de apenas alguns exemplos será crucial à medida que avançamos para uma inteligência artificial mais geral, alinhando a aprendizagem automática mais estreitamente com as capacidades cognitivas humanas e abrindo novas possibilidades no nosso mundo em rápida mudança.

Precisa de desenvolvimento de IA?

O que é a Aprendizagem por Poucos Tiros?

Definir a aprendizagem de poucos disparos

O desafio da escassez de dados na IA