6 dicas para liderar um projeto de aprendizagem automática

A Aprendizagem Automática e a Aprendizagem Profunda já não são apenas um exagero e um chavão. A tecnologia, outrora de fronteira, evoluiu para um componente crucial da pilha tecnológica de empresas e startups, o que transformou o desenvolvimento de software. Uma vez que a aprendizagem automática (ML) está interligada com os processos de tomada de decisão nas empresas, queremos distinguir que a pilha de tecnologia ML é um processo e não apenas uma peça estática de software.

As soluções de aprendizagem automática são impulsionadas pela disponibilidade e quantidade dos dados correctos, o que altera a forma como pensamos sobre a construção, manutenção e melhoria da infraestrutura. A criação de soluções de aprendizagem automática não é simples devido a estes factores. Os cientistas de dados, os programadores de software e os engenheiros de DevOps têm de colaborar em várias áreas para produzir uma solução útil. Este artigo descreve 6 práticas recomendadas que todas as organizações que lideram um projeto de aprendizagem automática devem seguir.

1. Definir os objectivos e especificar os requisitos do projeto

Definir uma meta ou um objetivo concreto não é tão simples como parece. Há uma variedade de abordagens que podem ser utilizadas para resolver um problema e nem sempre é claro qual é a melhor. Pode ser tentador passar menos tempo a definir claramente os objectivos, mas é por causa de objectivos mal definidos que os projectos acabam por descarrilar, uma vez que a equipa que está a construir a solução não sabe a que dar prioridade e pode perder-se a fazer testes para ver o que os vários modelos conseguem alcançar, destruindo a dinâmica do projeto, a probabilidade de lançamento de um projeto e o retorno do investimento (ROI) devido ao desenvolvimento interminável.

Ter objectivos e prioridades claramente definidos é essencial para gerir os objectivos de aprendizagem automática da sua empresa. Frequentemente, acabará por ultrapassar os prazos devido a um âmbito em constante expansão e à falta de critérios de avaliação, o que pode fazer com que deixe de se concentrar na identificação das soluções que têm um ROI e satisfazem os objectivos da sua empresa. Desde o início do projeto, todos devem trabalhar para o mesmo objetivo.

2. Crie uma lista de verificação antes de iniciar o seu projeto de ML

Deve ter um conceito sólido de como o seu progresso irá aparecer antes mesmo de escrever a sua primeira linha de código. Pense nas seguintes questões antes de iniciar o seu projeto de ML:

O que é que o seu projeto ML pretende alcançar?
Tem os dados correctos?
Como será avaliado o desempenho do modelo?
O modelo tem de ser leve e funcionar no computador do utilizador ou no servidor da empresa?
O modelo pode processar os dados antecipadamente ou é necessário um modelo leve que possa ser executado em tempo real?
Estão criadas as infra-estruturas necessárias?
O desempenho extra de modelos maiores e mais GPUs é realmente importante para o caso de utilização ou vale o ROI?
Quais são os requisitos para a implantação?
A explicabilidade é necessária?

3. Planear e definir o processo iterativo

Mesmo que o modelo inicial esteja a ser utilizado na produção, o seu trabalho ainda não está concluído. A chave para uma implementação bem sucedida da Aprendizagem Automática é começar com pouco, colocar um MVP a funcionar com os dados de que dispõe e avaliar a solução para ver se a precisão do modelo é ou pode ser comparada com o desempenho a nível humano. Depois de o fazer, é preciso avaliar se há retorno do investimento em iterações posteriores, investindo na obtenção de mais e melhores dados e, potencialmente, resolvendo casos extremos que não têm dados suficientes com técnicas não-ML.

Repetir sempre o procedimento para cada nova solução e efetuar alterações antes da iteração seguinte. Os objectivos comerciais variam quase sempre. À medida que a tecnologia subjacente, a investigação, os métodos e o hardware para alimentar soluções de computação intensiva evoluem. Tudo isto pode resultar na necessidade de afinar ou otimizar o seu modelo para se adaptar às condições variáveis do mundo ou da indústria em que opera, aos dados com que está a trabalhar, a novas capacidades ou a sistemas totalmente novos.

4. Recolha de dados históricos dos sistemas existentes

Por vezes, os requisitos não são muito óbvios, o que dificulta a identificação imediata do objetivo certo. Ao integrar o Machine Learning em sistemas antigos, este é frequentemente o caso. Reúna o máximo de informação possível do sistema atual antes de entrar nas especificidades do que a sua aplicação irá realizar e da função que a aprendizagem automática irá desempenhar.

Desta forma, é possível realizar a tarefa em causa utilizando dados históricos. Além disso, estes dados podem apontar imediatamente áreas que necessitam de otimização e o melhor curso de ação.

5. Garantir o acesso aos dados necessários

Depois de ter uma ideia do problema, é necessário obter informações pertinentes. Vale a pena consultá-las porque a maioria das fontes de dados está acessível gratuitamente em sítios Web como Kaggle e Conjuntos de dados UCI. Se o seu problema for distinto, poderá ter de recolher, organizar e armazenar os seus próprios dados. A recolha de dados da Internet e a categorização manual dos dados recolhidos são duas opções frequentes. Obter a qualidade correcta e a quantidade suficiente dos dados de que necessita é, muitas vezes, o que lhe permitirá criar soluções de ML úteis e com maior probabilidade de entrar em produção após os testes iniciais.

6. Avaliar e obter a pilha de tecnologia correcta

Os modelos de ML escolhidos devem ser executados manualmente para verificar a precisão após a seleção. Por exemplo, no caso do marketing personalizado por e-mail, deve adaptar a sua estratégia e testar mais variáveis se os e-mails promocionais enviados não estiverem a gerar uma taxa de conversão superior à sua taxa de conversão de base.

É necessário selecionar a melhor tecnologia após testes manuais bem sucedidos. As equipas de ciência de dados devem ter a liberdade de escolher entre vários conjuntos de tecnologias para permitir a experimentação e a seleção do conjunto de tecnologias que simplifica o ML. A avaliação comparativa deve ser efectuada em termos de velocidade, estabilidade, ROI, capacidade de resolver problemas da força de trabalho/clientes, casos de utilização futura e desempenho no dispositivo ou na nuvem.

Como é que a IA da desnatação pode ajudar?

Os modelos de aprendizagem automática e de aprendizagem profunda exigem um vasto conhecimento do domínio, acesso a dados rotulados de alta qualidade e recursos computacionais para a formação e melhoria contínuas dos modelos. A melhoria do modelo de aprendizagem automática é uma habilidade que evolui a partir da abordagem metódica das deficiências dos modelos existentes com as restrições dadas. A Skim AI fornece soluções úteis para pessoas de todos os níveis, desde estudantes a directores executivos, que o ajudam a ultrapassar o ruído, a discernir melhores percepções e a tomar melhores decisões com base em dados que contam.

pt_PTPortuguês