A Inteligência Artificial (IA) é a capacidade de um computador replicar o processo intelectual próprio dos seres humanos, ou seja, raciocinar, descodificar, generalizar ou aprender com a experiência. Essa capacidade – que consiste em conhecimento humano codificado – permite aos computadores realizar autonomamente tarefas altamente complexas de diagnóstico médico, reconhecimento textual, vocal, facial e genético, condução de veículos, etc.
Inteligência Artificial e Empreendedorismo
Uma área de especialização da IA, Machine learning (ML) ou «aprendizagem autónoma» ensina os computadores a aprender, isto é, a agir sem serem especificamente programados. Os humanos aprendem através de regras de decisão, que vão melhorando através da experiência. Os computadores aprendem com algoritmos, que são critérios de decisão formalizados matematicamente, e cujo input são dados. Quantas mais experiências, e quantos mais dados, mais se aprende. ML utiliza matemática e estatística para criar inteligência artificial nos computadores.
Existem vários mitos muito populares que veem ML como um universo fechado de: #1 automatismo e robots; #2 equipamento sofisticado e muito caro; #3 mega-empresas como as Big Five Tech Companies (Amazon, Apple, Facebook, Google e Microsoft); e #4 programadores. Mas será mesmo assim?
#1. ML é intensiva em capital humano, que é um conjunto de conhecimentos, competências e características pessoais. ML precisa de pessoas a montante, para programar, e a jusante, para interpretar os dados. A importância do Factor Humano está bem patente nas designações profissionais (data scientist, data analyst, machine learning engineer) e nas respectivas remunerações. Em média, o salário anual de um cientista de dados sénior pode oscilar entre 71 mil dólares (Ásia-Pacífico), 85 mil (Europa), e 138 mil (EUA). As empresas que pagam melhor? Nordstrom (107 mil), Boeing (115 mil), Zillow (118 mil), Microsoft (125 mil) e Facebook (152 mil).
#2. Existem ferramentas gratuitas ou de código aberto, concorrendo em pé de igualdade com soluções comerciais, em todos os níveis da tecnologia de ML (“the ML stack”). Algumas foram desenvolvidas em universidades, que as transferiram para organizações sem fins lucrativos. Como exemplos temos: as linguagens de programação mais usadas em ML, Python e R; as bibliotecas de código Numpy e Scikit-learn; as ferramentas de análise e visualização de dados Pandas e Weka; a plataforma de programação Tensorflow (desenvolvida pela Google Brain); e a ferramenta para gestão de Big Data Apache Spark.
E o hardware? De acordo com Eric Jang, Research Engineer na Google Brain, qualquer computador normal é suficiente, excepto de estivermos a falar de Deep Learning (uma subdivisão de ML). Para treinar redes neuronais, os requerimentos mínimos são os seguintes: um processador rápido, por exemplo Intel i7, pelo menos 8 GB de memória RAM, uma placa gráfica com bastante memória (P100, se tivermos um datacenter) e bom sistema de arrefecimento, e um disco rígido, se não quisermos armazenar dados na nuvem. O investimento ronda os 1.200 euros.
#3. ML vive muito dos contributos individuais de programadores e cientistas de dados, que desenvolvem pacotes de software e partilham projectos no Github, uma plataforma de desenvolvimento de software, de código aberto, detida pela Microsoft. Muitos académicos e profissionais desenvolvem algoritmos e pacotes de software para aplicar nas suas áreas de pesquisa. A psicometria, a bioinformática, a informática médica e as finanças computacionais, por exemplo, nasceram destes “casamentos de competências”.
#4. Em ML, o conhecimento do ecossistema em que se opera é fundamental, porque o objectivo é construir algoritmos que incorporem bons critérios de decisão. Para desenvolver software de detecção de fraude bancária, de negociação de activos financeiros, de previsão da procura (Uber), de recomendação de conteúdos (Amazon, Netflix, Spotify), entre outros, não basta dominar a programação informática; é essencial conhecer bem o negócio. ML é multi-disciplinar e nenhum indivíduo possui todas as competências necessárias. Propicia um modelo em que vários profissionais independentes ou micro-empresas, utilizando a base tecnológica instalada, online e de acesso aberto, para programar e armazenar código e dados, podem juntar-se para projectos específicos – sem sair de casa – ou criar start-ups altamente especializadas.
Não é difícil prever que ML vá ser cada vez mais adoptada por três sectores em Portugal: comércio, banca e seguros. Tal como em outros países, a oferta de pessoal altamente qualificado em Ciências Computacionais, recém-saído das universidades, não satisfará a procura. Abrem-se oportunidades para empreendedores, e profissionais que queiram reconverter a sua carreira ou voltar ao mercado de trabalho. Os seguintes conselhos que a empresa de recrutamento indiana Big IT Jobs divulgou no seu site aplicam-se a estas pessoas.
1. Escolher uma competência relevante e tornar-se especialista. As competências (hard skills) mais procuradas em ML são: Blockchain, Cloud Computing, Raciocínio Analítico, User Experience (UX) Design, Análise de Situações de Negócio, Affiliate Marketing, Vendas, Scientific Computing e Produção Audiovisual. Muitas dessas competências podem ser adquiridas (e reforçadas) através de plataformas de formação online[1].
2. Construir um portfolio digital de projectos de ML. “Meter a mão na massa” é fundamental para adquirir competências e demonstrar as competências adquiridas. Um projecto de ML consiste em construir um modelo e treiná-lo em dados já existentes. Existem muitas bases de dados (BD) que podem ser descarregadas gratuitamente[2] e repositórios com exemplos de projectos. Os principiantes podem construir modelos para prever resultados desportivos, resultados de eleições ou o preço de activos financeiros ou commodities; ensinar uma rede neuronal a ler escrita cursiva; análise de sentimento em redes sociais; e melhoria de cuidados de saúde.
Um projecto de ML popular entre pessoas com conhecimentos de estatística, durante o confinamento, foi a elaboração de modelos epidemiológicos para o Covid-19 com base em dados públicos. Os modelos foram treinados com os dados divulgados diariamente pelas autoridades de saúde, e a precisão das previsões foi melhorando. Estes projectos foram realizados a partir de casa, utilizando software como Excel, R e Matlab, e os resultados foram divulgados nas redes sociais.
3. Tornar-se visível. O mercado tem de saber que existe competência e apetência para resolver problemas de ML. É fundamental a presença online, através: a) de um site ou blog para exibir o portfolio digital; b) da criação de contas nas redes sociais; c) de um canal no Youtube para oferecer vídeos explicativos (tutorials) e demonstração dos modelos de ML; d) da participação activa nos fora de perguntas e respostas de comunidades como Github, Stack Overflow, Quora e Reddit, que oferecem boas oportunidades de interacção. Participar em eventos físicos e assinar artigos de opinião sobre ML na imprensa escrita ou digital são opções óbvias.
4. Interagir com potenciais clientes. Soft selling antes do hard selling. Por outras palavras, procurar tornar-se uma referência em determinada competência de ML, e ganhar o reconhecimento do ecossistema, antes de tentar vender. Por isso é que a divulgação portfolio digital é tão importante. Tornar-se visível no mercado aumenta a probabilidade de interagir com potenciais clientes: estes também estarão online e participam em (ou promovem) eventos físicos.
5. Construir uma rede. Todos os passos anteriores podem levar à criação de uma boa rede de contactos (parceiros, clientes, profissionais com competências complementares) que é essencial para referenciação e geração de oportunidades de negócio. A formação continuada, que é uma exigência premente em ML, é uma boa forma de criar e ampliar a rede.
Costuma dizer-se que «Roma não se fez num dia, mas todos os dias se colocava uma nova pedra».
[1] Codeacademy, Coursera, EdX, LinkedIn Learning, Microsoft Learn, Pluralsight, Udacity, Udemy, Eduonix, Skillshare, MIT OpenCourseWare e Harvard Online Learning. Existe ainda abundante material disponível no YouTube, Kahn Academy, Hubspot e Tedx, livros electrónicos gratuitos, blogs, etc.
[2] BD governamentais dos EUA, Índia e RU (data.gov., data.gov.in, data.uk); UCI Machine Learning Repository; kaggle.com/datasets; opendata.socrata.com; quandl.com; drivendata.org; Google dataset search; data.world; AWS Public Datasets, Github, Academic Torrents, FiveThirtyEight, etc.
Referências
https://www.britannica.com/technology/artificial-intelligence
https://thenewstack.io/machine-learning-made-easy
https://www.bigitjobs.com
https://elitedatascience.com/machine-learning-projects-for-beginners
https://www.quora.com/Which-hardware-components-CPU-RAM-GC-etc-are-needed-for-a-machine-learning-deep-learning-home-PC-computer-to-run-fast