https://ai-talks.org/blog-english-potugues/

Cover: Kvin ruĝaj pomoj. Vektora bildo.
(“Five red apples. Vector Image.” in Esperanto).
No machine-readable author provided.
Maksim assumed (based on copyright claims).
5 January 2006 (original upload date).
Source: Wikimedia Commons.

Maurício Pinheiro

No campo das redes neurais artificiais, o perceptron é um modelo fundamental para entender o aprendizado supervisionado. Embora tradicionalmente os perceptrons sejam treinados usando equações matemáticas e algoritmos, este artigo explora uma abordagem alternativa para treinar um perceptron usando tabelas do Excel. Especificamente, focamos em um neurônio com dois inputs e um neurônio de saída, excluindo o viés (bias) e funções de ativação, e utilizamos a simplicidade e versatilidade do Excel para demonstrar o processo de aprendizado supervisionado.

O aprendizado supervisionado é uma técnica fundamental em aprendizado de máquina, onde um algoritmo aprende a fazer previsões ou tomar ações com base em dados de treinamento rotulados. Nesse paradigma de aprendizado, cada instância no conjunto de dados de treinamento é associada a um rótulo conhecido ou valor alvo. Esses rótulos fornecem informações explícitas sobre a saída correta correspondente à entrada dada. Ao aproveitar essas informações de destino rotuladas, algoritmos de aprendizado supervisionado podem generalizar padrões e relações a partir dos dados de treinamento para fazer previsões ou classificações em instâncias de dados não vistos. A presença de alvos rotulados permite que o algoritmo otimize seus parâmetros internos e ajuste seus limites de decisão, visando minimizar a discrepância entre rótulos previstos e verdadeiros. Por meio de aprendizado iterativo e feedback, algoritmos de aprendizado supervisionado podem melhorar sua precisão preditiva e se adaptar a diversos padrões de dados, possibilitando aplicações em diferentes áreas, como reconhecimento de imagens, processamento de linguagem natural e modelagem preditiva.

Através deste exemplo, nosso objetivo é fornecer uma compreensão prática de como um perceptron pode ser treinado para somar dois números usando dados tabulares, demonstrando sua capacidade de aprender limites de decisão lineares.

O processo de treinamento de um perceptron envolve ajustar os pesos associados aos inputs para minimizar o erro entre a saída prevista e a saída desejada. No caso do nosso exemplo, o perceptron tem a tarefa de aprender a somar números. Ao fornecer pares de entrada-saída que representam diferentes combinações numéricas, podemos orientar a rede a aprender a relação matemática subjacente.

Conforme o treinamento progride, o perceptron gradualmente adapta seus pesos com base nos erros observados. Ele busca minimizar a discrepância entre a saída prevista e a saída correta, ajustando efetivamente seus parâmetros internos para aproximar a operação de adição. Por meio de inúmeras iterações e ajustes, o perceptron aprende a generalizar seu aprendizado para entradas não vistas, tornando-se proficiente em prever a soma de novos números.

O treinamento bem-sucedido da rede perceptron para realizar adição demonstraria a notável capacidade de modelos lineares simples de aprender funções complexas. Isso destaca a importância de fornecer dados de treinamento suficientes e representativos, bem como a natureza iterativa do processo de aprendizado. Além disso, enfatiza a eficácia da abordagem baseada no Excel, demonstrando como um software de planilha comum pode ser utilizado como uma ferramenta para treinar redes neurais.

1. Definindo a arquitetura da rede neural

A arquitetura da rede neural pode ser definida da seguinte forma: consiste em dois neurônios na camada de entrada, rotulados como y1 e y2. O valor alvo é definido como a soma de y1 e y2. Existem dois pesos associados às conexões entre os neurônios de entrada e o neurônio de saída, denotados como w1 e w2. A camada de saída compreende um único neurônio, rotulado como z, que calcula sua saída ao tomar a soma ponderada de y1 e y2, ou seja, z = w1 * y1 + w2 * y2. É importante ressaltar que essa arquitetura não inclui uma função de ativação para o neurônio de saída e não incorpora viés (bias).

2 Neurônios na camada de entrada: y1 e y2
Alvo Alvo = y1 + y2
2 Pesos para as duas conexões: w1 e w2
1 Neurônio na camada de saída: z = w1 y1 + w2 y2
Sem função de ativação e sem viés (bias) para o neurônio de saída.

2. Inicializando pesos aleatórios

A inicialização de pesos aleatórios é um passo essencial no treinamento de uma rede neural. No nosso caso, vamos inicializar os pesos como 0,4 e 0,6. A inicialização aleatória ajuda a introduzir diversidade e impede que a rede tenha viés em relação a uma configuração inicial específica. Ao definir os pesos com valores aleatórios, permitimos que a rede neural explore diferentes combinações de pesos durante o processo de treinamento. Essa aleatoriedade incentiva a rede a descobrir valores de pesos apropriados que levam a previsões precisas. É importante observar que a escolha dos pesos aleatórios, nesse caso, 0,4 e 0,6, é arbitrária, mas serve como ponto de partida para ajustes subsequentes dos pesos durante o processo de aprendizado.

3. Inicializando os dados rotulados de entrada

A inicialização dos dados rotulados de entrada de treinamento envolve definir o número de épocas de treinamento e atribuir valores a cada época. Neste exemplo, escolhemos N, o número de épocas de treinamento, como 10, variando de 0 a 9. Cada época de treinamento representa uma única iteração pelos dados de treinamento. Por exemplo, a primeira época corresponde aos dados rotulados de entrada no passo de tempo 0, a segunda época ao passo de tempo 1 e assim por diante, até a última época no passo de tempo 9. Os inputs neste caso são 1 e 1 e o alvo é 1 + 1 = 2. Ao estruturar os dados de treinamento dessa maneira, estabelecemos uma ordem sequencial para os pares de entrada-rotulados e permitimos que a rede aprenda de cada época de forma iterativa. A inicialização dos dados rotulados de entrada de treinamento com N épocas fornece uma estrutura para que a rede neural refine gradualmente suas previsões e melhore seu desempenho ao longo do processo de treinamento.

4. Propagação direta (cálculo da saída z para a Época N=0)

Durante o processo de propagação direta para a Época N=0, calculamos o valor da saída z. Neste caso, o resultado é z = 1. Considerando a arquitetura da rede neural em que o neurônio de saída computa a soma ponderada dos inputs sem uma função de ativação, podemos substituir os pesos e os valores de entrada fornecidos na equação: z = 0,4 * 1 + 0,6 * 1. Observe que os inputs são configurados de modo que a soma ponderada avalia para 1. Esse valor de saída representa a previsão feita pela rede neural para a entrada fornecida na Época N=0.

5. Cálculo do erro (Época N=0)

No cálculo do erro para a Época N=0, comparamos a saída prevista z, que é 1 neste caso, com o valor alvo, também definido como 2 (1+1). Ao subtrair o valor alvo da saída prevista, determinamos o erro. Nesse cenário, o erro é calculado como 2 – 1 = 1. Esse erro quantifica a discrepância entre a saída prevista e a saída desejada para a entrada fornecida na Época N=0.

6. Otimização dos pesos (Época N=0)

No passo de otimização dos pesos para a Época N=0, atualizamos os pesos da rede neural usando a taxa de aprendizado (LR=0,01), os valores de entrada (y) e o erro calculado na etapa anterior. Especificamente, atualizamos o peso w1 usando a fórmula w1 = w1 + LR * y1 * erro = 0,41 e w2 = w2 + LR * y2 * erro = 0,61.

A taxa de aprendizado (LR) é um hiperparâmetro crucial que controla a magnitude dos ajustes de peso durante o treinamento. Ela determina o tamanho do passo no qual os pesos são atualizados com base no erro calculado. Encontrar a taxa de aprendizado ideal envolve várias abordagens. Um método comum é realizar uma busca em grade ou aleatória em uma faixa de taxas de aprendizado e avaliar o desempenho da rede em um conjunto de validação. Ao treinar com diferentes taxas de aprendizado e observar a acurácia ou o erro de validação, a taxa de aprendizado ideal pode ser determinada. Alternativamente, algoritmos de taxa de aprendizado adaptativos, como Adam ou RMSprop, podem ser usados, os quais ajustam dinamicamente a taxa de aprendizado com base em atualizações de gradiente e histórico de ajuste de pesos. Esses métodos automatizam o processo de encontrar uma taxa de aprendizado ideal sem a necessidade de ajustes manuais extensivos. Encontrar um equilíbrio entre a velocidade de convergência e evitar instabilidade ou convergência lenta é essencial ao determinar a taxa de aprendizado ideal.

7. Retropropagação dos pesos (Época N=0)

No passo de retropropagação dos pesos para a Época N=0, utilizamos os pesos otimizados da época anterior para atualizar a rede na época atual. A retropropagação envolve propagar o erro da camada de saída de volta pela rede, ajustando os pesos camada por camada. Ao levar adiante os pesos otimizados, construímos sobre o progresso feito na época anterior, permitindo que a rede continue aprendendo e melhorando suas previsões. A retropropagação possibilita que a rede refine iterativamente seus valores de pesos, reduzindo os erros e aumentando a precisão à medida que o treinamento avança.

8) Repita:

O processo de treinamento envolve repetir os seguintes passos até que o número de dados de treinamento no conjunto de entrada seja esgotado (N épocas = 10 no nosso caso) ou até que o erro atinja um limite mínimo pré-estabelecido:

Propagação Direta: Os valores de entrada são propagados pela rede, e o valor de saída z é calculado usando os pesos atuais.
Cálculo do Erro: O erro é calculado comparando a saída prevista z com o valor alvo correspondente.
Otimização dos Pesos: Os pesos são atualizados usando a taxa de aprendizado (LR), os valores de entrada (y) e o erro calculado. O valor atualizado do peso é determinado usando as fórmulas w1 = w1 + LR * y1 * erro e w2 = w2 + LR * y2 * erro. Com y1, y2 e o alvo y1 + y2 da linha seguinte dos dados de entrada.
Retropropagação dos Pesos: Os pesos atualizados da época atual são levados para a próxima época. O erro é propagado para trás pela rede, e os pesos são ajustados camada por camada usando o algoritmo de descida do gradiente.

Esse processo é repetido iterativamente para cada época até que o número desejado de épocas seja alcançado ou até que o erro caia abaixo do limite mínimo pré-estabelecido. Ao repetir esses passos, a rede neural ajusta gradualmente seus pesos, minimizando os erros e melhorando suas capacidades preditivas.

9) Teste em lote:

Para avaliar o desempenho da rede neural treinada, prosseguimos com a fase de teste. Isso envolve os seguintes passos:

Inicialização dos dados de entrada de teste: Inicializamos um novo conjunto de dados de entrada para fins de teste. Esses inputs podem ser diferentes dos dados de treinamento e são usados para avaliar quão bem a rede generaliza para exemplos não vistos anteriormente.

Propagação Direta: Os dados de entrada de teste são passados pela rede usando os pesos aprendidos. O valor de saída z é calculado para cada instância de teste.

Cálculo do Erro: O erro é calculado comparando a saída prevista z com o valor alvo correspondente para os dados de teste.

Encerramento do Teste após 6 inputs: Nesse cenário, o processo de teste é concluído após 6 épocas. A rede passou por seis iterações de propagação direta e cálculo do erro. Os pesos foram otimizados anteriormente com base nos dados de treinamento, e o desempenho da rede é avaliado usando os dados de teste.

10) Se necessário, repetir o treinamento com outros dados de entrada

Se necessário, o processo de treinamento pode ser repetido com dados de entrada adicionais ou diferentes. Isso proporciona uma oportunidade de melhorar ainda mais o desempenho e a capacidade de generalização da rede perceptron simples. Ao treinar com uma variedade diversificada de dados de entrada, a rede pode aprender a lidar com diferentes padrões e variações, aprimorando sua capacidade de aprendizado global.

A natureza iterativa do treinamento permite o refinamento contínuo e o ajuste dos parâmetros da rede com base nos novos dados de entrada. Essa adaptabilidade garante que a rede se torne mais robusta e capaz de prever com precisão as saídas em uma ampla variedade de cenários.

Ao repetir o processo de treinamento com diferentes dados de entrada, podemos explorar a capacidade da rede de aprender e generalizar além do conjunto de treinamento inicial. Essa flexibilidade permite que a rede se adapte e melhore seu desempenho em exemplos novos e não vistos, demonstrando o poder do aprendizado supervisionado e a capacidade de aprendizado da rede perceptron linear.

No entanto, se a rede tiver aprendido com sucesso a realizar adições durante o processo de treinamento, isso representa uma conquista notável. Esse feito demonstra o poder do aprendizado supervisionado, em que uma rede perceptron linear sem viés ou funções de ativação pode aproximar operações matemáticas. O fato de a rede ser capaz de realizar adições com precisão demonstra sua capacidade de capturar e generalizar padrões a partir de dados de treinamento rotulados. Essa conquista destaca o potencial dos algoritmos de aprendizado supervisionado na resolução de tarefas complexas e mostra as capacidades das redes perceptron lineares na solução de problemas matemáticos.

Além da tarefa específica de adição, as implicações de um treinamento bem-sucedido se estendem a várias áreas onde operações lineares são necessárias. Desde cálculos financeiros até análise de dados, ter um perceptron capaz de adicionar números com precisão abre possibilidades para automatizar e acelerar processos que dependem de computações numéricas.

Em conclusão, se a rede perceptron do nosso exemplo aprender com sucesso a adicionar números, isso seria um testemunho do poder do aprendizado supervisionado. Isso exemplificaria a capacidade de um perceptron linear, treinado usando uma abordagem baseada no Excel, de aproximar operações matemáticas e destacar suas aplicações potenciais em vários domínios. Ao aproveitar a simplicidade e a versatilidade do Excel, demonstramos como representar dados tabulares, realizar cálculos e ajustar iterativamente os pesos para alcançar a convergência. Essa conquista não apenas reforçaria nossa compreensão de redes neurais, mas também inspiraria uma exploração mais aprofundada do uso de modelos simples para resolver tarefas complexas.

Este trabalho serve como um guia prático para entender o aprendizado supervisionado no contexto de uma rede perceptron. Ao adotar o Excel como plataforma de treinamento, esperamos tornar o conceito de treinamento de redes neurais mais acessível e incentivar uma maior exploração no campo da inteligência artificial.

Somos gratos ao Prof. Sandro Jerônimo de Almeida, da Pontifícia Universidade Católica de Minas Gerais (PUC-MG), por compartilhar seus slides de aula conosco. Este trabalho é inspirado em uma de suas notas de aula: Inteligência Artificial II – Redes Neurais Artificiais.

#AI #RedePerceptronLinear #AprendizadoSupervisionado #RedesNeurais #TabelasExcel #AlgoritmoDeTreinamento #PropagaçãoDireta #Retropropagação #OtimizaçãoDePesos #CálculoDeErro #TaxaDeAprendizado #Generalização #OperaçõesMatemáticas #ReconhecimentoDePadrões #ModelagemPreditiva #CiênciaDeDados #AprendizadoDeMáquina #InteligênciaArtificial #IteraçõesDeTreinamento #Convergência #DesempenhoDoModelo #AnáliseDeDados #AprendizadoAtravésDosDados #PrecisãoDoTreinamento #PrecisãoDosTestes #AproximaçãoDePadrões

Treinando uma Rede Perceptron Linear com uma tabela – Um exemplo de Aprendizado Supervisionado

1. Definindo a arquitetura da rede neural

2. Inicializando pesos aleatórios

3. Inicializando os dados rotulados de entrada

4. Propagação direta (cálculo da saída z para a Época N=0)

5. Cálculo do erro (Época N=0)

6. Otimização dos pesos (Época N=0)

7. Retropropagação dos pesos (Época N=0)

8) Repita:

9) Teste em lote:

10) Se necessário, repetir o treinamento com outros dados de entrada

Like this:

Relacionado

10 AI Ways to Boost Your Income Streams

Like this:

A Deep Dive into the Mind of GPT-3

Like this:

How Content Selection Algorithms on Social Media Led to Political Radicalization

Like this:

O Retorno do Zumbi Filosófico: Inteligência Artificial e o Último Mistério da Mente

Like this:

Carta aos Leitores: Aniversário de Dois Meses – 06/03/2023

Like this:

Celebrando contribuições femininas em STEM e IA no Dia Internacional da Mulher

Like this:

1. Definindo a arquitetura da rede neural

2. Inicializando pesos aleatórios

3. Inicializando os dados rotulados de entrada

4. Propagação direta (cálculo da saída z para a Época N=0)

5. Cálculo do erro (Época N=0)

6. Otimização dos pesos (Época N=0)

7. Retropropagação dos pesos (Época N=0)

8) Repita:

9) Teste em lote:

10) Se necessário, repetir o treinamento com outros dados de entrada

Share this:

Like this:

Relacionado

Similar Posts

Share this:

Like this:

Share this:

Like this:

Share this:

Like this:

Share this:

Like this:

Share this:

Like this:

Share this:

Like this: