Elaboração de modelos preditivos via machine learning para medição não invasiva de propriedades de resíduo de lúpulo durante a secagem

Autor: Victor Rodrigues Botelho (Currículo Lattes)

Resumo

A secagem é um dos métodos mais antigos utilizados para proporcionar melhorias, capazes de fornecer características desejáveis aos alimentos. Este processo está diretamente ligado à qualidade dos alimentos e, consequentemente, ao seu valor de mercado. Entretanto, um grande desafio inerente à secagem refere-se à dificuldade de obter informações de monitoramento, devido a fatores como custos elevados de medição, impossibilidade de sensoriamento invasivo e condições extremas, o que faz com que, em geral, propriedades físico-químicas, cinéticas, sensoriais e bioquímicas do alimento sejam verificadas apenas no início e no fim do processo, ou seja, sem acompanhamento ou predição. Com o advento da Agroindústria 4.0, conceitos inovadores abriram caminhos para a digitalização e melhoria de processos clássicos. Dentre esses conceitos estão as técnicas de aprendizado de máquina (machine learning), cuja teoria tem como pilares a relação entre modelagem fenomenológica e análises estatísticas multivariadas. A modelagem fenomenológica pode ser entendida pelas instâncias em que novas informações são adquiridas por meios práticos ou experienciais, explorando tendências ou comportamentos nos dados disponíveis, considerando incertezas nas variáveis amostrais e oferecendo uma visão dos processos do sistema em estudo. As análises estatísticas multivariadas avaliam grandes conjuntos de dados com múltiplas variáveis, medidas simultaneamente em uma mesma amostra, e podem estar correlacionadas, visando interpretar a influência individual destas. Portanto, através de algoritmos computacionais inerentes ao machine learning, é possível criar modelos utilizáveis a partir de correlações empíricas, aliando métodos tradicionais com inteligência artificial. Assim, primeiramente foram criados dois dispositivos: um externo ao secador, com intuito de coletar imagens da balança, e outro interno, para captar imagens das amostras, enviando-as para uma rede própria. Na etapa experimental foram obtidas variáveis de operação da secagem de resíduo de lúpulo, como temperatura, velocidade, umidade do ar, umidade da pasta e espessura da amostra na bandeja, e, paralelamente, a obtenção também de variáveis colorimétricas e massas, a cada minuto, linkando com análises de propriedades inerentes aos -ácidos e -ácidos que se deram via método destrutivo. A seguir, foram correlacionadas as variáveis operacionais, as colorimétricas e as oriundas das análises destrutivas, através de técnicas de data pruning e data mining para organizar, filtrar e extrair padrões de dados úteis, confirmando que as diferenças entre os clusters foram estatisticamente significativas para todos os canais de cor no padrão RGB. A última etapa consistiu em realizar a modelagem fenomenológica, suportada em nove diferentes algoritmos de machine learning, com objetivo de predizer alfa-ácidos e beta-ácidos, sem que houvesse necessidade de novas medições destrutivas. Após aplicação de métricas de validação, o algoritmo Random Forest foi o que mostrou melhor desempenho, com excelente capacidade preditiva, proporcionando a obtenção das propriedades em questão de forma rápida, adaptativa, e sem a necessidade de métodos destrutivos e otimizando o processo de secagem de resíduo de lúpulo, pois o monitoramento permite antever questões que remetem à segurança e qualidade, o que, consequentemente, apresenta grande potencial econômico, em um mercado de extrema relevância, mas também complexo pela dinâmica volátil.

TEXTO COMPLETO

Palavras-chave:Aprendizado computacionalIndústria 4.0Secagem de AlimentosLúpuloResíduosAgroindústria 4.0Resíduo CervejeiroModelagem fenomelógicaEstatística multivariadaModelo preditivo