Me chamo Lucas, formado em Engenharia Mecânica pela USP e atualmente cursando MBA em Data Science e Analytics pela MBA USP ESALQ, além de realizar estudos relacionados à tecnologia na plataforma Alura.
Este repositório tem como objetivo servir de portfólio para apresentar os diferentes códigos criados por mim nas diversas áreas de estudo de meu interesse.
Contato profissional: [email protected]
Clique para expandir a lista de códigos e projetos
Nos projetos abaixo foram realizados estudos sobre os conceitos teóricos de diferentes algoritmos de machine learning, além de suas aplicações práticas utilizando diferentes bibliotecas Python para realizar a criação e treinamento de modelos, avaliar suasas matrizes de confusão resultantes, suas taxas de acerto e erro, entre outros:
Nome | Descrição |
---|---|
Conceitos e teoria sobre machine learning | Neste projeto foram realizados estudos sobre a teoria envolvida em algoritmos de classificação como KNN, Naive-Bayes e árvore de decisão |
Classificação com SKLearn | Neste projeto foram realizados estudos sobre a biblioteca sklearn, alguns de seus classifcadores, e alguns conceitos como baseline e curva de decisão |
Dados com muitas dimensões | Neste projeto foram realizados estudos sobre como trabalhar com dados de muitas dimensões em um modelo de machine learning. |
Clustering aplicado com K-means - recomendando músicas | Neste projeto foram realizados estudos sobre o algoritmo K-means, bem como sua aplicação para agrupar e recomendar músicas. |
Clustering - validando modelos e encontrando padrões de dados | Neste projeto foram realizados estudos sobre clustering, os critérios teóricos para validar um modelo de clusters, a aplicação prática dessa validação e a identificação de padrões em um modelo. |
Validação de Modelos | Neste projeto foram realizados estudos sobre a validação de modelos de aprendizado de máquina e o conceito de cross-validation. |
Otimização de modelos através de hiperparâmetros | Neste projeto foram realizados estudos sobre a otimização de modelos através de hiperparâmetros, overfitting, utilização do grid search CV para a otimização e o conceito de validações cruzadas aninhadas. |
Otimização de modelos através da exploração aleatória | Neste projeto foram realizados estudos sobre a otimização de modelos através da exploração aleatória dos espaços de hiperparâmetros, além de uma solução para situações em que não é possível realizar a validação cruzada. |
Ensemble Learning - Random Forest | Neste código foi treinado um método 'ensemble'. Estes métodos utilizando multiplos algoritmos de aprendizado para obter melhor performance preditiva. No exemplo foi utilizado o Random Forest, que utiliza multiplas árvores de decisão |
Regras de associação | Neste código foi treinado um algoritmo de regras de associação. As regras de associação são utilizadas para descobrir elementos que ocorrem em comum dentro de um determinado conjunto de dados |
Clique para expandir a lista de códigos e projetos
Os códigos abaixo têm como objetivo a importação, manipulação, e/ou análise de bases de dados:
Nome | Descrição |
---|---|
Apache Airflow - Pipeline de dados | Projeto onde foi desenvolvida uma pipeline de dados para execução semanal via Apache Airflow e Python |
Apache Beam - Pipeline de dados | Projeto onde foi desenvolvida uma pipeline de dados onde duas bases de dados grandes foram tratadas utilizando o Apache Beam |
Scraping com Python | Projeto onde foram estudados e aplicados conceitos de Web Scraping utilizando Python |
Regressão Linear | Código onde foi realizada uma regressão logística para estimar valores de consumo de combustível |
Regressão Logística | Código onde foi realizada uma regressão logística para 'prever' quais candidatos seriam eleitos em uma eleição |
Série Temporal e Previsão | Código onde foi analisada uma série temporal de passageiros em voos comerciais, bem como a decomposição da série e a previsão de períodos futuros |
Organizando dados na AWS | Projeto onde foi criado um servidor Ubuntu na AWS, instalado o PostgreSQL e então realizada a criação de bases de dados e importação de dados |
PostgreSQL - Views, sub-queries e funções | Projeto onde foi realizado o estudo dos conceitos de views, sub-queries e funções no PostgreSQL |
PostgreSQL - Introdução | Projeto onde foi realizado o estudo de conceitos introdutórios no PostgreSQL |
Importação e manipulação - top 25 ações | Script para identificar as 25 ações cujas empresas tem os maiores valores de mercado e então a importar a base histórica dessas ações, visando posteriormente a criação de dashboards. |
Manipulação de base de dados - Análise de acesso à Oportunidade | Código onde foi feita a manipulação e análise de uma base de dados contendo informações sobre acesso à oportunidade |
Clique para expandir a lista de códigos e projetos
No que abrange as redes neurais artificiais, é de grande importância entender o funcionamento de seus algoritmos para poder utilizá-los da maneira mais adequada.
Portanto, os códigos abaixo têm o objetivo de compreender o funcionamento dos algoritmos dos diferentes tipos de redes neurais artificiais existentes:
Nome | Descrição |
---|---|
Perceptron 3 Camadas - Momentum | Rede neural perceptron de 3 camadas utilizando momentum para melhorar a velocidade de treinamento |
Perceptron 3 Camadas - Time Delay | Rede neural perceptron de 3 camadas time delay para sistemas que variam no tempo |
Funções de Base Radial | Rede neural de 3 camadas com funções de base radial |
Rede Recorrente de Hopfield | Rede neural recorrente utilizada para memorização |
Rede Auto-Organizável de Konohen | Rede neural auto-organizável de Konohen para classificação |
Redes Neurais na Prática Utilizando Keras | Criando uma rede neural na prática utilizando a biblioteca Keras no Python |
Clique para expandir a lista de códigos e projetos
Nos códigos abaixo estarão representados projetos relacionados à devops, infraestrutura como código, CI/CD, entre outros.
Nome | Descrição |
---|---|
Projeto de Infraestrutura Como Código | Projeto onde foi desenvolvida uma infraestrutura na AWS utilizando Terraform e Ansible |
Projeto de CI e pipelines no Github Actions | Projeto onde foram desenvolvidos workflows no github actions para testar o funcionamento de um código, realizar a compilação do mesmo e criar uma imagem do programa no docker sempre que um commit fosse realizado. |
Projeto de Observabilidade e Monitoramento | Projeto onde foi feita a configuração do actuator, Prometheus e Grafana para observabilidade de uma aplicação de exemplo, além da configuração do Alert Manager |