Apresentando o Curso
Neste post sobre o curso de atualização Estatística e Otimização para Ciência de Dados e Pesquisa Operacional, falaremos em linhas gerais sobre os temas que estudaremos e as aplicações a que o curso se direciona.
Duas disciplinas fundamentarão o conteúdo do curso: estatística e otimização. A seleção e a apresentação dos temas específicos de estatística e otimização que serão abordados são feitas com duas aplicações em mente: ciência de dados e pesquisa operacional.
Estatística e otimização são duas disciplinas fundamentais em aplicações diversas, muitas vezes em conjunto. Duas das aplicações mais social e economicamente importantes destas disciplinas são, justamente, ciência de dados e pesquisa operacional. É notável que estas aplicações complementam-se, pois a interpretação eficiente dos dados de grandes operações pode levar a ganhos consideráveis, assim como compreender as técnicas de pesquisa operacional pode ser útil ao planejar operações baseadas em análise dos dados.
Com a ampliação da procura no mercado por profissionais com habilidades para ambas as aplicações, notamos que a grande maioria dos profissionais à busca de mais capacitação para atuar em setores que dependam da grande intersecção entre CD e PO se beneficiaria de um curso nos moldes do curso de atualização Estatística e Otimização para Ciência de Dados e Pesquisa Operacional.
1. Fundamentos
1.1. Estatística
A Estatística é a ciência que se dedica à coleta, organização, análise, interpretação e apresentação de dados. Ela permite extrair e compreender informações relevantes dos dados a partir de amostras representativas de populações maiores, assim como avaliar a significância de padrões utilizando técnicas inferenciais.
A visualização e exploração de dados é uma etapa fundamental para extrair as primeiras informações a partir de dados observados. É conhecida como a pedra fundamental da análise de dados, e pode fornecer as primeiras evidências empíricas sobre padrões existentes em conjuntos de dados. A inferência estatística por sua vez, fundamentada na teoria das probabilidades, fornece o ferramental teórico de estimação e testes de hipóteses para avaliar a significância estatística dos resultados amostrais observados.
Os métodos estatísticos aplicados contemplam, por exemplo, testes não-paramétricos e a modelagem estatística e preditiva. Modelos lineares e modelos lineares generalizados, com especial destaque ao modelo de regressão logística, aliados a ferramentas para avaliação da performance dos modelos e análises de diagnóstico, contemplam um importante repertório que serve como base para a modelagem estatística, com aplicação nas mais diversas áreas em que os dados são observados.
1.2. Otimização
Otimização Matemática é um ramo da matemática aplicada que se dedica a aprimorar decisões com base em um objetivo e tendo em mente restrições às quais se sujeitam nossas decisões. Tanto o objetivo como as restrições são modelados matematicamente e isso permite o uso de técnicas matemático-computacionais para a tomada de decisão.
Muitas tecnologias modernas não seriam possíveis sem técnicas de otimização. Além disso, a maioria das operações econômicas de grande porte depende de forma central de técnicas de otimização e diversas aplicações de computação científica demandam métodos de otimização eficientes.
É comum dividirmos o estudo de otimização matemática em otimização contínua e otimização discreta, pois as técnicas numéricas usadas em cada caso são fundamentalmente distintas. No nosso curso, seguiremos essa abordagem, de modo que você sairá com uma boa fundamentação para começar a resolver uma ampla gama de problemas práticos de otimização.
2. Aplicações
2.1. Ciência de Dados
A Ciência de Dados é uma área interdisciplinar que combina metodologias, tecnologias e ferramentas de diversas áreas como a estatística, otimização, matemática, computação e inteligência artificial, para analisar, modelar e interpretar dados gerados nas mais diversas áreas de conhecimento.
Ela se destaca pela sua versatilidade de integrar metodologias teóricas e práticas para solucionar problemas e auxiliar na tomada de decisão em áreas como a engenharia, saúde, indústria, economia, ciências sociais, biologia, educação e tecnologia.
Motivada e alavancada pela enorme quantidade de dados gerados na atualidade, com o avanço da tecnologia e interconectividade das atividades pessoais, a ciência de dados contribui de forma significativa para a formação complementar de profissionais nas mais diversas áreas de conhecimento e para o avanço científico, industrial e empresarial.
2.2. Pesquisa Operacional
A Pesquisa Operacional é uma área interdisciplinar que combina metodologias, tecnologias e ferramentas de diversas áreas como a estatística, otimização, matemática, computação e inteligência artificial, para auxiliar na tomada de decisões em operações de forma a obter destas o melhor desempenho científico, industrial e empresarial.
Se o parágrafo acima pareceu-lhe familiar, não é à toa. A Pesquisa Operacional compartilha muitas ferramentas com a Ciência de Dados. Mais que isso, os beneficiários de boas práticas em Ciência de Dados frequentemente são os mesmos do que os que se beneficiariam de boas práticas em Pesquisa Operacional.
Assim, como a CD, a PO também "se destaca pela sua versatilidade de integrar metodologias teóricas e práticas para solucionar problemas e auxiliar na tomada de decisão em áreas como a engenharia, saúde, indústria, economia, ciências sociais, biologia, educação e tecnologia". Entretanto, no caso da Pesquisa Operacional, muito mais provavelmente estaremos lidando com operações físicas, tais como a entrega de encomendas de e-commerce, a escolha da localização de armazéns, etc.