Awesome Open Source
Awesome Open Source

Cincia de Dados

CC BY-SA 4.0 Open in Visual Studio Code Hits

Disciplina dos Cursos de Cincias da Computao e afins da UNINOVE.

backprop

Contedo

  • Python e Programao Orientada Objetos
  • lgebra Linear com NumPy
  • Anlise de Dados com pandas
  • Visualizao de Dados com pandas, matplotlib e seaborn
  • Machine Learning com Scikit-Learn
  • Redes Neurais com TensorFlow, Keras e PyTorch

Professores

Como usar esse contedo?

Este contedo possui licena livre para uso (CC BY-SA). Caso queira utilizar o contedo para um curso ou estudos, por favor colabore nesse repositrio quaisquer aprimoraes que foram realizadas.

Para configurar um ambiente local:

  1. Clone o repositrio do GitHub: git clone https://github.com/storopoli/ciencia-de-dados.git
  2. Acesse o diretrio: cd ciencia-de-dados
  3. Instale as bibliotecas necessrias: pip install -r .binder/requirements.txt ou conda env create -f .binder/environment.yml

Notebooks

  • Aula Especial - Curso Rpido de Python para Programadores Binder Open In Colab
  • Aula 0 - Jupyter Notebook Binder Open In Colab
  • Aula 1 - Operadores aritmticos, relacionais e lgicos Binder Open In Colab
  • Aula 2 - Desvio Condicional (IF) Binder Open In Colab
  • Aula 3 - Estruturas de Repetio (FOR e WHILE) Binder Open In Colab
  • Aula 4 - Estruturas de Dados (list e dict) Binder Open In Colab
  • Aula 5 - Funes Binder Open In Colab
  • Aula 5a - Classes e mtodos Binder Open In Colab
  • Aula 6 - NumPy e Algebra Linear Binder Open In Colab
  • Aula 7 - pandas Binder Open In Colab
  • Aula 8 - pandas estatstica Binder Open In Colab
  • Aula 9 - Grficos com matplotlib e pandas Binder Open In Colab
  • Aula 10 - Machine Learning com Scikit-Learn Binder Open In Colab
  • Aula 11 - Regresso Linear com Scikit-Learn Binder Open In Colab
  • Aula 12 - Regresso Logstica com Scikit-Learn Binder Open In Colab
  • Aula 13 - Support Vector Machines com Scikit-Learn Binder Open In Colab
  • Aula 14 - rvores de Deciso com Scikit-Learn Binder Open In Colab
  • Aula 15 - Florestas Aleatrias com Scikit-Learn Binder Open In Colab
  • Aula 16 - Anlise de Componentes Principais (PCA) com Scikit-Learn Binder Open In Colab
  • Aula 17 - Anlise de Agrupamentos (Clusterizao) com Scikit-Learn Binder Open In Colab
  • Aula 18a - Redes Neurais com TensorFlow e Keras Binder Open In Colab
  • Aula 18b - Redes Neurais com PyTorch Binder Open In Colab

Cheat Sheets

Algumas cheat sheets selecionadas para os temas e ferramentas da disciplina:

Proposta de Avaliao da Disciplina

A avaliao pode ser realizada por meio de trabalho final no qual cada grupo de alunos (3 a 6 integrantes) devem entregar um notebook contendo os seguintes tarefas:

  1. Leitura de dados com pandas
  2. Manipulao e limpeza de dados com pandas
  3. Descritivo e explorao de dados com pandas (groupbys)
  4. Figuras que mostrem insights sobre os dados com pandas e matplotlib
  5. Quebrar os dados em conjunto de treino e conjunto de teste
  6. Treinar um estimador do scikit-learn de aprendizagem supervisionada (regressor ou classificador) no conjunto de treino
  7. Verificar o desempenho do estimador do scikit-learn no conjunto de teste

A entrega pode ser via e-mail, mas extremamente incentivado para que os alunos criem um repositrio no GitHub aberto com um README.md bem escrito que explica o projeto. Isto pode j ser um incentivo para os alunos criarem os seus portfolio de projetos de cincias de dados no GitHub, algo que impulsionaria bastante a carreira deles.

A correo dos trabalhos dever levar em conta o tamanho dos grupos. Grupos pequenos tm maior tolerncia de erros e inconsistncias do que grupos com um maior nmero de integrantes.

Como citar esse contedo

Para citar o contedo use:

Storopoli & Souza (2020). Cincia de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch. Retrieved from https://storopoli.io/ciencia-de-dados

Ou em formato BibTeX para LaTeX:

@misc{storopolisouza2020cienciadedados,
  author = {Storopoli, Jose and Souza, Edson Melo de},
  title = {Cincia de Dados com Python: pandas, matplotlib, Scikit-Learn, TensorFlow e PyTorch},
  url = {https://storopoli.io/ciencia-de-dados},
  year = {2020}
}

Trabalhos Finais de Destaque

Licena

Este obra est licenciado com uma Licena Creative Commons Atribuio-CompartilhaIgual 4.0 Internacional (CC BY-SA 4.0).

CC BY-SA 4.0


Get A Weekly Email With Trending Projects For These Topics
No Spam. Unsubscribe easily at any time.
Python (1,143,903
Jupyter Notebook (242,165
Machine Learning (31,776
Deep Learning (23,747
Tensorflow (12,804
Pytorch (11,619
Data Science (9,208
Pandas (3,944
Matplotlib (2,249
Scikit Learn (1,993
Ciencia De Dados (41
Aprendizagem De Maquina (3
Related Projects