Тёмный

Introdução ao Pandas (curso Python para Machine Learning - Aula 12) 

Didática Tech
Подписаться 125 тыс.
Просмотров 51 тыс.
50% 1

Nesse vídeo iremos mostrar como usar o pacote Pandas em Python. Esse pacote será muito útil para criar dataframes, abrir arquivos, manipular os dados e posteriormente rodar algoritmos de machine learning.
Resumo dessa aula:
0:16 O que é o pandas (documentação: pandas.pydata....)
0:38 O que é um dataframe
0:58 Importando o pandas como pd (import pandas as pd)
4:33 Transformando um dicionário em um dataframe com o comando pd.DataFrame
6:02 Índices do dataframe
7:50 Criando um objeto do tipo Series com o comando pd.Series
8:45 O que é um vetor Series e sua diferença para um array do Numpy
12:12 Transformando um array numpy em um objeto Series do pandas
13:50 Prova de que um objeto Series é unidimensional
14:12 Qual a utilidade de um objeto Series (é um dataframe de uma coluna só)
O pacote Pandas, sem dúvida, será um dos mais utilizados no estudo de machine learning e ciência de dados, pois ele transforma os dados que estão em seu computador em planilhas fáceis de se manipular. Nas próximas aulas, veremos como é fácil tratar os dados de um dataframe para, posteriormente, aplicar um algoritmo de machine learning nesses dados.
Essa é a aula 12 desse curso. Próxima aula (aula 13): • Introdução ao Pandas (...
Todas as aulas desse curso de Python para machine learning e análise de dados estão organizados nessa página: didatica.tech/...
E também nessa playlist: • Python para Machine Le...
Para mais detalhes sobre o Pandas, leia esse artigo: didatica.tech/...

Опубликовано:

 

3 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 70   
2 года назад
Olá pessoal! Liberamos CERTIFICADO para este curso gratuito. Para solicitar o seu, basta conferir o curso no link abaixo: didatica.tech/curso-de-python-para-machine-learning-e-ciencia-de-dados-gratuito/
@mayal9334
@mayal9334 2 года назад
vou fazer
@MathematikO0
@MathematikO0 5 лет назад
Mano, como pode um conteúdo tão bom assim ser gratuito? Muito obrigado pelos vídeos!
@Joaopedrox10
@Joaopedrox10 5 лет назад
Né isso ,vey. Só podemos agradecer
@paulorogerio3363
@paulorogerio3363 3 года назад
Bom dia! Estou aqui passando humildemente para agradecer a você e toda sua equipe, por liberar essas aulas. estou desempregado, na luta por um emprego e resolvi estudar para tentar uma oportunidade como Cientista de dados e só encontrava cursos pagos e extremamente caros e no momento não tenho condições para pagar um. Que Deus abençoem vocês e assim que eu terminar essas aulas e a de Machie Learning, vou me candidatar a vagas para iniciantes e se Deus quiser eu conseguindo, eu retorno para compartilha esta vitória com vocês. Gratidão!
@lorebas12
@lorebas12 2 года назад
boa sorte mano, espero q dê tudo certo
@claudimilsonnilsonbonfim7620
@claudimilsonnilsonbonfim7620 2 года назад
meus parabéns: Deus abençoa muito voce e sua equipe. Show não tinha visto ninguém explicar assim.
@balbino4
@balbino4 Год назад
Muito obrigado.
@01bit
@01bit 3 года назад
Excelente curso, ótima didática!
@felipemahlow9334
@felipemahlow9334 5 лет назад
O conteúdo do canal é sensacional, muito obrigado, tem me ajudado muito! Só uma ideia, e se pra cada aula, ou conjunto de aulas tivessem alguns exercícios pra ajudar a fixar os conceitos?
@victorhugoovanimarchetti755
@victorhugoovanimarchetti755 4 года назад
Parabéns pelos vídeos, excelente canal!
@arlansantos1500
@arlansantos1500 3 года назад
Aula Top👏
@andersonjorge3015
@andersonjorge3015 4 года назад
Muito bom o curso .
@nicoleorfali
@nicoleorfali 4 года назад
Ótima aula!
@IedoBrito
@IedoBrito 3 года назад
Parabéns pelo conteúdo . Pergunto se você pode pegar uma tabela presente em um sistema web sem ter que importar ela com csv ou Excel... apenas trazer o df e colocar em uma variável... obrigado.
@edneymatheus297
@edneymatheus297 4 года назад
Cara, muito boa sua didática. Parabéns. Tive um pequeno probleminha... quando fui tentar usar a função .Series em um array tive um erro, "Os dados devem ser unidimensionais". Segue o código: import numpy as np array1 = np.array([(2, 6, 9, 10, 8)]) array2 = np.array([(2, 6, 9, 11, 23), (10, 5, 8, 21, 11)]) print(array1) print(array2) objeto2 = pd.Series(array1) print(objeto2) Erro: Exception: Data must be 1-dimensional
@carvalho9846
@carvalho9846 4 года назад
Cara, na linha 2: array1 = np.array([(2, 6, 9, 10, 8)]). Tira esses parênteses mais interno, deixa assim: array1 = np.array([2, 6, 9, 10, 8]). O erro ocorreu pq ao colocar os parênteses tu está dizendo ao python que quer um array de arrays, criando assim, um array com mais de uma dimensão. No entanto, a função series só aceita arrays de apenas 1 dimensão.
@MarcelForsett
@MarcelForsett 3 года назад
Bom dis a Todos, inicialmente quero parabeniza-lo pelo otimo conteudo, estou fazendo Esses mesmos passos no dia de hoje 7 jun 2021. E quando rodo: object2 = pd.Series(array2) print (object2) Result: 0 (6,13,4,0,15) 1 (13,9,7) Inclusive a expressao para array tbm mudou, creio que seja por conta das atualizacoes, entao isso quer dizer que agora o commando Series nao eh mais unidimensional?
@lorebas12
@lorebas12 2 года назад
tbm vi isso agr no meu, adicionaram isso em alguma atualização pelo jeito
@luancarvalho7135
@luancarvalho7135 4 года назад
caso ERRO dataframe = pd.DataFrame.from_dict(alunos, orient='index') dataframe.transpose()
@pedrocutrim1200
@pedrocutrim1200 3 года назад
vc salvou minha vida !
@PedroHenrique-vs1hj
@PedroHenrique-vs1hj 3 года назад
a nossa vida
@erosgkm
@erosgkm 5 месяцев назад
Olá Natanael, gostaria de saber quais formas de contato estão disponíveis para tirar dúvidas referentes ao curso completo que você entrega no Didatica Tech?
5 месяцев назад
didaticatech@gmail.com
@lucascastro6083
@lucascastro6083 3 года назад
muito bom
@mardemes007
@mardemes007 4 года назад
Cara, que didática viu! Tem canal no telegram?
@jpedros3211
@jpedros3211 4 года назад
Se eu crio uma serie dessa forma ele ira printar uma coluna ao lado da outra, isso não seria uma serie bidimensional? series2 = pd.Series([12,2,3,36],[8,63,5,54]) print(serie2) >>> 8 12 63 2 5 3 54 36 dtype: int64
@luccatavares5594
@luccatavares5594 2 года назад
fala pessoal estou tentando rodar o programa aqui na minha maquina mas me mostra esse erro! AttributeError: module 'pandas' has no attribute 'Dataframe' ja tentei mudar o nome do file e mesmo assim nada muda, alguém pode me ajudar por favor. abraco a todos
@vagner_pereira
@vagner_pereira 3 года назад
O pd é padrão ou posso colocar as letras que eu quiser?
@kittysantos8864
@kittysantos8864 3 года назад
as letras que quiser mas a maioria colocar pd por costume já
@vagner_pereira
@vagner_pereira 3 года назад
@@kittysantos8864 Obrigado!
@pijiyx
@pijiyx Год назад
​@@vagner_pereiraé obrigatório o pd
@LofilabLofiHipHop
@LofilabLofiHipHop 3 года назад
Puta merda 4 mil páginas de documentação para uma única biblioteca. 29 - 01 - 21
@relvascaue4869
@relvascaue4869 4 года назад
Estou usando o VS Code.. Até este exercício, deu certo.. Mas esse não está conseguindo importa o Pandas... Alimentei as Extensions com Anacinda, Azure... Mas o pd. DataFrame, não está sendo reconhecido como módulo válido
@caciotillmann59
@caciotillmann59 4 года назад
Comigo deu o mesmo erro, se conseguir resolver posta aqui please!
@relvascaue4869
@relvascaue4869 4 года назад
@@caciotillmann59 eu acho que o módulo não quer carregar.. Vai ter que baixar o jupyter... Pra testar.. Ontem fiquei horas pesquisando documentação, mas não carrega 😭
@caciotillmann59
@caciotillmann59 4 года назад
​@@relvascaue4869 Tenho Jupyter baixado e deu o mesmo erro, enfim consegui resolver fazendo o seguinte, segue -> dataframe = pd.DataFrame(list(alunos.values()), index=alunos.keys()) print(dataframe) #depois pode rodar o código abaixo pra inserir um índice dataframe.reset_index() Agora acho que vai 😉
@relvascaue4869
@relvascaue4869 4 года назад
@@caciotillmann59 vou fazer aqui. Valeu
@relvascaue4869
@relvascaue4869 4 года назад
@@caciotillmann59 eu devo estar fazendo algo errado.. Não foi no VS code
@JamesBomdePapo
@JamesBomdePapo 4 года назад
Ao digitar dataframe = pd.DataFrame(alunos), me apareceu essa mensagem: --------------------------------------------------------------------------- ValueError Traceback (most recent call last) in ----> 1 dataframe = pd.DataFrame(alunos) ~/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py in __init__(self, data, index, columns, dtype, copy) 390 dtype=dtype, copy=copy) 391 elif isinstance(data, dict): --> 392 mgr = init_dict(data, index, columns, dtype=dtype) 393 elif isinstance(data, ma.MaskedArray): 394 import numpy.ma.mrecords as mrecords ~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in init_dict(data, index, columns, dtype) 210 arrays = [data[k] for k in keys] 211 --> 212 return arrays_to_mgr(arrays, data_names, index, columns, dtype=dtype) 213 214 ~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in arrays_to_mgr(arrays, arr_names, index, columns, dtype) 49 # figure out the index, if necessary 50 if index is None: ---> 51 index = extract_index(arrays) 52 else: 53 index = ensure_index(index) ~/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in extract_index(data) 315 lengths = list(set(raw_lengths)) 316 if len(lengths) > 1: --> 317 raise ValueError('arrays must all be same length') 318 319 if have_dicts: ValueError: arrays must all be same length
4 года назад
Provavelmente você colocou algum elemento a mais em uma das listas. Confere se 5.5 você digitou como 5,5
@Brazilianknight9243
@Brazilianknight9243 3 года назад
Porque o meu programa não deu certo? import numpy as np array1 = np.Array([2, 6, 8, 2, 12]) array2 = np.Array([(2, 6, 8, 2, 12), (2, 6, 8, 2, 12)]) print(array1) print(array2)
@lucasalves5014
@lucasalves5014 3 года назад
np.array , não np.Array, cuidado com as maiúsculas e minúsculas
@Brazilianknight9243
@Brazilianknight9243 3 года назад
@@lucasalves5014 há não sabia de detalhe, valeu parceiro 👍
@lucasalves5014
@lucasalves5014 3 года назад
@@Brazilianknight9243 nada, fica atento com essas regrinhas, no começo eu ficava horas procurando erros no código, quando eu via só tinha esquecido de colocar um ; e tals
@Brazilianknight9243
@Brazilianknight9243 3 года назад
@@lucasalves5014 ok, mais porque Serie (maiúsculo), array (minúsculo), describe (minúsculo), e DataFrame (maiúsculo)?
@lucasalves5014
@lucasalves5014 3 года назад
@@Brazilianknight9243 talvez pq os Devs do framework colocaram em Maiúsculo as coisas relacionadas aos dados/tabelas pra diferenciar dos atributos e métodos, mas também tem todo um lance de boas práticas , e etc.
@fernandasantana5924
@fernandasantana5924 4 года назад
Olá professor, poderia me ajudar? Coloco o código e quando aperto run ele diz “ “ “ modulenotfounderror: No module named ‘panda’ “ Segue o código: Import pandas as pd Alunos = {‘Nome’:[‘Caio’, ‘Bruno’, ‘José’, ‘Jacson’], ‘Nota’:[4, 5, 7, 9], ‘Aprovado’:[‘não’, ‘não’, ‘sim’, ‘sim’]} Não dá dando bom :(
@fernandasantana5924
@fernandasantana5924 4 года назад
O pandas nn tava instalado! Instalei e foi obrigada!!!
@kirekadan
@kirekadan 3 года назад
www.udemy.com/course/python-2021-crie-varios-jogos-e-aplicativos-funcionais/?couponCode=31CB252F6B5BCE75010A Curso de python super completo da udemy com certificado udemy e IF. Por apenas 50 reais. Curso em português que emgloba do básico ao avançado, GUI. ciência de dados, banco de dados, gráficos e análises estatísticas. Correr que tá acabando!! È LANÇAMENTO!
@vamosprogramar01
@vamosprogramar01 2 года назад
@@kirekadan letra minúscula no "import"
@vamosprogramar01
@vamosprogramar01 2 года назад
letra minúscula no "import"
@97466922
@97466922 4 года назад
o meu pandas só dá erro mano
@pijiyx
@pijiyx Год назад
Talvez por não tem instalado, ou por estar usando algum caractere maiusculo na função
@felipedacarify
@felipedacarify 3 года назад
oi, boa tarde, meu nome ê felipe, gostaria de dizer que seus videos sao excelentes,agradeço se vocês puderem me ajudar com uma questão. Estou com duvida de como conciliar a biblioteca Panda com a Selenium. Gostaria de com a automacao phyton, acessar dados de uma planilha excel e ir anexando os dados em uma pagina especifica da internet. meu email é felipedacar@gmail.com. muito obrigado.
@pijiyx
@pijiyx Год назад
KKKKKKKKKKKKKKKKKK
@marcondesmelo7181
@marcondesmelo7181 2 года назад
O professor tem uma didática boa, mas poderia ser menos repetitivo. É uma vídeo aula, se o aluno não entender, pode voltar o vídeo infinitas vezes.
@eletronicaautomotiva2956
@eletronicaautomotiva2956 5 лет назад
olá professor pq a ordem ficou invertida, seria nome primeiro, depois nota , dai aprovado, o meu esta aprovado, nome e depois nota, como resolvo por gentileza? import pandas as pd alunos={'nome':['Marcela','Joana','Vagner','Maria'], 'nota':[4,7,8,4], 'aprovado':['nao','sim','sim','nao']} dataframe=pd.DataFrame(alunos) print(dataframe) aprovado nome nota 0 nao Marcela 4 1 sim Joana 7 2 sim Vagner 8 3 nao Maria 4
5 лет назад
Oi, os dicionários Python não salvam a ordem em que os conjuntos de chave:valor foram criados. Por isso que o dataframe criado a partir de um dicionário Python pode ficar com os dados em outra ordem. Se você quer criar um dicionário preservando a ordem, existe uma função chamada OrderedDict dentro do pacote collections que faz isso. Abraços
@eletronicaautomotiva2956
@eletronicaautomotiva2956 5 лет назад
@ Valeu, vou pesquisar, obrigador pela dica, curso muito bom.
@qualquercoisaslaaaaa
@qualquercoisaslaaaaa Год назад
Caro amigo, permita-me corrigir e melhorar a formalidade do seu texto: Sem intenção de subestimar o curso, acredito que é necessário revisar o modelo de ensino. É importante que os alunos compreendam que não é possível aprender conceitos avançados da programação sem antes conhecer a linguagem e as tecnologias envolvidas. Embora não fale por todos, acredito que na maioria dos casos, isso resultará apenas em alunos confusos que se perguntarão "onde caralhos vou usar isso), o que pode ser uma perda de tempo, recursos e na maioria dos casos acabando com futuros programadors. Antes de avançar em estudos mais complexos, é fundamental aprender a programação propriamente dita e como aplicá-la na criação de códigos funcionais de verdade. Somente assim será possível aprender conceitos mais avançados com maior eficiência. Embora um curso gratuito de Machine Learning possa ser sempre útil, acredito que sua abordagem não é a mais correta.
Далее
ЭТО НАСТОЯЩАЯ МАГИЯ😬😬😬
00:19
Writing Code That Runs FAST on a GPU
15:32
Просмотров 560 тыс.
Seu primeiro código de Machine Learning com Python!
28:57
Solving real world data science tasks with Python Pandas!
1:26:07
ЭТО НАСТОЯЩАЯ МАГИЯ😬😬😬
00:19