Тёмный

Manipulando colunas em um dataframe pandas (Python para Machine Learning - Aula 16) 

Didática Tech
Подписаться 125 тыс.
Просмотров 90 тыс.
50% 1

Aprenda comandos úteis para manipular colunas de tabelas (dataframes pandas) nesse vídeo. Veremos como mudar os nomes das colunas (variáveis da tabela), como atribuir dados de uma coluna para outra variável, como contabilizar os valores únicos dentro de uma coluna (comando value_counts()), entre outros.
Essa é a aula 16 desse curso. Próxima aula (aula 17): • Como excluir uma colun...
Todas as aulas desse curso de Python para machine learning e análise de dados estão organizados nessa página: bit.ly/pythonp...
E também nessa playlist: • Python para Machine Le...

Опубликовано:

 

3 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 73   
2 года назад
Olá pessoal! Liberamos CERTIFICADO para este curso gratuito. Para solicitar o seu, basta conferir o curso no link abaixo: didatica.tech/curso-de-python-para-machine-learning-e-ciencia-de-dados-gratuito/
@lukasveiga4577
@lukasveiga4577 3 года назад
O inplace não é para "ocultar" o resultado da função rename, mas para escolher se a alteração será gravada no dataframe original. O default da função é inplace=False, caso não seja alterado para True você pode armazenar as alterações em uma nova variável.
@hallysonnobres1520
@hallysonnobres1520 3 года назад
Ótima explicação, percebi essa diferença fazendo o rename. Ao dar o comando "rename" sem o "inplace = True", quando eu rodava "dados.head()" ainda estava em inglês, após colocar o "inplace = True" e dar um "dados.head()", o resultado estava em português. Não tinha entendido o motivo mas agr ficou claro cm sua explicação, muito obrigado :)
@adrielzaum
@adrielzaum 4 года назад
Apenas um detalhe ao qual temos que nos atentar: Existem nomes repitidos na lista porque um atleta pode competir por mais de uma modalidade, então seu nome aparece repetidas vezes, e isso significa que usar o comando value_counts() na coluna 'sex' não garante a amostragem de quantos atletas participaram e sim a amostragem em relação a todas as modalidades e não ao atleta como indivíduo.
@Jaimestars
@Jaimestars 2 года назад
Qual seria o comando para conseguir então?
@devbresilien6169
@devbresilien6169 2 года назад
Ótima aula! Como faz para reorganizar a coluna, deslocando a colunaA para ficar do lado da colunaD, por exemplo?
@informaticateen
@informaticateen 3 года назад
Tudo bem! Parabéns pelo canal!
@izapetite
@izapetite 3 года назад
ótima didática
@gersonchadijunior7499
@gersonchadijunior7499 3 года назад
No caso do .value_count(), de for desejado fazer plotagem de gráfico, sem cdúvida, o mais interessante é usar groupby
@irvainemacedo2892
@irvainemacedo2892 3 года назад
Obrigado amigão!
Год назад
Ótima aula. Deixa eu tirar uma dúvida, Tenho 8 lista com 35 valores cada uma. Como faço para importar cada uma dessas listas para uma planilha xlsx , distribuindo esses valores em 5 colunas e 7 linhas, e posteriormente, salvando esse arquivo. Valeu!
@patrickrattes
@patrickrattes 3 года назад
Inplace é para gravar as alterações.
@thiagodias15
@thiagodias15 Год назад
Para retornar mais de 1coluna, digamos 4, usamos a notação dados[['coluna_1', 'coluna_2', 'coluna_3', 'coluna_4']]? Com colchetes duplos? Neste caso o tipo dele será um dataframe
@VanessaLimaSantos95
@VanessaLimaSantos95 2 года назад
TOP TOP TOP 👏💖
@matheusfilipemartins8309
@matheusfilipemartins8309 4 года назад
No Colab; from google.colab import files uploaded = files.upload()
@iamlauriano1962
@iamlauriano1962 4 года назад
verdade, uso o colab, usei pouco o jupiter .
@raquelpereira3733
@raquelpereira3733 2 года назад
Muito bom! Uma dúvida, eu consigo multiplicar mais de uma coluna de uma vez? Por exemplo : teste['coluna 1', 'coluna 2'] =teste['coluna 1', 'coluna 2']*dados['coluna'] Esse dados seria outro dataframe
@mybiblebrasil4308
@mybiblebrasil4308 4 года назад
Gostei muito da aula. A unica dúvida que fiquei foi como gravar as substituições feitas no arquivo csv?
@andrevictorxavierpires
@andrevictorxavierpires 4 года назад
Dataframe1.to_csv('nome do arquivo')
@estudantedoscortes
@estudantedoscortes 2 года назад
como ficaria caso eu quisesse por exemplo "Comparar 2 colunas, caso seja Falso (Não seja igual) retornar o valor da célula que não é igual" como é feito isso?
@aureamarjosegarciarocha1322
@aureamarjosegarciarocha1322 3 года назад
tem alguma função para diminuir a quantidade de casas decimais depois da função describe()?
@aureamarjosegarciarocha1322
@aureamarjosegarciarocha1322 3 года назад
Parabéns pelas aulas! tenho uma duvida, depois de usar as função - ex.: dados['City'].value_counts(), como posso usar o retorno desses valores para fazer comparações?
@klaussantos4712
@klaussantos4712 4 года назад
E se eu quiser trocar o nome nas linhas, por exemplo: onde tem 'Gold' da coluna Medal colocar 'Ouro', 'Silver' trocar para 'Prata' ??
@Vanderson818
@Vanderson818 3 года назад
Tem várias formas de se fazer isso. Acredito que a mais simples seja com "replace". dados.apply(lambda x: x.replace('Golden', 'Ouro'))
@andonythespinoza7991
@andonythespinoza7991 2 года назад
Não sei se serei respondido. Mas, se eu escolher certas columnas, e preciso apagar o resto, como eu faria?, teria que usar o "dados.drop" em cada columna?. Vou resaltar que são 101 columnas, e só preciso de 4 kkk.
@informaticateen
@informaticateen 3 года назад
Estou usando um dataframes com muitas linhas... consigo transferir as definições das colunas, nomes e tal... para a parte inferior do df? Pois não consigo visualizar quando ele roda, diante da quantidade de linhas... desde já obrigado
@leonardomelo5776
@leonardomelo5776 2 года назад
Tem como transformar linha em head?
@gabrielsantos-mo2nu
@gabrielsantos-mo2nu Год назад
que?
@azizconsultoria
@azizconsultoria 3 года назад
olá, não quero fazer nenhuma malandragem, mas preciso descobrir o email de uma pessoa que está num site, tem como usar esse metodo para entrar no banco de dados? teria um outro video especifico? obrigado
@iamlauriano1962
@iamlauriano1962 4 года назад
parabéns pelo vídeo, as modificações no dataset são sequenciais, ou seja, a mudanca 2 vai sobrepor a mudança 1 .. ? e uma outra dúvida, essas alterações realizadas no dataset atraves do pandas são atualizadas no arquivo local ? grato
@andrevictorxavierpires
@andrevictorxavierpires 4 года назад
Pra modifcar o arquivo use Dataframe1.to_csv('nome do arquivo')
@ygorholowka2211
@ygorholowka2211 3 года назад
Olá, como eu separo um conjunto de dados específico de uma coluna usando como condição o valor em outra coluna ?
@felipepantoja366
@felipepantoja366 2 года назад
Em vez de colocar o NOME da coluna, teria como coloar a posicao dela ? tipo [0,1] ?
@gabrielsantos-mo2nu
@gabrielsantos-mo2nu Год назад
não
@pijiyx
@pijiyx Год назад
​@@gabrielsantos-mo2nusim
@acoliveira91
@acoliveira91 4 года назад
Gostaria de saber se é possível usar o count.values com duas variáveis. Exemplo: Quantas medalhas de ouro ganharam por cidade? Também como contar quantos atletas únicos ganharam medalha de ouro. Se tiver isso em outra aula, poderia me indicar? Suas aulas são Incríveis!!! Muito Obrigada!!!
@leonardovasconcelos349
@leonardovasconcelos349 3 года назад
Oi, acho que não precisa mais, mas tá aqui: df = df.drop_duplicates(subset="city")
@Rafael-Neris
@Rafael-Neris 3 года назад
Ola, todos os meus nomes das colunas ficaram como Unnamed, como posso alterar isso?
@dwj6506
@dwj6506 2 года назад
Existe a possibilidade de modificar os valores de uma coluna formada por uma string 0,08k para 0,08*1000, ou seja 8?
@gabrielsantos-mo2nu
@gabrielsantos-mo2nu Год назад
sim mano, se toda a coluna estiver nessa contagem é só multiplicar toda ela por 100 para conseguir um inteiro, mas o python ainda deve ler como float e colocar 8.0
@lucianotome8627
@lucianotome8627 3 года назад
boa tarde. ao tentar dar o comando value_counts aparece o erro: list indices must be integers or slices, not str. tentei fazer a mudança de str para int. mas sem sucesso.
@pedroaocdev9402
@pedroaocdev9402 3 года назад
o meu nao mudou nada nessa parte de renomar
@arthuranselmo7144
@arthuranselmo7144 4 года назад
Parabens pela série de vídeos. Eu tenho uma dúvida. Estou com uma base de dados que é relativa aos inscritos do enem de 2016. Ela têm muitas linhas, mas tbm têm muitas colunas, quando tento ver quais são as colunas (usando head) o próprio Jupyter omite algumas (substituindo-as por reticencias). O que fazer para ver todas?
4 года назад
pd.set_option('display.max_columns', numero_colunas_desejado)
@lorebas12
@lorebas12 2 года назад
alguem consegue me ajudar? coloquei o seguinte codigo: import pandas as pd dados = pd.read_csv('C:/Users/elizeu/Desktop/Curso MachineLearning/arquivo2.csv') dados.rename(columns={'Name':'Nome'}) print(dados) Estou usando o vs code, e na aba de "saída", que é onde vejo os resultados dos códigos, não está aparecendo a coluna "Name", está tudo muito colado, não aparece nem duas colunas
@cleciopedra
@cleciopedra 3 года назад
Boa tarde, como faço para ver duas colunas no resultado ?
@gabrielzonatto1386
@gabrielzonatto1386 3 года назад
Descobriu?
@lucaskpinheiro5998
@lucaskpinheiro5998 2 года назад
Usa .loc[ : , [ 'NOME DA COLUNA1' , 'NOME DA COLUNA2' ] ] Onde está os dois pontos vazios é para as linhas(não interfere sobre as colunas), neste caso está chamando todas as linhas daquelas colunas
@nettoork5216
@nettoork5216 5 лет назад
Caramba, os velhinhos eram loucos kkkkkk file.loc[file['Age'] >= 96]
@akronotecinfo1036
@akronotecinfo1036 4 года назад
kkkkkkkkkkkkkkkkkkkkkkkkkkk também testei isso kkkkkkk
@akronotecinfo1036
@akronotecinfo1036 4 года назад
tu comentou isso a um mês atrás, prosseguiu com os estudos? se sim, pode dar dicas de por onde anda estudando?
@nettoork5216
@nettoork5216 4 года назад
@@akronotecinfo1036 Ah, infelizmente não, estava ocupado com estudos (ainda estou no 2º ano do ensino médio, aí estava nessa de Enem e etc), mas pretendo no futuro assistir à playlist nova do canal sobre TensorFlow, parece ser interessante. De resto, só pesquisando mesmo... Estou na mesma que você kkkkk, bons estudos!
@akronotecinfo1036
@akronotecinfo1036 4 года назад
@@nettoork5216 É no ensino médio que percebemos o quão escasso é o nosso tempo, né? sdhayudadsy Enfim, boa sorte nos estudos para você também!
@francisko369
@francisko369 4 года назад
Gostaria de saber como juntar dataframes, ou seja, no video ele separou parte da tabela, para criar una nova; supondo que foi dividida em várias partes, mas depois seria necessário juntar de novo, como seria?
4 года назад
Procura pela função concat do pandas
@cristianoliveira426
@cristianoliveira426 3 года назад
pq quando eu coloco : dados['Height'] aparecem só as primeiras cinco e as últimas cinco linhas e não todas as mais de 200 mil linhas? 0 China 1 China 2 Denmark 3 Denmark/Sweden 4 Netherlands ... 271111 Poland-1 271112 Poland 271113 Poland 271114 Poland 271115 Poland Name: País, Length: 271116, dtype: object
3 года назад
Usa o código: pd.set_option('display.max_rows', None)
@marcostadeudosreis
@marcostadeudosreis 5 лет назад
Como faço para juntar valores de duas ou mais colunas? não é somar nem multiplicar. Por exemplo : valor 1, valor 2, valor 3 em uma unica coluna ficaria 123
5 лет назад
Oi Marcos, nesse caso você pode somar dataframes usando a função map(). Esse artigo tem bons exemplos: datatofish.com/concatenate-values-python/
@marcostadeudosreis
@marcostadeudosreis 5 лет назад
Obrigado pelo dica foi muito util
@jairojsf
@jairojsf 5 лет назад
Esta dica também me ajudou muito @
@netoalves9211
@netoalves9211 3 года назад
Se o meu Data frame tiver muitas colunas, como faço para mostrar todas?
3 года назад
Colunas: pd.set_option('display.max_columns', None) Linhas: pd.set_option('display.max_rows', None)
@hakku001
@hakku001 2 года назад
Ta e como eu faria pra pegar apenas 1 nome de uma coluna, literalmente so o nome Joao. Pq eu quero atribuir esse João a uma variável, então não preciso do resto
@joaomarcosn.dasilva7069
@joaomarcosn.dasilva7069 4 года назад
Boa noite. Eu puxei um arquivo .csv pra fazer análises usando o pandas, porém o arquivo contem uma única coluna, porém essa única coluna é composta por outas 7 mais que seriam úteis para análises. Qual comando eu uso pra converter. tentei de tudo: set_index e atá agora não consegui!
4 года назад
Sem ver o arquivo fica difícil, mas você pode tentar o comando split(): df['coluna'].str.split(expand=True)
@cassianofb5730
@cassianofb5730 4 года назад
Talvez de para usar o comando texto para colunas do Excel, busca no youtube ou no google que é razoavelmente fácil de usar, espero que te ajude.
@BetoWagner
@BetoWagner 3 года назад
Nan = not a number
@LofilabLofiHipHop
@LofilabLofiHipHop 3 года назад
06-02-21
@JorgeLuiz-ui1hj
@JorgeLuiz-ui1hj 3 года назад
Ja limpei uma tabela em Excel em duas colunas, uma de custo e uma de venda, oque posso fazer para saber em quais linhas da coluna custo o valor esta maior doque as linhas da venda?
Далее
У КОТЯТ ОТКРЫЛИСЬ ГЛАЗКИ#cat
00:26
When Goalkeepers Get Bored 🤯 #3
00:27
Просмотров 2,4 млн
Como Juntar Informação de 2 Tabelas em Python
27:05
DATA SCIENCE - EXCLUINDO LINHAS E COLUNAS COM PANDAS
6:31
Como iterar pelas linhas no DataFrame do Pandas
7:48
Como fazer PROCV - e outros Joins - no Python
13:25
Просмотров 8 тыс.
У КОТЯТ ОТКРЫЛИСЬ ГЛАЗКИ#cat
00:26