Тёмный
No video :(

Text Cleaning / Text Pre-Processing menggunakan Python 

Sarikhin
Подписаться 608
Просмотров 21 тыс.
50% 1

Tahap -Tahap dalam cleaning ini antara lain :
1. Menghilangkan akun / tanda @ disertai dengan nama akun
2. Menghilangkan angka, dan menghilangkan huruf RT disertai merubah ke lowcase dan juga hastag / tanda #
3. Menghilangkan link / http di sertai dengan menghilangkan emoticon
4. Proses stemming menggunakan PySastrawi dan menghilangkan duplikate tweet
Tweet Sebelum Cleaning : drive.google.c...
Tweet hasil Cleaning : drive.google.c...
Script Python untuk Cleaning bisa didapat di : github.com/IKH...
Jangan lupa untuk Subscribe dan Like videonya jika kalian suka, Terima Kasih
video lainnya : • Kesalahan dalam meng-i...

Опубликовано:

 

23 авг 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 61   
@sandrafitri4973
@sandrafitri4973 2 года назад
Sangatt berguna pak. Terimakasih bnyk
@mochhalimifirdausi7894
@mochhalimifirdausi7894 Год назад
makasi bang semoga bermanfaat
@rizkisyafaat4892
@rizkisyafaat4892 2 года назад
ketika kasusnya seperti "makin rame dimari.orang bandung sudah tidak betah di rumah" kondisi ketika tanda titik diapit oleh kata tanpa spasi gimana ya kak
@eyliensyamsyum5165
@eyliensyamsyum5165 2 года назад
terimakasih sir, sangat membantu
@Sarikhin
@Sarikhin 2 года назад
Sama-sama 👍
@Game_Studio-w9p
@Game_Studio-w9p Месяц назад
​@@Sarikhinbang, kalo mau buat kolom yg berisi data tulisan di ubah ke angka itu gimn? Misal: kolom A: "tv samsung smart tv lcd 55 inch" itu mau diubah ke angka 1 miasalnya itu gimn??
@kemalidris6476
@kemalidris6476 2 года назад
maaf pak izin bertanya , jika ada error " expected string or bytes-like object " di bagian menghilangkan akun/tanda @ itu gimana ya? mohon solusinya terimakasih
@Aditprayogo18
@Aditprayogo18 2 года назад
Terima kasih membantu sekali, kalau di dataset saya, resultnya masih ada hasil regex kayak gini xf xf xf xf xad sch xe xc xe xbb xe xbb xe xbb xf xf xa, ini gimana cara ngehilangin nya ya mas ? tak decode ascii juga sama aja.
@exssemsame7469
@exssemsame7469 Год назад
Makasih baang
@affantsany5844
@affantsany5844 Год назад
kalau mengatasi typo kata gimana bang ya? atau singkatan kata kayak "bgt" yg harusnya banget.
@syahrulhanas25
@syahrulhanas25 2 года назад
sangat bermanfaat bang..mau tanya untuk pengunaan stopword d video tersendiri gak bang?
@shasa5646
@shasa5646 3 года назад
last step saya malah muncul angka doang tidak ada tweet, knp ya ?
@Sarikhin
@Sarikhin 3 года назад
Last step yang bagian apa ya gan ?
@alifhiadhiyaherlia2188
@alifhiadhiyaherlia2188 Год назад
mau nanya kak, yng ditahap remove_pattern kan isinya input_txt dan pattern, nah saya ambil dari google play bukan tweet, untuk input _txt nya diganti jadi apa ya?
@destriputriyani8916
@destriputriyani8916 Год назад
Pas tweet_pf = load_data() error itu gimana ya bg?
@nikomangrustini7553
@nikomangrustini7553 Год назад
Cara import data penjualan yg jumlahnya ribuan dalam sebulan itu gmn ya kak? Mau import data dari th 2018-2022 data dari bln januari-desember. Sempet nyoba import data klo trus upload filenya manual bukaannya lama prosesnya ya kak? Kira2 cara nya gmn kak
@abhiramasaputra4899
@abhiramasaputra4899 Год назад
kalo mau di lematisisasi/lematizer gimana ya mas caranya??
@rahmahwulan5136
@rahmahwulan5136 3 года назад
Kalau ketemu kata slang atau singkatan gitu gimana ya? Apa ada library tersendiri atau kita bikin file kamus kata sendiri? Mohon pencerahannya
@lemoniall6553
@lemoniall6553 Год назад
Mas izin bertanya, apakah dalam text processing, stopword bisa kita modif?, Maksudnya ada kata yg kita biarkan. Kalau memang bisa apakah ada referensinya?. Terima kasih.
@chatrinemanurung8483
@chatrinemanurung8483 3 года назад
Misi mas mau nanya. Untuk preprocessing Apk gimana ya
@Sarikhin
@Sarikhin 3 года назад
Maaf sis, bisa di perjelas lagi pertanyaan nya ?
@_SholihatulFitri
@_SholihatulFitri 2 года назад
Kak untuk melakukan proses ini library apa aja ya yang harus di install?
@elevenproject_
@elevenproject_ 3 года назад
di bagian df['tweet_clean'] = df['remove_http'].apply(lambda x: clean_tweets(x)) , module yang digunakan apa ya kak, punya saya eror TypeError: descriptor 'lower' requires a 'str' object but received a 'unicode'
@Sarikhin
@Sarikhin 3 года назад
Coba gunakan encoding utf-8, kalo ngga coba ubah object nya pake builtin function str
@Sarikhin
@Sarikhin 3 года назад
Kalau mau bantuan bisa hubungin saya lewat ig
@elevenproject_
@elevenproject_ 3 года назад
Siap terimakasih
@yogawijaya8349
@yogawijaya8349 3 года назад
ijin bertanya, jdi saya sudah melakukan crawling data di twitter, trs masuk tahap cleaning, tapi di RT(retweet) ko ada b'RT ya itu kenapa ya? trs ngilanginnya gmna ? soalnya pas tahap cleaning retweet jdi mengganggu hasilnya. saya kurang paham mohon penjelasanya kang :)
@Sarikhin
@Sarikhin 3 года назад
Bisa hubungi saya di instagram gan
@Sarikhin
@Sarikhin 3 года назад
Saya pingin liat errornya
@yogawijaya8349
@yogawijaya8349 3 года назад
Siap kang makasih 🙏
@barnesmanurung5090
@barnesmanurung5090 2 года назад
@@Sarikhin Nama ig nya apa mas?
@sofiemutiaafifah9865
@sofiemutiaafifah9865 3 года назад
Cara menghapus enter dan tab dijadiin whitespace gimna yaa
@Sarikhin
@Sarikhin 3 года назад
coba pake split(“ ”) untuk hapus enternya Lebih jelasnya lihat ini stackoverflow.com/questions/40705480/python-pandas-remove-everything-after-a-delimiter-in-a-string
@__xxdrn9125
@__xxdrn9125 2 года назад
link sama emotnya masih ada bangg:(
@norsyafira8450
@norsyafira8450 3 года назад
Hi, kalau guna bahasa english sastrawi itu kena tukar apa yee?
@aldojuliandra6584
@aldojuliandra6584 4 года назад
Angka angka yang file yg sudah di cleaning itu apa? Trus cara ngilanginya gimana
@Sarikhin
@Sarikhin 4 года назад
Angka angka nya biasanya dari tweet hasil crawling dan cara ngilanginnya bisa pake syntax python yang sudah saya sediakan di descripsi
@aldojuliandra6584
@aldojuliandra6584 4 года назад
Bang boleh minta nomor wa saya ada yang mau saya tanya
@Sarikhin
@Sarikhin 4 года назад
Ke IG aja ya di @ikhintech
@adityawelly
@adityawelly 4 года назад
Kalau cara mengubah emoticon menjadi teks gimana ya ka? Contohnya "aku laper :(" berubah jadi "aku laper sedih"
@Sarikhin
@Sarikhin 4 года назад
Kalau itu di syntax python nya yang harus di ubah
@muhammaddeva9793
@muhammaddeva9793 3 года назад
Mas ingin bertanya kenapa pas hapus RT disini tidak terhapus ya ?
@ajenggantika6438
@ajenggantika6438 3 года назад
Sama saya juga ka
@yogawijaya8349
@yogawijaya8349 3 года назад
bang ini tahapan text preprocesingnya, ada stopword, stemming, sm case folding?
@Sarikhin
@Sarikhin 3 года назад
Iya bang
@iqbalkhairuddinseptiana9353
@iqbalkhairuddinseptiana9353 3 года назад
@@Sarikhin kalau casefolding nya itu dibagian mananya ya? yg sy temuin cuma tokenizing, stopword removal, sama stemming.
@tiaraprastiwi8403
@tiaraprastiwi8403 3 года назад
bang sastrawinya kok ngak ke baca ya ? solusinya plis
@zaqycans3804
@zaqycans3804 2 года назад
izin bantu jawab bang, instal dlu sastrawinya kak .., pip install PySastrawi
@daffasetiawan3941
@daffasetiawan3941 3 года назад
mau tanya mas, untuk dataset tweet nya dapatnya gimana ?
@Sarikhin
@Sarikhin 3 года назад
Dari crawling ada di video saya lain nya untuk tutor nya
@qoryandaniprasasti3791
@qoryandaniprasasti3791 3 года назад
ada yang bisa bantu gak ya, waktu remove user eror dengan keterangan : TypeError: expected string or bytes-like object dan kolom baru untuk remove_user ga muncul semoga ada yang bisa kasih solusi terimakasih
@yogawijaya8349
@yogawijaya8349 3 года назад
datanya ubah dulu k string ka
@muhammaddeva9793
@muhammaddeva9793 3 года назад
Errornya sama kaya gini, Ada tips kah biar ga terjadi kaya gini ?
@fitriamelia6849
@fitriamelia6849 3 года назад
@@yogawijaya8349 caranya gimana ya kak? saya juga ada error yang sama
@yogawijaya8349
@yogawijaya8349 3 года назад
@@fitriamelia6849 error nya yg mana?
@marshallkwando381
@marshallkwando381 2 года назад
Sama , ada yang bisa jelasin lebih lanjut kah?
Далее
УГАДАЙ ЕДУ ПО ЭМОДЗИ! #shorts
00:57
Просмотров 130 тыс.
REFLEX CHALLENGE vs FOOTBALL MACHINE 🙈😱
00:24
Просмотров 3,4 млн
Menentukan Text Processing pada Metode TF-IDF
11:14
Просмотров 6 тыс.
Tutorial Preprocessing Text Dengan Google Colab
44:42
Просмотров 2,6 тыс.