Pa, terima kasih sudah menerangkan sebening kristal buat kami yang masih awam di Data Mining. Terus berkarya Pak Romi, dan biar karier bapak diberkati dan hikmat bertambah-tambah buat Bapak. Hormat.. Janta, dari Ambon.
Pak Romi, orang sibuk yang selalu bisa menyediakan waktu untuk membalas chat :) jaman masih jadi mahasiswa saya pernah chatting via FB dengan Pak Romi mengenai solusi skripsi saya. thanks Pak Romi
Kren... Terima kasih Banyak Pak Prof, Slama di kampuz saya tdk pernah tatap muka dengan Bpk, saya di Udinus Ang/2018 pak.... Alhamdulillah dapt di Kuliah di Youtub begini.. thank Pak...
diulang2 saja mas, saya yakin bisa ... materi yg sama saya pakai utk ngajar staff brainmatics yg kebanyakan lulusan sma/smk ... juga ada yg jurusan smk nya accounting, pemasaran ... masih bisa terikuti hehehe
oh iya pak maaf ,saya berharap juga bisa ada playlist yang membahas lebih khusus dan bahkan dari dasar nya. soalnya masih kurang referensi nya masalah seputar pendalaman data mining sperti ini pak. semoga bapak di berikan kesehatan juga pak. terimaksih banyak
Bismillah, semoga ilmu 3 jam ini bisa terserap dg baik... ud semester 3 tapi konsep blm mateng hasilnya judul proposal jg masih samar2.. semoga setelah nontonin series dari Pak Romi dapat pencerahan... amiin
terimikasih prof @romi sangat dimudahkan dengan materinya,,stap by stap, perlu belajar lagi untuk perhitungan manual apa lagi saya yang background Sistem Informasi agak kesulitan membaca simbol-simbol matematika tertuma mencari tingkat error menggunakan RMSE,,,,😀
keren banget dok.... makasih banyak, semoga tambah barokah < saya dosen bidang rekam medis dan informasi kesehatan,, ini akan sangat berguna buat kami, sayangnya data kesehatan yang tersedia di fasilitas kesehatan masih belum terisi dengan lengkap, sehingga kita kesulitan untuk mendapatkan dataset yang valid, bertanya dok : kalo dataset publik untuk ilmu kesehatan / klinis adakah ? bisa dicari dimana ya?
Daging semua konten pak Romi ini. Sayangnya sudah terlambat nontonnya, sebulan setelah ambil matkul langsung pilih topik text mining untuk presentasi, dll karena "menarik dan aplikatif". Alhasil tiap hari risau terus haha
Assalamualaikum pak romi, terima kasih atas ilmu yg bapak berikan pasa video2 bapak. Saya ingin menanyakan berkaitan dengan RapidMiner ini, bapak sebelumnya pernah menyampaikam di RM bahwa untuk PhD project kita bisa melakukan Improve Method. Apakau saya bisa melakukan improve method untuk project PhD menggunakan RapidMiner juga atau menggunakan Coding sendiri / perhitungan manual lainnya ?? Mohon pencerahannya pak dan terima kasih.
Bisa ... bisa pakai python, nanti pakai operator execute python, atau cara lain buat ekstensi rapidminer saja, method improvement letakkan di sana ... download manualnya dari rapidminer how to extend ... pakai knime juga bisa masukin coding ....
@@RomiSatriaWahono alhamdulillah terima kasih pencerahannya pak romi. Klo bisa tutorial untuk masalah ini bisa sharing juga pak karna untuk hal seperti ini msh sedikit referensi yg bisa saya dapatkan pak.. Terima kasih banyak pak romi, sehat selalu 😁
Terimakasih atas penjelasanya pak romi...sehat selalau Mohon izin bertanya pak romi saya dari aceh sedang menempuh studi pasca..kebetulan sedang melakukan penelitian pak romi.. Rencana saya mau mengclasifikasi data pak tapi hasilnya mau saya visualkan ke ArcGis bisa ngga pak...karna memang informasinya lokasi wilayahnya di perlukan pak...mohon jawabannya pak klo bisa mohon di arahkan pak romi...
saranku, khatamkan seluruh video di playlist data mining, ulang2, praktekkan dan ulang lagi.... lanjut mulai lakukan proses crisp-dm utk masalah yg mau dipecahkan dg data science, biar clear dulu konteks masalah dan pemecahannya ... aku lihat mas fahru masalah belum paham fundamental masalah apa yg maundipecahkan dengan data mining ... monggo kalau sudah mulai paham, datang lagi dengan pertanyaan yg lebih tajam
akhirnya selesai juga pak saya mengikuti kuliahnya 3 jam, so far saya bisa mengikuti & sudah menguasai semua materi yang diajarkan. dan sudah bisa submit submission di kaggle untuk titanic, tapi untuk compete yang lain langsung pusing, hhe === jika saya ingin berkarir sebagai data scientist apakah ada rekomendasi materi lebih lanjut yang bisa saya pelajari pak dengan pembahasan yang mudah dipahami seperti Bapak ? Terimakasih, Salam
@@RomiSatriaWahono siap, ini ya pak : 1. Data Mining Practical Machine Learning Tools & Techniques by Ian H. Witten, Elbe Frank, Mark A. Hall 2. Discovering Knowledge in Data by Daniel T. Larose 3. Data Mining Concepts & Techniques by Jiawei Han, Micheline Kamber, Jian Pei 4. Data Mining The Textbook by Charu C. Aggarwal 5. Data Mining Theories, Algorithms, and Examples by Nong Ye 6. Predictive Analytics and Data Mining by Vijay Kotu, Bala Deshpande 7. Data Mining for The Masses by Matthew North tadinya saya mau ambil course di : 1. www.coursera.org/professional-certificates/ibm-data-science atau 2. www.udemy.com/course/the-data-science-course-complete-data-science-bootcamp/
@@AdityaDwiPuspo nah betul bro ... kalau menurutku ditekuni dulu buku2nya ... nanti kalau ikut training yg berbayar investasi ga sia2 ... karena landasan sudha strong
Terima kasih untuk berbagi ilmunya pak Romi, pak saya tertarik dengan pembahasan tentang prediksi kelulusan mahasiswa, kalau di perkecil lagi datanya misalkan per jurusan tetap menggunakan teori yang sama, apakah bapak mengijinkan. terima kasih pak
Pa Romi, saya mau tanya cara membuat dataset dari database, apakah dataset bisa dibuat dengan membuat sebuah query pakai SQL dari sebuah database yang merupakan hasil relasi beberapa tabel dalm db tsb, ? hingga membentuk flat tabel
pak romi, mohon bimbingannya pak. saya mau thesis dan saya ambil topik text mining menggunakan naive bayes. kira2 penelitian yang belum pernah itu metodenya di apakan ya pak, untuk klasifikasi berita
Terima kasih pak sharing ilmunya yang luar biasa. Saya mau tanya, untuk mengolah data menggunakan metode forecasting untuk data masa depan, apakah kita perlu data testing yang isinya kosongan (seperti slide 177) atau cukup dengan data yang kita punya, sudah dapat menentukan data masa depan? terima kasih
Pak kalau klasifikasi pakai backpropagation di rapidminer bisa ndak pak? (Karena dibeberapa jurnal itu ada yg menggunakan backpropagation untuk klasifikasi) Lalu kalau datanya polinom semua, apa bisa dilihat korelasi antar atributnya?
terima kasih banyak ilmunya pak romi. saya ada pertanyaan, dapatkah hasil klustering dari K-means dibandingkan dengan data real atau fakta. misalnya saya ada dataset yang sudah ada kelasnya, kemudian saya coba kluster dengan K-Means. pada saat mengolah dataset tsb kelasnya saya nggak pake sehingga menghasilkan cluster_0 dan cluster_1. Dapatkah saya membandingkan kluster dari K-Means tsb dengan data fakta? trm kasih atas jawabannya.
Itu kalau dalam dunia klastering namanya external evaluation, jadi nanti hasilnya dibuat confusion matrix dan akurasinya keluar ... cara pengukuran lainnya adalah internal evaluation, dilihat berapa klaster yg paling optimal ... lihat di youtube saya tentang evaluasi dan komparasi
ijin bertanya pak. Pada menit 1:25:10, ada result dari Decision Tree caleg. Di kolom paling bawah ada jawaban YA/TIDAK. Nah disana terdapat perbedaan kolom pak. Ada kolom Tidak yang berwarna biru dan merah. Ada kolom tidak yang berwarna biru seutuhnya. Maksud dari warna dibawah kolom tersebut apa ya pak ? Atau di menit 1:29:23, itu yang kolom "none" ada yang berwarna biru hijau dan biru merah, itu maksudnya tentang apa ya pak ?
hasil proses prunning, sebagian ya dan sebagian tidak, tapi kecenderungan terbesar ya ... sekali lagi ikuti lagi semua youtubeku ... aku sudah jelaskan ini
21:00 perbedaan khusus secara kedalaman riset (geeks) yg bpak sebutkan itu biasanya sedalam apa ya pak, lebih spesifikasi dan detailnya, yang sering saya lihat juga, kebanyakan orang2 menggunakan py, platform TF, collab research google, library dll. misal saya ingin riset improve accuracy dari berbagai metode yang telah digunakan berbagai paper dalam suatu kasus tertentu, dataset menggunakan IAM, untuk segmentation menggunakan horizontal dan vertical projection, untuk classification dan recognition menggunakan SVM, untuk feature extractionnya pakai convex hull algorithm. (dari paper yang ada), nah misal saya ingin improve di feature extractionnya pakai metode lain, brarti apakah ini saya tidak perlu uprek rapidminer/knime? 🙏 (saya belum pernah menggunakan rapidminer)
ikuti playlist research methodology ya mas ... kalau utk research pakai tools apapun ga masalah, asal ada contribution to knowledge yg dihasilkan dari penelitian .. lengkapnya ikuti playsllist research methodology
Pak izin bertanya, saya baru mulai belajar autodidak dan mo pake clustering k means untuk menentukan strategi penjualan kosmetik, dataset yang ada hanya info transaksi penjualan perbulan dg kolom tanggal, nama produk dan jumlah yang terjual. Kira2 boleh kaya gitu aja ga pak datanya? Dan kira2 ada metode yang lebih baik dan simpel ga ya pak?
Izin bertanya pak Romi. Saya sedang mengerjakan skripsi tentang data mining clustering dengan metode k-means rumus euclidean distance, saya mau tanya bagaimana cara menentukan centroid awal di excel agar anggota clusternya sama dengan di rapidminerminer ?
Pak izin bertanya Pak, saya sedng mengerjakan tugas akhir dengan topik klasifikasi Sentimen Analisis dengan menggunakan metode SVM, apakah nyambung Pak klasifikasi sentimen pakai SVM? dengan tujuan akhir saya ingin melihat positif / negatif terhadap suatu isu yg sdg trend saat ini. mohon pencerahannya Pak, Terimakasih 🙏🏻
pak saya masih bingung himpunan data cleaning, data integration, data reduction dan transformation bagaimana sih contoh ke 4 data preprocessing bisa tercapai..
Izin bertanya pak, saya sedang melakukan penelitian tentang pencarian buku menggunakan Naive Bayes cara membagi data training dan data testingnya gimana ya pak?? Semoga di jawab🙏
Saya ingin bertanya pak, kan ketika kita melakukan analisa menggunakan FP-Growth, kita menentukan nilai minimal supportnya 0.5, tetapi kenapa ketika hasilnya muncul nilai supportnya itu dibawah 0.5? Apakah penentuan min support diawal itu untuk 1 itemset dan hasil support di result itu untuk 2 itemset? Terima kasih
sebentar ... dipahami dulu bahws bahasa gampangnya, saya support itu coverage, confidence itu akurasi .... maksudnya settingnya di mananya? kalau rapidminer ada di parameter
Pak romi, mau tanya dong Tugas akhir saya kan ttg sentimen analisis kmeans. nanti saya bagi datanya Ada data latih sama testing. Data latih saya mengambil dari sumber yg sudah ada labelnya. Trs data testing saya ambil dari instagram yg lagi tranding gpp ya pak? Data latih yg saya pakai nanti buat melatih model, trs kalo modelnya sudah jadi baru data testing saya masukin model. Gtu pak. Boleh kah pak? Mohon pencerahannya pak 🙏
Malam pak. Saya ingin tanya. jika saya ingin buat penelitian ttg pengaruh harga bursa komoditas nickel futures terhadap prediksi harga saham inco, apakah data nickel futures bisa di jadikan prediction/testing? karena jam bursa komoditas lebih dulu buka di bandingkan bursa saham
aku ga paham pertanyaanya ... dataset yg ada seperti apa ... cek 5 peran data mining di youtubeku, mau apa yg dipakai . dari situ coba mulai dulu deh ... ikuti seluruh youtubeku yg playlist data mining ..
Saya ingin bertanya Pak. Apakah menghitung akurasi perfomance model FP-Growth bisa dilakukan dengan rapidminer ini? atau hanya untuk menuntukan nilai support, confidence, lift ratio?
penelitian asosiasi biasanya pakai survey ke pengguna langsunf ... meskipun hasilnya tetap precision and recall ... kecuali desain masalah penelitiannya ke efisiensi komputasinya
Maaf pak saya ralat sedikit yg di part numeric dan nominal. Nominal itu yang tidak bisa di "+", "- ", "x" , ":". Sedangkan numeric itu yang bisa di "+", "- ", "x" , ":". Terimakasih pak ilmu nya
assalamualaikum pak, izin bertanya. ada sebuah data set sebanyak 16000 data kemudian akan di lakukan validasi data training dan testing menggunakan split data 9:1 maka hasil data pada performance vektor, jika data nya di jumlahkan tidak sama dengan jumlah data set yaitu 16000 data. berbeda dengan menggunakan cross validation, jika data set 16000 data maka hasil data pada performance vektor jika data nya di jumlahkan akan sama 16000. itu mengapa yaa pak? trimaksih banyak pak sebelumnya
1. pahami konsep cross validation, lihat lagi videoku, data dibagi 10 dan diuji 10x 2. pahami lagi makna data training dan data testing, juga tentang konsep split data, data yg muncul di performance adalah data yg di testing, bukan data training
@@RomiSatriaWahono trimaksih ilmunyaaa pakk, jadi semakin paham setelah menonton vidio bapak tentang rapidminer maupun data mining, semoga sehat selalu pakk.....
malam pak, izin bertanya. saya lg mengerjakan tugas akhir saya. tentang prediksi kelulusan mahasiswa. boleh minta saran dari bapak, untuk data apa saja yg akan saya pakai untuk neural network backpropagation. terimakasih
Permisi pak, apakah di rapid miner bisa mengklasifikasikan data sesuai yg kita inginkan? misalnya kita mempunyai dataset mengenai persentase kenaikan data penjualan perbulan, nah pilihan dari klasifikasi datanya ini kita yg tentukan sendiri misalnya kenaikan 0-50% itu bulan apa saja lalu , 51-75%, 76-100% sampai >100%. krna dari yg saya coba, rapid miner ini hanya bisa mengklasifikasikan data sesuai dari data yg didapatkan saja, tidak bisa kita custom?
Selamat malam, mohon izin bapak, saya mau melakukan penelitian terkait analisis sentimen pada sosial media twitter bapak. Saya mau bertanya terkait metode yang digunakan bapak, apakah pada analisis sentimen dapat menggunakan metode KDD dengan algoritma naive bayes ? Izin arahannya pak, terima kasih
kalau saranku diikuti dulu semua youtubeku yg playlist data science ....banyak baca paper2 ... cek juga playlist research methodology .. nanti akan paham
pak, maapkan atas kurang pengetahuan saya, ijin bertanya pak, semua data yang ditampilkan saya lihat dalam bentuk txt atau csv, brarti kita misal menggunakan data masih sangat mentah berupa scanned gambar, kita harus ekstraksi fitur nya lagi sedemikian sangat rupa dengan tujuan untuk bisa prediksi gambar ini milik iris, misalnya, gambar ini milik petal, dst.. dgn tujuan berapa persen keakuratan prediksi jika diberikan data baru (asumsi data kita pribadi dan sangat banyak), brarti pak, sudah menjadi wajib ya pak hukumnya, awalnya mau sumber data mentah apapun (gambar, video), kita lakukan preprocessing image, fitur ekstraksi, lalu ubah ke csv. terima kasih bnyak pak 🙏dan teknik yang umum untuk proses konversi nya itu jika menggunakan mesin sebaiknya menggunakan teknik apa pak🙏
data apapun (image, video, voice, unstructured, etc) pasti akan diesktraksi menjadi text supaya bisa dimining ... dan bidang ilmu computing dipecah cabangnya mengikuti pengolahan data itu (image processing, computer vision, text mining, data mining, dsb) ...
Pak, saya ingin bertanya. Yang saya baca2 bahwa data warehouse membantu menyusun banyak tabel 2d source data menjadi cube (star, snowflake schema). Namun, untuk visualisasi menjadi pengetahuan, cube dari data warehouse akan dipecah menjadi tabell flat 2d lagi ya, Pak?
@@RomiSatriaWahono baik terima kasih Pak. Pak saya ingin bertanya lagi, saya ingin melakukan data mining produktivitas pekerjaan konstruksi. Dengan atribut yang sangat beragam (numerik, nominal, time series), saya menemukan bahwa metode yang tepat adalah Gradient Boosting. Apakah itu benar dan kira-kira apa saja ya Pak kelebihan kekurangan gradient boosting untuk saya terapkan di konstruksi?
izin menambahkan Pak, Atau bahkan apakah ada algoritma data mining untuk mengolah multidimensional data? Karena terdapat variabel yang berhubungan (seperti nama pekerja[pekerjaID], pengalaman proyek dan jenis kelamin yang tidak bisa disatukan dalam flat dataset), namun apabila hanya nama pekerja (pekerjaID) yang dimasukan di data mining tidak bisa mempertimbangkan pengalaman proyek dan jenis kelaminnya. Terima kasih banyak Pak