Тёмный

Tác hại của imbalance data (dữ liệu mất cân đối) và hướng xử lý trong các bài toàn phân lớp - Mì AI 

Mì AI
Подписаться 28 тыс.
Просмотров 11 тыс.
50% 1

Chào mừng bạn đến với video "Tác hại của imbalance data và hướng xử lý trong các bài toán phân lớp"! Bạn đang gặp phải vấn đề với dữ liệu mất cân đối trong các bài toán phân lớp và muốn hiểu rõ về tác hại của imbalance data và cách xử lý nó? Video này sẽ giúp bạn khắc phục vấn đề này và tối ưu hóa kết quả phân lớp của mình.
Trong video này, chúng tôi sẽ đưa ra những lý do tại sao dữ liệu mất cân đối có thể ảnh hưởng đáng kể đến kết quả phân lớp. Bạn sẽ hiểu về sự chênh lệch giữa số lượng mẫu của các lớp, và cách imbalance data có thể dẫn đến hiện tượng overfitting, underfitting, và sự thiếu cân bằng trong việc đánh giá hiệu suất mô hình.
Chúng tôi sẽ chia sẻ với bạn các phương pháp xử lý imbalance data như undersampling, oversampling, và SMOTE (Synthetic Minority Over-sampling Technique). Bạn sẽ được hướng dẫn chi tiết về cách áp dụng và lựa chọn phương pháp phù hợp dựa trên từng trường hợp cụ thể.
Ngoài ra, chúng tôi sẽ giới thiệu các kỹ thuật và công cụ hỗ trợ như cross-validation, roc curve, và precision-recall curve để đánh giá hiệu suất của mô hình phân lớp trong bối cảnh imbalance data.
Nếu bạn đang gặp vấn đề với imbalance data trong các bài toán phân lớp và muốn tối ưu hóa kết quả của mình, video này sẽ cung cấp cho bạn những giải pháp và hướng dẫn cụ thể. Hãy cùng khám phá cách xử lý imbalance data và đạt được kết quả phân lớp chính xác và đáng tin cậy.
Link github: github.com/tha...
🎯🎯🎯#MìAI
Fanpage: / miaiblog
Group trao đổi, chia sẻ: / miaigroup
Website: miai.vn
RU-vid: / miaiblog

Опубликовано:

 

11 сен 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 34   
@lemauhieu3037
@lemauhieu3037 2 года назад
Em mới học về ML hơn 1 năm nay. Chia sẻ của anh vô cùng hữu ích ạ. Mong bên mình hãy tiếp tục làm thêm nhiều video như này để giúp ace mới vào nghề!
2 года назад
Cảm ơn bạn quan tâm nhé. Hi vọng giúp được nhiều nhiều mọi người. #MìAI Fanpage: facebook.com/miaiblog Group trao đổi, chia sẻ: facebook.com/groups/miaigroup Blog: miai.vn RU-vid: ru-vid.com
@ThanhNhandl
@ThanhNhandl 2 года назад
Video rất hay, mong anh ra thêm nhiều clip mới liên quan đến chủ đề này
2 года назад
Cảm ơn bạn quan tâm nhé. #MìAI Fanpage: facebook.com/miaiblog Group trao đổi, chia sẻ: facebook.com/groups/miaigroup Blog: miai.vn RU-vid: ru-vid.com
@vynguyenhoang7885
@vynguyenhoang7885 Год назад
Cảm ơn anh, clip anh làm công phu quá, rất dễ hiểu luôn
Год назад
Yeah. Rất vui vì giúp được em và moi người!
@thunguyenphu5796
@thunguyenphu5796 2 года назад
video rất hay và dễ hiểu ạ. Mong anh có thể chia sẽ thêm các chủ đề về SQL, database,...
2 года назад
Thanks em. Kênh anh tập trung về AI là chính. Các món về SQL, DB trên youtube nhiều lắm. Em cần thêm gì cứ post lên facebook.com/groups/miaigroup nhé!
@xuantran9018
@xuantran9018 2 года назад
Video rất hay và bổ ích cảm ơn thầy đã chia sẻ
2 года назад
Cảm ơn bạn đã ủng hộ. Cần thêm gì post lên Group trao đổi, chia sẻ: facebook.com/groups/miaigroup nhé!
@OakuYuuta
@OakuYuuta 2 года назад
Xưa em có làm bài về dự đoán gian lận thẻ tín dụng em tập trung vào phần ko bỏ sót dữ liệu gian lận mà cô lại cho em điểm thấp vì tỉ lệ dự đoán sai nhiều :
2 года назад
Hihi. Chắc cô chưa làm thực tế nhiều và ưu tiên Accuracy :)
@loilevan5530
@loilevan5530 Год назад
Em cảm ơn anh ạ.
Год назад
Không có gì em :D
@user-zv8wp2yt3h
@user-zv8wp2yt3h 2 месяца назад
Cho em hỏi nếu xử lý imbalce trước rồi dùng các algorith Decision Tree thì có hiệu quả hơn không ạ? Hay vì đặc thù của Decision Tree là đã xử lý imbalance luôn rồi nên không cần phải xử lý imbalance trước?
2 месяца назад
Trong video a nhớ có nói việc đó. DT handle khá tốt imbalance nên optional em nhé!
@user-zv8wp2yt3h
@user-zv8wp2yt3h Месяц назад
Cám ơn anh
@khuonglam4349
@khuonglam4349 2 года назад
Anh Thắng cho em hỏi, đối với bài toán phân loại hình ảnh với nhiều lớp, hình ảnh bị phân loại sai lớp thì mình sử dụng class_weight để giảm imbalance data được không ạ?
2 года назад
A nghĩ được em nhé.Cần thêm bạn post lên facebook.com/groups/miaigroup cho tiện trao đổi nhé!
@linhg5407
@linhg5407 2 года назад
anh làm thêm data dạng image đi ạ.
2 года назад
Data là image thì mình augment lên em.
@dungnguyenngoc8357
@dungnguyenngoc8357 2 года назад
Em nghĩ anh nên chia train test trước rồi chỉ xử lí imbalance trên tập train thôi vì làm như anh model dự đoán trên cả synthetic data :()
2 года назад
Đúng rồi. Nhiều bạn cũng hỏi. Bài đó anh làm demo nên vậy. Còn thực tế thì anh chỉ làm trên tập train. Ví dụ clip này: ru-vid.com/video/%D0%B2%D0%B8%D0%B4%D0%B5%D0%BE-pmWxcUJ74EA.html
@phanhuyhoang3720
@phanhuyhoang3720 2 года назад
@ em có thử chia train test trước thì các chỉ số đều giảm. Không biết có phải do dữ liệu ít hơn khi không chia không mà độ chính xác bị giảm. Chưa kể đến việc hên xui khi chia train test trước nữa. Nếu tập train không lấy được các dữ liệu đặc biệt😢😢
@tunguyenanh3071
@tunguyenanh3071 2 года назад
Anh ơi anh có link github code trong video không ạ ?
2 года назад
Tất cả link github anh đều để ở phần mô tả của video đó em.
@trungtintran5707
@trungtintran5707 Год назад
Còn đối với dữ liệu hình ảnh thì sao ạ?
Год назад
Em post cụ thể lên facebook.com/groups/miaigroup cho tiện trao đổi nhé!
@thaibinh907
@thaibinh907 2 года назад
anh cho em hỏi là scale thì dịch ra tiếng việt là gì ạ
@huychu4269
@huychu4269 2 года назад
theo mình hiểu scale có thể dịch là chia tỷ lệ, ví dụ bạn có 2 khoảng là 0-100 (1) và 0-1000 (2) thì khi chia tỷ lệ lại theo khoảng 0-1 thì số 50 trong khoảng (1) thành 0.5, 700 trong khoảng (2) thành 0.7
@thaibinh907
@thaibinh907 2 года назад
@@huychu4269 cảm ơn bn nha
2 года назад
Cảm ơn bạn @Chu Huy đã trả lời giúp ad nhé.
@quackat1110
@quackat1110 Год назад
Thả like với sub cho a tôi nào ;3
Год назад
Cảm ơn em rất nhiều. Hihi!
Далее
Giới thiệu về Big Data
1:03:11
Просмотров 92