Em rất cần anh :D đưa ra những video tiếp theo về các mô hình dự đoán hiện nay cần dùng, cách làm sạch dữ liệu và prepare nó, kèm theo sereries 1 cái project nho nhỏ nha anh
rất cô động, súc tích, đúng trọng tâm, người mới xem video của anh sẽ ko bị bỡ ngỡ, 10 điểm về nội dung, 10 điểm về edit video ! ủng hộ a, a mở donate đi ạ ^^
:( hix hix xin lỗi em nhiều nhiều nhé ! Planned anh là đầu tuần mà trong tuần việc trên cty nhiều quá nên thành ra không có thời gian hoàn thành nốt phần còn lại, nên nay anh làm clip dài hơn 1 tiếng để chuộc lỗi nha
Hi ad, cám ơn về phần trình bày rất chi tiết. Cho mình hỏi thêm nếu muốn display tên của 1 số city có diện tích lớn nhất thì syntax sẽ là ntn nhé, tks ad!
Hi Ad, rất cảm ơn chia sẽ hay và bổ ích của Ad. Khi mình làm theo phần project, khi scatter biến c=population thì kết quả vẫn theo như hướng dẫn, nhưng khi scatter thêm biến s=area thì các dot trên đồ thị bị thay đổi màu và kích cỡ, mình ko biết bị lỗi gì, nhờ Ad hướng dẫn giúp. Thanks
A ơi, e sang học kỳ sau e có học môn phân tích dữ liệu 1, a có biết sách nào hay có thể recommend cho e vs được không ạ, e chúc a và team Codexplore nhiều sức khỏe ạ
Thật sự rất cảm ơn anh đã ra những video rất hay và bổ ích. Em có thắc mắc là Jupyter Notebook nó có khác gì so với những IDE khác vậy ạ? Tại sao không dùng những IDE khác ( như Spider, VScode) mà lại dùng Jupyter Notebook? Em cảm ơn a!
Jupyter nó chạy theo từng cell nhỏ tiện cho việc show kết quả nhất là việc vẽ đồ thị. Bạn sài VScode chạy vẽ nhiều đồ thị xem có tiện lợi hơn Jupyter notebook không là biết :))
Anh ơi, anh cho em hỏi là nếu nắm chắc các video của anh như video về numpy, pandas hay matplotlib này rồi áp dụng vào các bài toán thì có thể coi là nắm được cơ bản của DS chưa ạ?
numpy, pandas hay matplotlib là những tool cần để làm việc và xây dựng các mô hình máy học (machine learning model) thôi em nhé ! Điều kiện đủ vẫn là phải biết về các framework giúp xây dựng các mô hình như scikit-learn, tensorflow hay pytourch ! những phần này anh sẽ cover ở những video tiếp theo nhé !
Một câu hỏi rất hay, a quên không giải thích trong video: 1. Khi dùng np.random.seed sẽ làm thay đổi global RandomState, 2. Khi dùng np.random.RandomState thì sẽ tạo ra một class instance và em chỉ thay đổi RandomState của 1 mình instance đó thôi. Vd: np.random.seed(1234) np.random.uniform(0, 10, 5) #array([ 1.9151945 , 6.22108771, 4.37727739, 7.85358584, 7.79975808]) np.random.rand(2,3) #array([[ 0.27259261, 0.27646426, 0.80187218], # [ 0.95813935, 0.87593263, 0.35781727]]) r = np.random.RandomState(1234) r.uniform(0, 10, 5) #array([ 1.9151945 , 6.22108771, 4.37727739, 7.85358584, 7.79975808])
A Quân ơi, khi em làm theo Project cuối trong video, em dùng O-O API. Mọi thứ đều ok như Pyplot API cho đến khi em làm tới việc Chú thích diện tích các thành phố. Em dùng câu lệnh: area_range=[50,100,130,500] for area in area_range: ax.scatter([],[],s=area, c='k',alpha=0.9,label=str(area)+'km$^_{2}$') thì nó ko báo lỗi. Nhưng em ko biêts làm sao để show cái chú thích ra đây ạ. Em đã dùng lệnh ax.legend() thì nó báo lỗi. Mong anh đọc được và giúp em với, em xin cảm ơn ạ!
Anh ơi, anh cho em hỏi về sự khác nhau ở 2 chỗ này( trong project cuối video) với ạ: plt.scatter(lon, lat, c=np.log10(population), s=area, cmap='viridis') plt.colorbar(label='log$_{10}$(population)') Tại sao cũng là log nhưng ở trên viết khác log ở dưới vậy anh. E thử áp dụng cách viết ở trên cho ở dưới: label=np.log10(population). Nhưng nó bị lỗi a ạ
Hi em, log ở plt.scatter(lon, lat, c=np.log10(population), ..) là hàm log trong Toán em nhé. Còn plt.colorbar(label='log$_{10}$(population)') ở dưới là để label cái thanh colorbar bên phải đó em để hiện label "Log10 population" em nhé.
Cảm ơn feedback của bạn, bạn có thể cho mình biết cụ thể những phần nào bạn thấy chưa dễ hiểu được không? Mình rất welcome những feedback mang tính đóng góp để có thể xây dựng kênh được tốt hơn 😄