Тёмный

OCR TensorFlow and Python (95.55% accuracy) | Automatic scoring of handwritten test papers 

Mrzaizai2k
Подписаться 165
Просмотров 6 тыс.
50% 1

Опубликовано:

 

5 окт 2024

Поделиться:

Ссылка:

Скачать:

Готовим ссылку...

Добавить в:

Мой плейлист
Посмотреть позже
Комментарии : 17   
@mrzaizai2k160
@mrzaizai2k160 2 года назад
Sorry for the inconvenient, I'll update the english version soon on my NEW channel "Mrzaizai2k -AI". Pls SUBSCIBE to receive the update ON NEW VIDEOS: ru-vid.com/show-UCFGCVG0P2eLS5jkDaE0vSfA
@vaibhavvarishsinghrathore7752
@vaibhavvarishsinghrathore7752 2 года назад
Sir the explanation is awesome. Thanks Can you tell please more about attention- 1) What type of attention it is ? Is it self attention (giving the weighted sum of attention vector at every time step) 2) What is the reason for applying it just after CNN not apply it after RNN 3) Sir in code you have done the following steps regarding attention - a) Permute b) Dense layer c) Mean (dimensionality reduction) d) Repeat vector 4) Layers multiply It would be great help sir . I can understand dense layer is implementing tanH fucntion but unable to understand reason behind other operations
@mrzaizai2k160
@mrzaizai2k160 2 года назад
First, I don't know much about the attention, but I'll try to explain to you what I understand This is the source code of attention that I used. It's in Vietnamese so pls use google translate: pbcquoc.github.io/vietnamese-ocr/ Yes it's self-attention. The weights are updated parallelly with CRNN Attention: lilianweng.github.io/lil-log/2018/06/24/attention-attention.html As in seq-2-seq project, you can see that without attention the path encoder connected to decoder is one path. which means information standing far away from each other (the model or LSTM can not remember the information so far away). In my project, CNN is like encoder and RNN is like decoder. It doesn't make sense to use attention after RNN for a,c and d I guess it's because of tensorflow (the code is not important). For e) multiply is a x h You can mail me directly through bao.mai@thefuturespast.org
@vaibhavvarishsinghrathore7752
@vaibhavvarishsinghrathore7752 2 года назад
@@mrzaizai2k160 Thanks a lot sir . Thank you so much for your answer. Hope everyone is fine and well around you sir
@phongngo315
@phongngo315 5 месяцев назад
Em chào anh ạ. Hiện e đang xây dựng 1 phần mềm tương tự của anh và e có tham khảo qua cách làm của anh. Em đã thử làm theo các bước nhưng kết quả không được như em mong muốn. Cho nên em có một số thắc mắc như sau, mong anh có thể giải đáp giúp em. 1. Dữ liệu của em là chữ đánh máy được in ra chứ không phải là chữ viét tay, cho nên em đã thử cho dữ liệu train của mô hình là các hình ảnh chứa từ đó và label tương ứng. Tuy nhiên sau khi train xong thì mô hình không predict được bất kỳ ký tự nào cả mà hoàn toàn là rỗng. Vấn đề có phải nằm ở dữ liệu đầu vào ko ạ? 2. Em có thể sử dụng bộ dữ liệu của anh cho mục tiêu và đoán nhận chữ đánh máy được không ạ? Em xin cảm ơn
@mukilanru
@mukilanru 2 месяца назад
Plus or minus is being detected as '+'. What can I do?
@mrzaizai2k160
@mrzaizai2k160 2 месяца назад
I think you should do more postprocessing or fine-tune the model
@asds5750
@asds5750 Год назад
Can you show me the learning path to complete a project like this?? (what and where to learn??)
@mrzaizai2k160
@mrzaizai2k160 Год назад
Idk. I learn new things everyday. But I guess 7 steps to approach a ML project of google is a good start
@pancakekiemtienonline6562
@pancakekiemtienonline6562 Год назад
cái kẹp đt mua ở đâu vậy bạn, với bạn cho mình xin cái tk gui để làm luận văn tốt nghiệp được ko
@mrzaizai2k160
@mrzaizai2k160 Год назад
Ra ngoài mấy tiệm bán ốp là có á bạn
@doantrungkien3274
@doantrungkien3274 Год назад
Anh cho em xin công thức tính CER và WER với ạ
@mrzaizai2k160
@mrzaizai2k160 Год назад
Em cứ google là nó CER là số character nhận diện sai trên tổng số character. Wer là cho word
@vaibhavvarishsinghrathore7752
@vaibhavvarishsinghrathore7752 2 года назад
Sir will be it in english or native language ??
@mrzaizai2k160
@mrzaizai2k160 2 года назад
yeah the model is for Vietnamese not for English. If you want to retrain the model. Here is my notebook www.kaggle.com/bomaich/vietnamese-handwritten-ocr-word-dataset. But you have to prepare your own dataset
@vaibhavvarishsinghrathore7752
@vaibhavvarishsinghrathore7752 2 года назад
Thank you sir
@mrzaizai2k160
@mrzaizai2k160 2 года назад
The video is now have English subtitle
Далее
Optical Character Recognition (OCR) - Computerphile
14:16
Why Neural Networks can learn (almost) anything
10:30
The Value of Source Code
17:46
Просмотров 79 тыс.
Master Python With This ONE Project!
56:54
Просмотров 98 тыс.
10 Crazy Python Operators That I Rarely Use
11:37
Просмотров 28 тыс.
Extract Text From Images in Python (OCR)
29:24
Просмотров 282 тыс.