PHƯƠNG PHÁP NHẬN DẠNG KÍ TỰ SỐ VIẾT TAY DỰA TRÊN MẠNG NƠ-RON HỌC SÂU

Đinh Thị Mận, Nguyễn Văn Thịnh, Nguyễn Thế Hữu, Trần Thị Vân Anh

Tóm tắt


 

Trong bài báo này, phương pháp nhận dạng kí tự số viết tay được đề xuất theo hướng tiếp cận dựa trên mạng nơ-ron học sâu (DNN- Deep Neural Network). Đầu tiên, tập dữ liệu ảnh được trích xuất đặc trưng HOG (Histogram of Oriented Gradient) kết hợp với đặc trưng SIFT (Scale-invariant feature transform). Sau đó, một mô hình (model) mạng DNN được xây dựng để huấn luyện nhằm nhận dạng hình ảnh. Cuối cùng, ảnh đầu vào được nhận diện tự động dựa trên mô hình đã được huấn luyện. Nhằm minh chứng tính hiệu quả của phương pháp đề xuất, thực nghiệm được xây dựng và đánh giá trên tập dữ liệu ảnh MNIST. Kết quả thực nghiệm đã cho thấy tính khả thi và hiệu quả của phương pháp, đồng thời dễ dàng mở rộng cho việc nhận diện các hình ảnh chữ viết tay khác.

 

 



Từ khóa


ảnh kí tự; handwritten digit recognition; DNN; SIFT; HOG

Toàn văn:

XML

Trích dẫn


Balas, M. B. K., Valentina, .E, & Kumar, R. (2021). Handbook of Deep Learning in Biomedical Engineering Techniques and Applications. Elsevier.

Brownlee, J. (2019). Deep Learning for Computer Vision - Image Classification, Object Detection and Face Recognition in Python. Reserved.

Dan, J. S. (2020). Multi-column Deep Neural Networks for Image Classification.

Dong, J. (2021). The example of graph cut algorithm. Retrieved from https://www.researchgate.net/figure/The-example-of-graph-cut-algorithm-13_fig2_228856802

Kulandai, J. (2017). Facial recognition using histogram of gradients and support vector machines. In 2017 International Conference on Computer, Communication and Signal Processing (ICCCSP). IEEE

Lowe, D. G. (2004). Distinctive Image Features from Scale-Invariant Keypoints. International Journal of Computer Vision, 60(2), 91-110.

Niranjani, N. (2021). The Real Time Face Detection and Recognition System. Retrieved from https://www.researchgate.net/publication/321669397_The_Real_Time_Face_Detection_and_Recognition_System

Pham, P. Q., & Vuong, Q. P. (2019). Nhan dang chu so viet tay dung mang neuron nhan tao [Recognition of handwritten digits using artificial neural network]. Journal of Science and Technology, University of Sciences, Hue University, 14, 119-129.

Rother, V. K. C, & Blake, A. (2004). GrabCut: Interactive foreground extraction using iterated graph cuts. Springer.

Reza, E. (2014). Efficient Handwritten Digit Recognition based on Histogram of Oriented Gradients and SVM. International Journal of Computer Applications, 9(104), 0975-8887.

Suresh, R. U. A, & Vimal, S. (2020). Deep Neural Networks for Multimodal Imaging and Biomedical Applications. United States IGI Global.

Szikora, P. Ph. D. (2021). Self-driving cars - The human side. Retrieved from https://www.researchgate.net/publication/324095773_Self-driving_cars_-_The_human_side

The Sprawls Resources. (2021). Optimization of Medical Imaging Procedures. Retrieved from: http://www.sprawls.org/resources/DIGITAL




DOI: https://doi.org/10.54607/hcmue.js.20.5.3621(2023)

Tình trạng

  • Danh sách trống