НЕЙРОМЕРЕЖЕВИЙ КЛАСИФІКАТОР АВТОМАТИЧНОЇ СИСТЕМИ ОБРОБКИ ДОКУМЕНТІВ
10.33815/2313-4763.2021.2.25.083-091
Анотація
Робота спрямована на вирішення прикладної задачі розробки автоматичної системи обробки електронних документів, а саме однієї з її частин ‑ класифікатора. Для вирішення поставленої задачі запропоновано використовувати підходи машинного навчання та штучного інтелекту. Вирішення поставленої задачі при звичайних умовах не складає труднощів, проте в даній роботі розглядається випадок обмеженості навчальної вибірки, що є поширеним випадком при розробці систем на базі запропонованих підходів. У роботі проведено дослідження початкових даних на основі яких буде проведено навчання моделі та визначено кількість класів, що будуть розпізнаватись, кількість представників у кожному класі та досліджено особливості їх представлення. У роботі представлено підходи, застосування яких дозволяє збільшити точність систем такого типу, в умовах обмеженості початкової начальної вибірки. Серед запропонованих підходів розглядається принцип мінімізації параметрів при формуванні архітектури штучної нейронної мережі, аугментація даних, переднавчання штучної нейронної мережі шляхом застосування автоенкодера. Отримана точність у 94-95 %, після застосування запропонованих підходів на відміну від 70 % початкових, підтверджує можливість оперативної розробки аналогічних класифікаторів такого типу, при обмеженій вибірці та в умовах мінімізації часу, з досягненням високих показників точності.
Посилання
Fransua Sholle. Hlubokoe obuchenye na Python. SPb.: Pyter, 2018. 400 s.: (Seryia «Byblyoteka prohrammysta»). ISBN 978-5-4461-0770-4.
Sokolenko D. H., Kornaha Ya. I. «Systema rozpiznavannia pysemnykh symvoliv za dopomohoiu neironnoi merezhi», Vcheni zapysky TNU imeni V.I. Vernadskoho. Seriia Tekhnichni nauky Tom 29 (68) Ch. 2 # 5 2018 s. 56-58.
Karpovych Artem Valeriiovych «Vykorystannia zghortkovykh neironnykh merezh dlia zadachi klasyfikatsii tekstiv», International scientific journal «Internauka» # 14(54), 2018 // Technical sciences s. 69–73.
Orhan G. Yalçın Image Classification in 10 Minutes with MNIST Dataset, URL: https://towardsdatascience.com/image-classification-in-10-minutes-with-mnist-dataset-54c35b 77a38d.
Feiyang Chen, Nan Chen, Hanyang Mao, Hanlin Hu Assessing Four Neural Networks on Handwritten Digit Recognition Dataset (MNIST) / Сhuangxinban journal of computing, june 2018, URL: https://arxiv.org/pdf/1811.08278. pdf.
Yifan Wang, Fenghou Li, Hai Sun, Wenbo Li, Cheng Zhong, Xuelian Wu, Hailei Wang, Ping Wang Improvement of MNIST Image Recognition Based on CNN, 7th Annual International Conference on Geo-Spatial Knowledge and Intelligence IOP Conf. Series: Earth and Environmental Science 428 (2020), URL: https://iopscience.iop.org/article/10.1088/1755-1315/428/1/012097/pdf.
Wan Zhu Classification of MNIST Handwritten Digit Database using Neural Network, URL : http://users.cecs.anu.edu.au/~Tom.Gedeon/conf/ABCs2018/paper /ABCs 2018_paper_117.pdf.
Korotynskyi, A., Zhuchenko, O. Development of a classifier for the system of automatic document processing with limited sampling, ATIT 2020 – Proceedings: 2020 2nd IEEE International Conference on Advanced Trends in Information Theory, 2020, р. 349–352.
A. Korotynskyi, O. Zhuchenko A system of automated control for the baking process that minimizes the probability of defects, Eastern-European Journal of Enterprise Technologies, 2020, (2-103), р. 58–67.