Н.Даваасүрэн: Масктай хүнийг таних загвар 86 хувийн нарийвчлалтай гарсан

0
хуваалцах
621
үзсэн

Б.БЯМБАЖАРГАЛ

Монголын залуу эрдэмтэд, судлаачдын оюуны олимп болсон “Хүрэл тогоот” эрдэм шинжилгээний хуралд “Амны хаалттай хүнийг таних гүн сургалтын загвар” сэдвээр оролцож БШУ-ы сайдын Грантад шалгарсан ШУА-ийн Математик, тоон технологийн хүрээлэнгийн ЭША Н.Даваасүрэнтэй ярилцлаа.

 

-Судалгааныхаа шинэлэг тал, онцлогоос танилцуулахгүй юу?

-Царай таних систем нь 1990 оноос хөгжиж, олон жил судлагдаж байгаа сэдвүүдийн нэг. Би судалгаандаа зөвхөн нэг загварын хэрэглээг нь өөрчилж хийсэн гэсэн үг юм. Гүн сургалтын аргууд хүч түрэн орж ирэхээс өмнө судлаачид уламжлалт дүрс боловсруулалтын аргуудыг ашиглан царай таних алгоритмыг боловсруулдаг байсан. Гэвч эдгээр аргууд нь гэрэлд маш өртөмтгий, нүүрний байрлал өөрчлөгдөхөд танихгүй байх зэрэг олон сул талуудтай. Уламжлалт дүрс боловсруулалтын аргуудыг ашигласан царай таних аргуудыг судлаачид хөгжүүлсээр өгөгдлийн сан дээрх хамгийн сайн нарийвчлалыг 99 хувьд хүргэсэн нь ч бий. Манай судалгаа нь амны хаалттай хүнийг таних гэдгээрээ онцлогтой. Энэ чиглэлээр хийгдсэн загварууд цөөн. Ер нь одоо хөгжөөд буй энэ олон царай таних системийн загварууд нь амны хаалттай хүний царай танилт дээр тааруу үр дүн үзүүлж байгаа. Үүний шалтгаан нь загварууд бүгд амны хаалтгүй царайнууд дээр хөгжүүлэлт хийсэнтэй холбоотой. Мөн царай танихад ашигладаг нүүрний зарим хэсгүүд болох ам, хамар  зэргийг амны хаалт халхалж байгаа учраас царай танилтын нарийвчлал буурч байгаа юм. Тиймээс амны хаалт халхалсан хэсгүүдийг ашигладаггүй царай таних алгоритмууд болон тэдгээр хэсгүүдийг хиймлээр сэргээдэг аргуудыг судлаачид хөгжүүлж, туршиж эхлээд байна.  Тэгэхээр бид амны хаалт халхалсан хэсгүүдийг ашигладаггүй, хүний царайны зөвхөн нүд, дух орчмын хэсгүүдээр тухайн хүнийг таних загвар гарган авах туршилт хийсэн. Энэ судалгааны ажил нь хүний царай таних хиймэл оюуны технологийн судалгаа гэсэн суурь судалгааны хүрээнд хийгдсэн. Төсөл өнгөрсөн онд эхэлж энэ оноор дуусч байна.

-Гүн судалгааны арга гэдгийг тайлбарлаач?

-Гүн сургалт нь машин сургалтын /machine learning/ нэг хэсэг буюу дэд салбар. Гүн сургалтын загварууд маш олон давхарга, параметрүүдтэй байдаг учир гүн гэж нэрлэсэн. Бүх царай таних загварууд үүнд суурилж хөгжиж байна.

-Судалгаагаа хэдий хугацаанд хийв?

-Өнгөрсөн оны дөрөвдүгээр сараас хийж эхэлсэн. Тэгэхээр найман сарын хугацаанд энэ судалгааг хийсэн байна. Мэдээж судалгааны ажил бол багийн хөдөлмөр байдаг. Багшийнхаа тусламжтай амжилттай дуусгаж “Хүрэл тогоот” эрдэм шинжилгээний хурлын шилдэг судалгааны нэгээр шалгарсан.

Загварын зарим андуурсан хосмогууд

-Судалгааны явцад ямар арга, туршилт ашигласан бэ?

-Судалгаандаа 10575 ялгаатай хүний 494 мянган ширхэг зурагтай “Casia-Webface” өгөгдлийн санг ашигласан. Ингэхдээ бид царай олоход түгээмэл ашиглагддаг “MTCNN” загвараар өгөгдлүүдээ боловсруулсан. Энэ нь зураг бүрийг шүүж царай нь олдоогүй тохиолдолд тухайн зургийг устгах замаар өгөгдлийн санг цэвэршүүлж байгаа юм. Үүний дараа өгөгдлийн санд нийт 10.5 мянган ялгаатай хүний 336.4 мянган зурагтай болж өөрчлөгдсөн. “MTCNN” загварын царайг хайж олж чадаагүй зургууд дээрх нийтлэг шинж нь нягтаршил багатай, эсвэл хажуу тийш харсан гэх мэт хүчин зүйлүүд байсан. Царай олдсон зургууд өөр өөр хэмжээтэй байсан учир бүгдийг нь 120x120x3 хэмжээтэй болгон өөрчилж 120x55x3 зургийн харьцаагаар нүд духны хэсгийг ялгаж авсан. Тэдгээр зургийг ашиглан гурвалсан алдааны функц ашиглан эхний загвараа туршихад хангалтгүй үр дүн үзүүлсэн. Тухайлбал, 1300 зурагнаас 900 гаруйг нь буюу 73.61 хувийг нь зөв таньсан. Үүний дараа дахин “Haar-eye” ашиглан хоёр нүд нь тод харагдаагүй зургуудыг устгасанаар өгөгдлийн сангийн 274.5 зураг болж өөрчлөгдсөн. Ингэснээр 1300 хүнээс хамгийн ихдээ 1119 хүнийг зөв таньсан нь 86.07 хувийн нарийвчлалтайгаар таньсан гэсэн үг юм.

Загварын зарим  зөв таньсан хосмогууд

-Ер нь монголд царай таних системийн талаар судалгаа хэр их хийгддэг юм бэ. Олон улсад ялангуяа Хятадад энэ чиглэл асар эрчимтэй хөгжиж байна?

-Тийм.Царай таних системд гүн сургалтын бүх модель 99 хувийн амжилттай ажилладаг. Бүгд л 99 хувиас дээш нарийвчлалтайгаар царайг таньж байгаа. Жишээлбэл, 2012 оноос хойш гүн сургалтын аргууд хөгжиж маш өргөнөөр ашиглагдах болсоноор хамгийн бага нарийвчлалтай загвар нь 92 хувийн нарийвчлалтай таньж байсан. Гүн сургалтыг ашиглан хийсэн царай таних системийн хамгийн өндөр үзүүлэлтийг “DeepFace” үзүүлсэн. Дараа нь гүн сургалтыг ашигласан DeepID2, FaceNet, Baidu, VGGFace, Cosface зэрэг загварууд бүгд “LFW” өгөгдлийн сан дээр 99 хувиас өндөр нарийвчлал үзүүлсэн байх жишээтэй. Энэ олон царай таних загварын ерөнхий загвар адилхан байдаг.

-Залуу судлаачдад тулгамдаж буй ямар асуудал байна. Ялангуяа шинэ төрлийн судалгаа хийхэд?

-Мэдээж хүн хүч шүү дээ. Шинэ судалгаа, төсөл эхлэхээр ажиллах хүч бага байдгаас шалтгаалж цөөн хүн л ачаалалтай ажилладаг. Энэ нь санхүү, төсөв, хөрөнгөтэй холбоотой байдаг байх. Тоног төхөөрөмжийн хувьд TeslaV100 зэрэг сүүлийн үеийн сайн төхөөрөмжүүдтэй учраас энэ тал дээр асуудал бага.

-Одоогийн байдлаар танай хүрээлэнд ажиллаж буй ЭША-ын хэдэн хувь нь залуучууд вэ?

-Манай хүрээлэнгийн талаас их хувь буюу 60 орчим хувь нь 21-27 насныхан байдаг. Ид сурч боловсрох, мэргэших насныхан олон байдаг учраас ШУА-аас шаардлагатай бүх сургалт, хөтөлбөрүүдэд хамруулж хөгжихөд сайн анхаардаг.

-Технологийн салбарт олон шинэ чиглэл гараад ирчихлээ. Цаашид ямар чиглэлд судалгааны ажил хийх төлөвлөгөөтэй байгаа вэ?

-“Machine learning” нь гурав салж хөгжиж байгаа. Тухайлбал, supervised learning, unsupervised learning, reinforce learning. Эдгээрээс би “reinforce learning” гэдэг чиглэлд нь илүү сонирхолтой. Үүнийг энгийн жишээгээр тайлбарлавал бүтээсэн агент нь орчинтой харилцан үйлчлэлцэнэ. Бид гар утсан дээрээ шатар тоглохдоо нөгөө талдаа боттой тоглодог. Тэгэхээр тэр бот нь хожихын тулд хийсэн үйлдлүүдэд хариу үзүүлж хожихын тулд арга хэмжээ авдаг. Үүнийг “reinforce learning” гэдэг.

Эх сурвалж: “Зууны мэдээ” сонин

2021.12.2 ПҮРЭВ № 236 (6713)