15:45 - 28/մայիսի/2019

Արհեստական ինտելեկտը սովորել է նկարել մարդու դեմքը նրա ձայնի հիման վրա

Ամերիկյան գիտնականները Մասաչուսեթսի տեխնոլոգիական ինստիտուտից ներկայացրել են Speech2Face նեյրոցանցը, որը կարող է մարդու ձայնի հիման վրա վերարտադրել նրա դեմքի մոտավոր պատկերը, տեղեկացնում է HighTech-ը՝ հղում կատարելով arXiv.org-ին։

Speech2Face նեյրոցանցը սովորել է օգտատերերի ձայնի մի քանի միլիոն տեսանյութերի վրա։ Յուրաքանչյուր տեսանյութ բաժանված է ձայնա- եւ տեսանյութերի։ Ալգորիթմը բաժանված է մի քանի մասի. դրանցից մեկը օգտագործում է դեմքի բոլոր եզակի առանձնահատկությունները նրա դեմքը վերարտադրելու համար, մյուսը փորձում է վերարտադրել ըստ հոլովակի ձայների եւ նայում է, թե ինչ տեսք ունի մարդու դեմք, որը խոսում է օրիգինալ տեսանյութում։

Նեյրոցանցի մեթոդաբանությունում մարդու պատկերը եւ ձայնը բաժանվում են երեք ժողովրդագրական ցուցանիշների՝ սեռ, տարիք եւ ռասա։

Թեստավորման ժամանակ գիտնականներին առայժմ չի հաջողվել մինչեւ վերջ սովորեցնել նեյրոցանցին վերականգնել մարդու արտաքինը ձայնի հիման վրա։ Արհեստական ինտելեկտը միշտ կարող է որոշել սեռը, ինչպես նաեւ ավելի հաճախ կռահում է ասիական եւ եվրոպոիդ արտաքինով մարդկանց։ Բայց առայժմ Speech2Face-ը չի կարողանում ճիշտ որոշել տարիքը անգամ 10 տարվա մոտարկմամբ։

Գիտնականները նշել են, որ գլխավորը Speech2Face-ի աշխատանքում, այնուամենայնիվ, մարդու պատկերի ճշգրիտ պատճենումը չէ նրա ձայնի հիման վրա, այլ դրանից որոշ ճշգրիտ բնութագրերի առանձնացումը։ Ընդ որում, բնական է, որ մարդու ձայնով անհնար է հասկանալ, թե ինչ ձեւեր ունի նրա քիթը կամ արդյոք նրա դեմքին մեծ խալ կա։