Вы у меня попляшете.

Нейромережа намагалася навчити розрізняти танці, але замість цього вона навчилася розпізнавати самих танцюристів.


Вирішення завдання класифікації - це один з найважливіших напрямків використання штучних нейронних мереж. Наприклад, щоб за запитом «котики» відомі пошукові сайти видали вам мільйони зображень саме вусатих-смугастих, пошуковий алгоритм повинен спочатку сам для себе «зрозуміти», які ознаки в зображенні визначають наявність на ньому саме кота, а потім за допомогою цієї інструкції перевірити мільярди фотографій і відібрати для вас саме котів.


Щоб нейронна мережа навчилася відокремлювати котів від китів, її спочатку потрібно цьому навчити: надати їй, наприклад, кілька десятків, а краще сотень тисяч або більше фотографій з уже готовими підписами «котик» і «не котик». Навчившись, нейронна мережа вже сама зможе без підказки відрізняти фотографії з котами від усіх інших. Звичайно, не можна гарантувати на сто відсотків, що за потрібну фотографію машина не прийме щось інше, і, навпаки, пропустить омріяного нами котика, але, будемо чесними, ми і самі не завжди можемо точно і відразу сказати, що зображено на фотографії. Також потрібно розуміти, що під терміном «нейромережа» ховається великий набір різних методів, тому для простоти ми будемо говорити лише про загальні принципи роботи з інформацією.

Придумати подібних класифікаційних завдань можна дуже багато, проте далеко не завжди вдається навчити нейромережу давати правильне рішення або ж результат може виявитися трохи не тим, який очікувалося отримати. Наприклад, дослідники з університету Йювяскюля спробували навчити нейромережу визначати музичний напрямок з танцю, який виконує людина. Для цього вони попросили станцювати під музику 73 добровольців, серед яких були як люди, які отримали коли-небудь музичну освіту, так і просто «аматори». Кожному з учасників експерименту давали у випадковому порядку прослухати 16 коротких уривків пісень, що належать до 8 музичних жанрів, і просили рухатися під музику так, як їм хочеться. Рухи учасників записувалися за допомогою технології захоплення руху (motion capture), яку використовують при створенні комп'ютерних ефектів в кіно і анімації. Вся ця інформація потім оброблялася нейросетевими алгоритмами з метою навчити машину, скажімо, відрізняти по рухах танець під джазову музику від танцю під хіп-хоп або під композицію в жанрі метал.

На деякий подив дослідників, їх нейромережа дуже посередньо змогла визначити музичний жанр по рухах танцю. Однак алгоритм в деякій мірі компенсував цей недолік тим, що досить непогано впорався з вгадуванням конкретного виконавця танцю, незалежно від того, під яку музику танцювала людина. Виходить, що індивідуальні особливості руху людини (зазначимо, що в даному експерименті аналізувався рух в цілому 21 фіксованої точки на людині) з точки зору нейромережі виявилися більш характерними, ніж набір рухів різних людей, що танцюють під одну і ту ж музику. Іншими словами, відрізнити умовного Івана Івановича, який танцює хіп-хоп, від Марії Іванівни, яка танцює під музику реггі, нейромережі виявилося простіше, ніж зрозуміти, під яку музику танцюють окремо ті ж Іван Іванович або Марія Іванівна.

При уявній деякій абсурдності мети цього експерименту, він являє собою хорошу ілюстрацію того, як методи машинного навчання можуть давати несподіваний альтернативний погляд на звичні для нас явища. Нейромережі і ми «бачимо» світ по-різному, і цілком можливо, що деякі з майбутніх відкриттів в науці будуть зроблені саме завдяки «нелюдській» нейросетевій логіці.

За матеріалами Journal of New Music Research

COM_SPPAGEBUILDER_NO_ITEMS_FOUND