Ezt is meg kellene tanulnia az Amazon Alexának
Ezt is meg kellene tanulnia az Amazon Alexának
2019. június 28.
Úgy tűnik, hogy a beszédnek és a hangalapú vezérlésnek nagy szerepe lesz a számítástechnika jövőjében. Már most is találkozhatunk ezzel telefonoknál, intelligens hangszóróknál, de még háztartási gépeknél is. Az akadálymentes kommunikációról ugyanakkor a nagy techcégeknek sem szabadna megfeledkezniük, így például a jelnyelvet is értenie kellene a mindent tudó mesterséges intelligenciának.
Ezek a kérdések inspirálták a szoftverfejlesztő Abhishek Singh-et, hogy még tavaly módosítást hajtson végre az Amazon közismert Alexa nevű alkalmazásán. A célja az volt, hogy a virtuális asszisztens megértsen néhány kézjelet is.
Egy videón Singh be is mutatta, hogyan működik a gyakorlatban ez a nem szokványos kommunikáció (a gesztusvezérlés ettől teljesen eltérő módot jelent). Egy Amazon Echo okoshangszórót csatlakoztatott egy laptophoz webkamerával, illetve még néhány gépi tanulásra készített háttérszoftverrel. Ezek „lefordítják” Singh kézjeleit szövegre, és a szöveget átalakítja beszéddé.
A fejlesztő szerint a projekt egy „gondolatkísérlet” volt, amelyet az egyre népszerűbb hangvezérelt asszisztensek működési elve inspirált. „Ha ezek az eszközök elterjednek és sokak számára elérhetővé válnak az otthonaikban, akkor gondoskodni kell azokról is, akik nem hallanak, vagy nem képesek beszélni hozzájuk. Egy tökéletes dizájn senkit sem zárhat ki” – mondta az indiai fejlesztő.
Mint minden „látó szoftver” esetében, úgy Singhnek is meg kellett tanítania a programot a kézjelekkel leadott parancsok jelentésére és adattá való lefordítására. Azért volt kénytelen megalkotni és digitalizálni a saját jelkészletét, mert nem talált létező és használható online jelbeszédet.
Ennek megfelelően, amit korábban nem vettek videóra, azt a szoftver nem is fogja felismerni. A jó hír viszont az, hogy a már létező „szótárat” már relatíve könnyű bővíteni – akár a felhasználóknak is.
Közben ettől függetlenül az Amazon kiadott a tavalyi év során egy frissítést az Alexához, amelyben a képernyővel ellátott Echo Show kommunikálni tud a virtuális asszisztenssel hangutasítás nélkül. Ez a The Verge cikke szerint arra utal, hogy az internetes kereskedőóriás legalább már elgondolkodott azon, hogy más módon is lehet hozzáférést biztosítani a beszélő asszisztenséhez a beszéden felül. Ki tudja, talán a következő lépés a jelbeszéd megértése lesz? Mint a szoftverfejlesztő bemutatója bizonyítja, ez már technikailag könnyen lehetséges!