Dimenzió #11

eLeVeN

(irodalom, gazdaság, számitástechnika, filozófia)

             SZÁJRÓL OLVASÓ SZÁMÍTÓGÉP?

         (In: Élet és Tudomány 1997/42., 1337. o.)


  Brit  számítógép-fejlesztők szerint ma már nem utópisztikus az az
elképzelés, hogy olyan számítógépet készítsenek, amely a szájmozgást is
figyelembe véve képes "megérteni" a beszédet. A London melletti Kelet-
Angliai Egyetem kutatói szerint a beszédet a hangzás alapján azonosító
("audio-")  számítógépek  mára  elérték  azt  a  határt, amelyen túl
felismerőképességük már nem javítható tovább. Hasonló határ a szájmozgás
követésében is van: a hangok kiejtéséhez tartozó ajakforma felismerésére
alapozó ("videó-") számítógépek is zavarba jönnek, ha különböző személyek
beszédét kell megérteniük. Az utóbbi gépekben olyan "alakszűrő" mechanizmust
alkalmaznak, amely a látott ajakformát addig egyszerűsíti, amíg azt a
számítógép az általa is felismerhető alapmotívumok valamelyikével nem
azonosítja.

  A brit kutatók ezzel a hagyománnyal szakítva olyan új - általuk
rostálásnak nevezett - eljárást dolgoztak ki, amely a száj nyitottságához
egy skálát rendel. Ennek egyik végpontja a csukott, másik végpontja pedig a
teljesen nyitott, O alakú szájforma. Andrew Bangham, a kutatócsoport
vezetője szerint ez azért jobb, mint az eloző megoldás, mert a számítógép
könnyebben alkalmazkodik a különböző személyek eltérő beszédmódjához, ezt a
skálát ugyanis rugalmasan tudja illeszteni a beszélő stílusához.

  A brit kutatók azonban nemcsak az e területen hagyományos videótechnika
rendszerező elvét változtatták meg, hanem - hogy fokozzák a beszédfelismerés
hatékonyságát - egyesítették az audiotechnikával is. A számítógépet ezért
mikrofonnal és kamerával egyaránt felszerelték, s így a gép, ugyanúgy, mint
mi, emberek, a hangot és a szájmozgást együttesen követi.

  A kutatók elégedettek az első próbák eredményével: a gép tíz ember
beszédéből egyértelműen azonosítani tudta az ábécé hangzóit, s már olyan
egyszerűbb szavakat is felismert, mint a yes vagy a no. A jövőt illetően
Bangham derűlátó: úgy véli, a gépnek immár "van szeme a látásra, és füle a
hallásra", s idő kérdése csupán, hogy a türelmes tanítás meghozza a
gyümölcsét.
Google
 
Web iqdepo.hu
    © Copyright 1996-2023
    iqdepo / intelligence quotient designing power - digitális kultúrmisszió 1996 óta
    All rights reserved. Minden jog fenntartva.