Dimenzió #11

eLeVeN

(irodalom, gazdaság, számitástechnika, filozófia)

                         SZÁJRÓL OLVASÓ SZÁMÍTÓGÉP?

                  (In: Élet és Tudomány 1997/42., 1337. o.)


   Brit   számítógép-fejlesztők  szerint  ma  már  nem  utópisztikus  az  az
elképzelés,  hogy  olyan  számítógépet  készítsenek,  amely a szájmozgást is
figyelembe  véve  képes  "megérteni"  a  beszédet.  A London melletti Kelet-
Angliai  Egyetem  kutatói  szerint  a  beszédet  a hangzás alapján azonosító
("audio-")   számítógépek   mára   elérték   azt   a   határt,  amelyen  túl
felismerőképességük  már  nem  javítható  tovább. Hasonló határ a szájmozgás
követésében  is  van:  a  hangok kiejtéséhez tartozó ajakforma felismerésére
alapozó  ("videó-")  számítógépek  is zavarba jönnek, ha különböző személyek
beszédét kell megérteniük. Az utóbbi gépekben olyan "alakszűrő" mechanizmust
alkalmaznak,  amely  a  látott  ajakformát  addig  egyszerűsíti,  amíg azt a
számítógép  az  általa  is  felismerhető  alapmotívumok  valamelyikével  nem
azonosítja.

   A  brit  kutatók  ezzel  a  hagyománnyal  szakítva  olyan  új  -  általuk
rostálásnak  nevezett  -  eljárást dolgoztak ki, amely a száj nyitottságához
egy  skálát rendel. Ennek egyik végpontja a csukott, másik végpontja pedig a
teljesen  nyitott,  O  alakú  szájforma.  Andrew  Bangham,  a  kutatócsoport
vezetője  szerint  ez  azért jobb, mint az eloző megoldás, mert a számítógép
könnyebben  alkalmazkodik a különböző személyek eltérő beszédmódjához, ezt a
skálát ugyanis rugalmasan tudja illeszteni a beszélő stílusához.

   A  brit  kutatók azonban nemcsak az e területen hagyományos videótechnika
rendszerező elvét változtatták meg, hanem - hogy fokozzák a beszédfelismerés
hatékonyságát  -  egyesítették  az audiotechnikával is. A számítógépet ezért
mikrofonnal  és kamerával egyaránt felszerelték, s így a gép, ugyanúgy, mint
mi, emberek, a hangot és a szájmozgást együttesen követi.

   A  kutatók  elégedettek  az  első  próbák  eredményével:  a gép tíz ember
beszédéből  egyértelműen  azonosítani  tudta  az ábécé hangzóit, s már olyan
egyszerűbb  szavakat  is  felismert,  mint a yes vagy a no. A jövőt illetően
Bangham  derűlátó:  úgy véli, a gépnek immár "van szeme a látásra, és füle a
hallásra",  s  idő  kérdése  csupán,  hogy  a  türelmes  tanítás  meghozza a
gyümölcsét.
Google
 
Web iqdepo.hu
    © Copyright 1996-2024
    iqdepo / intelligence quotient designing power - digitális kultúrmisszió 1996 óta
    All rights reserved. Minden jog fenntartva.