Az nVidia kutatói egy teljesen újfajta tömörítési eljárást mutattak be, ami a hagyományos videó kódolásnál tízszer hatékonyabb: a neurális hálózat segítségével tömörített mozgóképek tized-akkora sávszélességgel is beérik, mint a H.264 kódolású videók. Az új technológia előnyeit elsősorban a műsorsugárzásnál és közvetítésénél, illetve az élő videokonferenciáknál lehet hasznosítani. A fejlesztők az újdonság kutatásához az nVidia Maxine felhő alapú mesterséges intelligencia támogatta videó közvetítő platformot használták.
Kép forrása: nVidia
Az új technológiát egy erősen leszűkített sávszélességű kapcsolaton keresztül mutatták be, ahol azt a hagyományos, H.264 alapú kódolással vetették össze. Míg utóbbinál a kép erősen pixeles és blokkosodó volt, addig a mesterséges intelligencia által tömörített változat viszonylag tiszta és folyamatos lehetett.
Az újfajta eljárás alapja, hogy az egyén arcának kulcspontjait (pl. szem, száj) koordináta adatként küldik át a fogadó félhez, ahol a MI az egyén arcát rekonstruálja és valósidőben a kulcspontadatok alapján animálja. A MI alapú tömörítésnek azonban további előnyei is vannak. Egy példa erre a Free View nevű funkció, ahol a MI platform az egyén fejét virtuálisan úgy fordítja, hogy az mindig pont a kamerába nézzen (még akkor is, ha a valóságban tekintete épp az ablakon ki, a távolba mered). Persze, az arc kulcspontjait arra is fel lehet használni, hogy azokkal egy virtuális karakter arcát mozgassuk – ez nyilván nem újdonság, mivel hasonló megoldások már évek óta használatban vannak a filmiparban.
A mesterséges intelligenciát már korábban is bevetették a videokonferenciát szolgáló szoftverekben, amelyek például arra is képesek voltak, hogy valósidőben helyettesítsék a hátteret, vagy elmossák azt az egyén mögött. Az nVidia megoldásával viszont nem csak ezeket a hátteret érintő módosításokat lehet elvégezni, hanem valósidőben a párbeszéd partnerünket is létrehozhatjuk virtuálisan, ráadásul tetszőleges módosításokkal, akár egyenes, a kamerába néző tekintettel.
Ezek az újfajta technológiák mindig aggodalomra is adnak okot bőven, hiszen a kétségtelen előnyeik mellett visszaélésekre is alkalmat adnak. A fejlesztők ezért két irányban kénytelenek dolgozni: az egyik irány a kutatás és fejlesztés, míg a másik a fejlesztések leleplezésére szolgáló technológiák kidolgozása. (Forrás: dpreview.com)