A zene, a számítógépes grafika is a kreativitásról, a tökéletesség kereséséről szól

A fény viselkedését leíró matematikai algoritmusokat kutatja a BME mérnök-informatikusa, akinek tudományos eredményei óriási előrelépést hozhatnak a valósághű számítógépes grafikai ábrázolásban.

„A számítógépes grafika a számítógép-tudomány egyik legszebb ága, amely összefogja a tényekre és az adatokra összpontosító műszaki tudást, mellette pedig teret ad a kreativitásnak és a művészi érzéknek” – magyarázta Zsolnai Károly, a BME Villamosmérnöki és Informatikai Kar mérnök-informatikusa, aki jelenleg a Bécsi Műszaki Egyetem (Technische Universität Wien) PhD-hallgatója és oktatója. A fiatal mérnök a fénysugarak viselkedését szimulálja, és egy olyan algoritmus megalkotásán dolgozik, amely a lehető legjobban írja le a fény, mint elektromágneses hullám viselkedését.

Élethű bőrábrázolás a jövő háromdimenziós videojátékaiban

Zsolnai Károly fontos szerepet vállalt annak a nemzetközi kutatócsoportnak a munkájában, amely a számítógépes grafikával megjelenített karakterek ábrázolását vizsgálja. A Műegyetem mérnöke úttörő eredményeket ért el a valósághű háromdimenziós megjelenítésben fényszimulációs algoritmusával, ahol ma már a tized- és századmilliméteres részletekért folyik a harc a piaci forgalmazók között.
A fiatal feltaláló és kutatócsoportjának eredményei megoldást jelenthetnek az ún. „rejtélyes völgy” (angolul uncanny valley) problémájára. Ez utóbbi arra a tapasztalatra épül, miszerint minél élethűbben jelenítenek meg egy ember formájú robotot vagy egy számítógépes alakot, az emberi agy annál könnyebben befogadja azt. Az elfogadást ábrázoló görbén észlelhető „zuhanást” nevezik rejtélyes völgynek, azt a keskeny mezsgyét, ahol az ábrázolt karakter valóságos, ám még nem elég emberszerű, így a felhasználó inkább félelmetesnek, ijesztőnek találja azt. Az így megjelenített karaktert az emberi agy idegenebbnek véli, mint az elnagyolt, sokkal inkább „meseszerűen ábrázolt” alakokat.
Zsolnai Károly kutatócsoportja egy korábbi, a fénysugarak mozgását leíró algoritmust alkotott újjá, és létrehozta a „Separable Subsurface Scattering” (SSSS) elnevezésű eljárást. A fiatal műegyetemi mérnök „térfogati fényszóródás” kifejezéssel magyarázta a fogalmat, ami egy olyan digitális eljárás, amely a megvilágított tárgyak belsejébe jutó fény viselkedését modellezi. A BME mérnöke szerint a hagyományos grafikai algoritmusok egyszerű felületként kezelik az objektumokat, amelyek e felületek közvetítésével érintkeznek a fotonokkal, ám sok olyan anyag létezik, amelyek nemcsak visszaverik, hanem egyidejűleg áteresztik vagy elnyelik a fénysugarakat. Ilyenkor a tárgyak belsejében több irányban, és akár több ezer alkalommal szóródik szét a fény. Az új eljárás az anyagok felszínének, vastagságának és kiterjedésének a figyelembe vételével számolja ki a fotonok útját. Az eredmény az anyagok valósághű számítógépes grafikai ábrázolása olyan érzékeny esetekben, mint az emberi bőr, a márvány, a levélerezet stb. Ahogyan Zsolnai Károly fogalmazott, „az algoritmussal a természetes megvilágítást igyekszünk szimulálni virtuális környezetekben”. Tudományos eredményeire több nemzetközi vállalatóriás, köztük a Disney, valamint az egyik legjelentősebb 3D-s számítógépes játékokat forgalmazó cég, az Activision Blizzard is felfigyelt, és közös munkára kérték fel a műegyetemi mérnököt.

Separable Subsurface Scattering: az emberi bőr szimulációja térfogati szóródás nélkül (jobb alul), és térfogati szóródással (jobb felül). Forrás: Zsolnai Károly / Activision Blizzard

„Kézzel fogható, kreatív és innovatív algoritmusokat igyekszünk létrehozni” – legfőképpen ezt szereti Zsolnai Károly a munkájában, amely számos tudományterület ismereteit egyesíti, kezdve a valószínűség-számítástól egészen a nukleáris fizikáig. „Úgy érzem, hogy ezt a területet mintha rám szabtak volna” – fejtette ki, hozzátéve, hogy nap, mint nap használja az egyetemen megszerzett széleskörű tudását. „A legtöbb diák a programozás miatt választja a mérnök-informatikus szakot. Specializálódnak valamilyen technológiára, programozási nyelvre, és erre alapozzák későbbi hivatásukat, holott rengeteg egyéb feladat megoldására lehet használni a BME-n oktatott átfogó mérnöki tudást. Többségük nehéz és túlságosan szerteágazó szakterületnek tartja a számítógépes grafikát. Nekem pont ez a sokszínűség és strukturáltság tetszett meg” – idézte fel, azzal, hogy már az első nap elvarázsolta a műegyetemi közeg. Példaértékűnek tartja a BME szakmai és közösségi életét, amely – ahogy fogalmazott – „az első perctől körülveszi a hallgatókat”. A fiatal kutató szerint a tanulás egy keveseknek megadatott kiváltság, amelyhez szorgalom, elszántság és biztos, nyugodt családi háttér szükséges. „Nagyon gyenge tanulmányi háttérrel érkeztem, és hálás vagyok azért, hogy a BME-re járhattam” – jegyezte meg Zsolnai Károly, kiemelve a műegyetemi matematikai oktatás erősségét, amely nemzetközi viszonylatban is megállja a helyét. „Amikor külföldön megkérdezték, hogy hol szereztem a diplomámat, a legtöbbször az volt a reakció, hogy akkor a matematikával biztosan nem lesz gondom” – osztotta meg a jelenleg Bécsben tanuló és oktató szakember, aki úgy tartja, a kutatói pályáján komoly versenyelőnnyel indult a BME-n szerzett ismereteivel.

Megismerkedését a számítógépes grafikai technikákkal egykori műegyetemi oktatójának, Szirmay-Kalos Lászlónak köszönheti. Közös kutatásukban olyan módszert dolgoztak ki, amellyel a térben (például egy ház belsejében) mozgó fénysugarak útját lehet szimulálni, gyorsabb és pontosabb képmegjelenítést eredményezve az eljárással. „Már létező algoritmusokat vizsgáltunk, amelyek közül egyik sem volt tökéletes. Az előnyök és hátrányok feltérképezésével azon dolgoztunk, hogy a pozitív tulajdonságokat egyetlen modellben egyesítsük” – összegezte a témában folytatott egyik első kutatását Zsolnai Károly, aki tudományos eredményeit 2013-ban Szirmay-Kalos Lászlóval az egyik legnívósabb nemzetközi számítógépes grafikával foglalkozó konferencián mutatta be a spanyolországi Girona-ban.

Egy "BME-IIT" márkájú karóra modellezése az említett munkából, fotorealisztikus képszintézissel. Forrás: Kai Schwebke / Zsolnai Károly

„A legtöbb mérnökhöz képest más szemlélettel közelítek a munkámhoz. A száraz számokat és formulákat intuícióval, érzésekkel próbálom megtölteni: „elképzelem és ízlelgetem” az egyenleteket.” – ecsetelte Zsolnai Károly, aki zongorán, gitáron és basszusgitáron játszó hobbizenészként művészi alkotásvágyát is társítja hivatásával. A zene és a matematika egyszerre játszik meghatározó szerepet az életében: „a matematika olyan, mint a zene: strukturált és szabálykövető rendszerek, mindkettő egy univerzális nyelv, az emberi intelligencia közlésének kifinomult módja”. (Az alábbi videóban a képanyag a térfogati fényszóródásos algoritmusukat mutatja be, a hanganyagon pedig Károlyt hallhatjuk zongorázni egy klasszikus Disney-dalt.)

Példaként tekint elméleti oktatójára, Friedl Katalinra (BME VIK, Számítástudományi és Információelméleti Tanszék), aki „a matematikát a száraz elmélet ellenére ízesen és intuitívan tanítja. Hasonló elveket vallok én is” – fejtette ki Zsolnai Károly. Élvezettel tölti el, ha kreatív emberekkel dolgozhat együtt olyan feladatokon, amelyekben egyesül a tudomány és a művészet. „A mérnök megalkotja a virtuális világot és modellezi a fizikai törvényeket, de ugyanakkora szükség van a művészre, aki életet lehel az üres terekbe.” – magyarázta. Fényszimulációs kísérleteinek elvét például autó- és ékszerreklámok készítésénél, épületek látványterveinek megalkotásánál, orvosi képalkotó-diagnosztikai eljárásoknál, sőt számos hollywood-i produkcióban is alkalmazzák. „A „Trónok harca” című sorozat alkotói például tisztán számítógépes grafikai eljárásokkal készült városrészleteket jelenítenek meg, amelyek a valóságban nem is léteznek” – magyarázza Zsolnai Károly.

Sok autóreklámban észre sem vesszük, hogy valójában nem „igaziak”, hanem fotorealisztikus képszintézissel készültek. Forrás: Jan Kudelasek / Octane Render

Károly nemrégiben nyert közel 100 millió forint értékű állami támogatást Ausztriában új kutatási projektjéhez, amelyben a mesterséges intelligencia segítségével dolgoznak ki megoldásokat új és komplex grafikai problémákra. Két PhD-hallgatójával olyan „tanítható” algoritmusok kifejlesztésén dolgozik, amelyek a rosszabb minőségű, „zajos” képek élességén fényszimulációs módszerekkel képesek javítani. Jelenleg a Walt Disney cég kutatócsoportjával is együtt dolgozik a jövő animációs filmjei élethű megjelenítésének továbbfejlesztésén.

Fotó: Bergics Balázs Fotográfia

A jelenleg Bécsben kutató és oktató szakember aktív kapcsolatot ápol egykori műegyetemi tanítóival, és figyelemmel kíséri a hazai tudományos élet alakulását a szakterületén. Fiatal kora nem jelent számára akadályt, hiszen tudatosan építette a karrierjét, és úgy véli, „a tudományos világ igazi szépsége, hogy életkortól, nemtől és származástól függetlenül magas szinten művelhető”.  Fontosnak tartja, hogy a tanulás ne csak kevesek kiváltsága legyen, ezért a Bécsi Műszaki Egyetemen oktatott, a fényszimulációval és a végtelen dimenziós integrálok megoldásával foglalkozó angol nyelvű kurzusát ingyenesen elérhetővé tette az interneten – a műegyetemi diákok számára is.

Zsolnai Károly

2013-tól a Bécsi Műszaki Egyetem (Technische Universität Wien) PhD-hallgatója (szakterülete: modern funkcionálanalízis alkalmazása számítógépes grafikai problémákra)
2013-ban a Disney Research kutató-fejlesztő gyakornoka
2011-2012-ig mérnök-informatikus MSc-képzés a BME Villamosmérnöki és Informatikai Karán (szakdolgozatának témája: Valós idejű folyadékszimuláció és irányítás a Navier-Stokes egyenletek használatával)
2012-től LuxRender fejlesztő
2010-ben a Lichthof Productions kutató-fejlesztő mérnöke
2008-2009-ig az Ericsson kutató-fejlesztő mérnöke
2007-2010-ig mérnök-informatikus BSc-képzés a BME Villamosmérnöki és Informatikai Karán (szakdolgozatának témája: Procedurális ecsetminta generálás Markov mezőkkel, filmipari alkalmazás céljaira) A munkát a Pro Progressio Alapítvány 2011-ben a BME Villamosmérnöki és Informatikai Kar legjobb szakdolgozatának választotta.

- TZS -

Fotó, illusztráció: Zsolnai Károly