ITeuro
Google překladač: English Deutsch

Stačí vyfotit dům a AI dopočítá střechu – doktorandi FEL ČVUT vítězí ve světové soutěži

Pátek, 26 Červen 2026 12:47

Tags: 3D model | ČVUT | FEL | S23DR | Soutěž | Umělá inteligence | Urban Scene Modeling

fel cvut-two stage 01be0610fd5--2626Dok­to­ran­di Fa­kul­ty elek­tro­tech­nic­ké ČVUT v Praze Mi­roslav Pur­krá­bek a Jan Škvr­na zví­tě­zi­li v me­zi­ná­rod­ní sou­tě­ži Structu­red Se­man­tic 3D Re­con­structi­on (S23DR), která pro­běh­la v rámci worksho­pu Urban Scene Mo­de­ling na kon­fe­ren­ci CVPR 2026 v ame­ric­kém De­n­ve­ru. CVPR je po­va­žo­vá­na za jednu z nej­pres­tiž­něj­ších svě­to­vých kon­fe­ren­cí v ob­las­ti po­čí­ta­čo­vé­ho vi­dě­ní a podle Go­o­gle Scho­lar Me­t­rics jde o nej­ci­to­va­něj­ší kon­fe­ren­ci na světě.

Ví­těz­ství v kon­ku­ren­ci při­bliž­ně tři­ce­ti účast­ní­ků z ce­lé­ho světa při­nes­lo týmu z ka­ted­ry ky­ber­ne­ti­ky také fi­nanč­ní od­mě­nu ve výši 5000 do­la­rů. Pro vý­zkum­nou sku­pi­nu vi­zu­ál­ní­ho roz­po­zná­vá­ní (VRG) jde o vý­znam­ný úspěch – čle­no­vé sku­pi­ny zví­tě­zi­li ve všech třech do­sa­vad­ních roč­ní­cích této me­zi­ná­rod­ní sou­tě­že.

MiroslavPurkrabekJanSkvrna FotoNeugebauerPetrFELCVUT-2626

Sou­těž S23DR byla za­mě­ře­na na re­kon­struk­ci struk­tu­ro­va­né­ho 3D mo­de­lu stře­chy domu ze série fo­to­gra­fií po­ří­ze­ných ze země. Cílem ne­by­lo vy­tvo­řit pouze vi­zu­ál­ně pů­so­bi­vý model, ale přes­ný a mě­ři­tel­ný popis ge­o­me­t­rie stře­chy ve formě vr­cho­lů a hran, který lze dále vy­u­žít v praxi.

Prak­tic­ky si to lze před­sta­vit tak, že člo­věk obe­jde dům a vy­fo­tí ho mo­bil­ním te­le­fo­nem z ně­ko­li­ka úhlů a sys­tém z fo­to­gra­fií vy­tvo­ří přes­ný 3D model stře­chy. Ta­ko­vý model pak může slou­žit na­pří­klad pro plá­no­vá­ní in­sta­la­ce so­lár­ních pa­ne­lů, vý­po­čet plo­chy stře­chy, re­kon­struk­ce nebo po­jiš­ťo­va­cí účely.

Umělá inteligence doplňuje chybějící informace

Úloha ne­by­la jed­no­du­chá. Vstup­ní data ob­sa­ho­va­la pouze ome­ze­né množ­ství pro­sto­ro­vých bodů zís­ka­ných z fo­to­gra­fií. Část stře­chy navíc ze země není vidět a data ob­sa­hu­jí šum a ne­přes­nos­ti.

fel cvut-two stage cad034481c0--2626

Nej­pr­ve se z fo­to­gra­fií od­had­ne pro­sto­ro­vá struk­tu­ra scény a vznik­ne řídký a ne­přes­ný 3D model. Ten ale pro prak­tic­ké po­u­ži­tí ne­sta­čí. Právě zde na­stu­pu­je náš model umělé in­te­li­gen­ce, která se naučí z ne­ú­pl­ných dat od­had­nout sku­teč­ný tvar stře­chy a vy­tvo­řit její struk­tu­ro­va­ný model.

Sou­těž ne­by­la aka­de­mic­kým cvi­če­ním bez prak­tic­ké­ho do­pa­du. Spon­zo­ro­va­la ji spo­leč­nost Hover, která po­dob­né tech­no­lo­gie na­sa­zu­je u svých zá­kaz­ní­ků a dlou­ho­do­bě hledá způ­so­by, jak je­jich přes­nost dále zvy­šo­vat. Účast­ní­ci proto ře­ši­li re­ál­ný pro­blém z praxe – jak z ome­ze­né­ho množ­ství fo­to­gra­fií co nej­přes­ně­ji re­kon­stru­o­vat sku­teč­ný tvar stře­chy. Právě ta­ko­vé sou­tě­že umož­ňují fir­mám zís­kat in­spi­ra­ci z nej­no­věj­ší­ho aka­de­mic­ké­ho vý­zku­mu a vý­zkum­ní­kům ově­řit své me­to­dy na pro­blé­mech, které mají přímé ko­merč­ní vy­u­ži­tí.

Drama do posledních sekund

Sou­tě­že se zú­čast­ni­lo při­bliž­ně tři­cet sou­tě­ží­cích z ce­lé­ho světa. Nej­vět­ším kon­ku­ren­tem čes­ké­ho týmu byla švéd­ská Lund Uni­ver­si­ty.

Po­sled­ní dny byly velmi na­pí­na­vé. Lund Uni­ver­si­ty mělo mi­mo­řád­ně silné ře­še­ní. Když dok­to­ran­di Fel ČVUT ně­ko­lik dní před uzá­věr­kou za­ča­li ode­sí­lat své nej­lep­ší mo­de­ly, zjis­ti­li ve ve­řej­ném žeb­říč­ku, že jsou velmi blíz­ko špič­ce. Sou­pe­ři ale zá­ro­veň své vý­sled­ky dále zlep­šo­va­li.

Na­ko­nec roz­ho­do­va­ly do­slo­va ti­sí­ci­ny bodu. Ještě dů­le­ži­těj­ší však byl vý­sle­dek na skry­tém tes­to­va­cím da­ta­se­tu, který or­ga­ni­zá­to­ři po­u­ži­li k fi­nál­ní­mu vy­hod­no­ce­ní. Právě zde se uká­za­la hlav­ní vý­ho­da ře­še­ní vy­vi­nu­té­ho na FEL ČVUT – schop­nost správ­ně fun­go­vat i na dosud ne­vi­dě­ných da­tech.

Na ve­řej­ných da­tech byly vý­sled­ky téměř ne­roz­li­ši­tel­né. Roz­ho­du­jí­cí byla až skry­tá sada dat, která ově­řo­va­la, zda model do­ká­že správ­ně re­kon­stru­o­vat i nové domy a si­tu­a­ce, se kte­rý­mi se během tré­no­vá­ní ne­se­tkal.

Or­ga­ni­zá­to­ři hod­no­ti­li nejen přes­nost re­kon­struk­ce, ale také vý­po­čet­ní ná­roč­nost. Celý tes­to­va­cí da­ta­set musel být zpra­co­ván v pře­de­psa­ném ča­so­vém li­mi­tu dvou hodin. Nešlo jen o to vy­tvo­řit co nej­vět­ší model. Dů­le­ži­tá byla kom­bi­na­ce přes­nos­ti, rych­los­ti a ro­bust­nos­ti. Ře­še­ní dok­to­ran­dů FEL ČVUT do­ká­že zre­kon­stru­o­vat jeden dům během ně­ko­li­ka vte­řin a fun­go­va­lo i na běž­ném no­te­boo­ku.

Za­jí­ma­vos­tí je, že ví­těz­ný tým z FEL ČVUT a druhý tým z Lund Uni­ver­si­ty do­sáh­ly téměř shod­ných vý­sled­ků po­mo­cí zcela od­liš­ných tech­nic­kých pří­stu­pů.

Třetí vítězství VRG ve třetím ročníku soutěže

Úspěch na­va­zu­je na před­cho­zí ví­těz­ství členů Vi­su­al Re­co­gni­ti­on Group v této sou­tě­ži, která je po­řá­dá­na tře­tím rokem. Jan Škvr­na zví­tě­zil již loni  a v prv­ním roč­ní­ku uspěl Denis Ro­zum­nyi, rov­něž spo­je­ný s VRG. Vý­sle­dek tak po­tvr­zu­je dlou­ho­do­bou ex­per­ti­zu sku­pi­ny v ob­las­ti 3D re­kon­struk­ce a po­čí­ta­čo­vé­ho vi­dě­ní.

Workshop sdru­žu­je špič­ko­vé lidi z in­sti­tu­cí a firem, jako jsou mimo jiné TU Mu­nich, ETH Zu­rich a Go­o­gle. Je po­tě­šu­jí­cí, že se dok­to­ran­dům FEL ČVUT daří v této sou­tě­ži uspět opa­ko­va­ně. Uka­zu­je to, že nejde o jed­no­rá­zo­vý úspěch, ale o dlou­ho­do­bou kva­li­tu vý­zku­mu ve sku­pi­ně.

Workshop Urban Scene Mo­de­ling (USM3D), v jehož rámci sou­těž pro­běh­la, sdru­žu­je před­ní svě­to­vé od­bor­ní­ky na 3D re­kon­struk­ci, di­gi­tál­ní dvoj­ča­ta měst, fo­to­gra­m­me­t­rii a po­čí­ta­čo­vé vi­dě­ní. Koná se jako sou­část kon­fe­ren­ce CVPR 2026, která před­sta­vu­je jednu z nej­vý­znam­něj­ších svě­to­vých udá­los­tí v oboru umělé in­te­li­gen­ce a po­čí­ta­čo­vé­ho vi­dě­ní.


Mohlo by vás zajímat: