2D a 3D analýza pohybu
Sportovní fakulta Masarykovy univerzity
Mgr. Martin Sebera, Ph.D.

Zpracování obrazu

Pravidla měření a ostatní základní pojmy zpracování obrazu jsou popsána v BAUMANNOVI (v BALLREICH et al, Trainingswissenschaft 1, Bad Homburg 1992, strany 81–92).

Tato kapitola popisuje požadavky, které musí být splněny, aby mohlo být analýzy obrazu použito efektivně, k dosažení smysluplných výsledků.

Ve srovnání s většinou ostatních metod měření má analýza obrazu tu výhodu, že nemá přímý negativní dopad. To znamená: stanovení kvantitativních rozměrů prostřednictvím měřícího systému nemá žádný dopad na chování měřeného objektu (vyjádřeno ve fyzikálních termínech: měřením není objektu odčerpána žádná energie). A to protože samotné měření není prováděno na konkrétním objektu, ale na jeho obrazu.

Pro nejjednodušší měřící techniku představuje tento fakt jednu nevýhodu: trojrozměrný objekt je zobrazen ve dvou dimenzích. Tato nevýhoda je akceptovatelná, jestliže máme zájem pouze o dvě dimenze, např. pro určení nejvyššího skoku, rozběhové rychlosti při skoku dalekém nebo odrazový úhel. Při nahrávání těchto pohybů je důležité, aby tyto pohyby byly kompletně popsány v jedné rovině. Abychom se vyhnuli chybám plynoucím z toho, že se určité části těla pohybují mimo rovinu pohybu, kamera by měla být umístěna dostatečně daleko od této roviny pohybu. Fyzikální rozměry zaznamenané tímto měřením jsou v prvé řadě kinematografickými rozměry (vzdálenost, čas, rychlost, zrychlení, úhly).

Nahoru

Kinematická analýza

Pohyb je z fyzikálního hlediska chápán jako změna souřadnic v určitém časovém rozpětí. Tento souřadnicový systém může být nejprve libovolně zvolen a následně upraven.

Jsou zde však dva základní požadavky:

souřadnicový systém
časové údaje

Nahoru

Souřadnicový systém

Slouží ke stanovení vztahu mezi aktuálními (reálnými) řádovými hodnotami, přičemž záběr je vyhodnocen později. Pojem souřadnicový systém je stejně jako pojem kalibrační systém běžným tématem, vyskytujícím se v literatuře, pojednávající o zpracování obrazu. Tyto dva pojmy spolu souvisejí následujícím způsobem. Kalibrační systém vymezuje prostor (ve tří-dimenzionální analýze), nebo plochu (ve dvoudimenzionální analýze), kde se odehrává pohyb. Souřadnicový systém je matematický prostředek, pomocí něhož je možné vypočítat skutečné prostorové rozměry.

Pro osobu provádějící měření není vztah mezi kalibračním a souřadnicovým systémem důležitý. Tento vztah je pevně stanovený softwarem, který zpracovává prvotní data. Jako kalibrační systém lze použít dvě měřící tyče známé délky, které jsou navzájem kolmé a dobře viditelné na záběru. Měly by samozřejmě být na místě (nebo přinejmenším v bezprostřední blízkosti místa), kde se daná akce odehrává.

Je dostačující, pokud je kalibrační systém viditelný pouze na jednom obrázku, jestliže je zajištěno, že po nastavení kamery (ohnisková vzdálenost, pozice, zaostření, ohnisková rovina) už toto nebude změněno.

Poznámka: existují volitelné programové moduly, které umožňují nahrávání pohybů pomocí kamery, která disponuje posuvnými a zvětšovacími možnostmi.

Velikost obrazu se mění v závislosti na zvolené ohniskové vzdálenosti. Můžeme dosáhnout toho, že 100 metrů ve skutečnosti lze vyjádřit 1 milimetrem na obrázku.

Výběr obrazu záleží čistě na potřebách a zájmech osoby, která provádí měření. Je však třeba vzít v úvahu následující body:

rovina pohybu musí vyplňovat co největší plochu obrazu (tyče zvolené jako kalibrační systém by také měly vyplňovat co největší část obrazu),
měla by existovat dostatečná vzdálenost mezí rovinou pohybu a ohniskovou rovinou (použijte zoom)

Nahoru

Časové údaje

Sdělují nám detaily o tom, kdy byl záběr pořízen. Tato informace může být uvedena buď jako absolutní hodnota (např. 3. ledna 2007 ve 4:27, 12 sekund a 312 milisekund) nebo jako relativní hodnota (0,01 sekund po předchozím záběru). Abychom získali tato data, musí být na záběru zobrazen přesný časoměřič, nebo musí být znám časový rozdíl mezi snímky. Pro většinu otázek týkajících se kinematické analýzy je důležitější relativní časová hodnota. Je to dáno frekvencí snímků použitého nahrávacího systému. Pro videonahrávání se jedná o 25 kompletních snímků za sekundu, nebo 50 políček za sekundu (PAL), nebo 30/60 (NTSC). Poznámka: Pro nahrávání pohybu SIMI Motion také dovoluje použití vysokorychlostních kamer.

Nahoru

Dvou- a tří-rozměrné nahrávky

Jestliže je pohyb nahráván pouze jednou kamerou, pak může být uspokojivých výsledků dosaženo pouze ve dvourozměrné rovině. Úsilí spojené se získáním třírozměrných výsledků je značné a musí být provedeny jisté předpoklady, což může vést k podstatnějším nepřesnostem. K řešení problémů ve 2D je nutné následující vybavení:

jedna kamera
kalibrační systém, který se skládá ze dvou měřících tyčí známé délky, které jsou vzájemně v pravém úhlu

K řešení problémů ve 3D je nutné následující vybavení:

nejméně dvě kamery, jejichž optické osy by měly být v úhlu mezi 60 a 120 stupni
tyto dvě kamery by měly být schopny současného snímání záběrů
kalibrační systém, který je tvořen prostorovým 3D objektem (kvádr, jehlan, krychle atd.).
Pozice rohů tohoto 3D objektu musí být známá.

Nahoru

Problémy související s analýzou obrazu

Poté co byl pohyb nahrán, může být provedena analýza záběru. Abychom ji mohli provést, musí být určeny body na těle a nebo body, které jsou určitým způsobem důležité pro vykonání pohybu např. tenisový míč, fotbalový míč, body na tenisové raketě nebo golfové holi atd. Použitými body na těle jsou většinou průsečíky kloubních os, nebo jejich středy. Při tomto určování můžeme narazit na tři hlavní zdroje omylů:

osy kloubů nemohou být jasně definovány
průsečíky os nelze na záběru jasně rozlišit
průsečíky jsou skryty za ostatními částmi těla a na záběru nejsou viditelné

Řešení

pouze precizní znalost anatomie může minimalizovat tento omyl
průsečíky lze označit jasně kontrastní barvou
střed kloubů musí být interpolován, popřípadě odhadnut

Chyby a tolerance chyb

chyby v určování časového rozpětí mezi jednotlivými snímky záznamu
chyby v určováni pozice měřených bodů
kumulativní chyby, které nastanou, když k výpočtům použijí nesprávné hodnoty, např. rychlost = vzdálenost/čas, přičemž naměřené hodnoty vzdálenosti i času jsou obě nepřesné.

Rozsah těchto chyb může být vyjádřen jako matematická funkce citlivosti použitého filmu, přesnosti snímací metody, přesnosti určení ohniskových bodů při měření, chyb vzniklých při zaznamenáváni času atd. Různorodost těchto faktorů ukazuje, jak komplikované mohou tyto výpočty být.

V praxi je dostačující, že tolerance chyb jsou zjištěny s odvoláním na známé vnější hodnoty. Jestliže je například známá hodnota vzdálenosti mezi vrchním hlezenním kloubem a kolenním kloubem, potom musíme dospět ke stejné hodnotě i po sejmutí obrazu a provedení výpočtů.

Nahoru

Rozlišení kamery

Při použití kamery je realita zobrazena jako série elektronických a fotografických obrazů (film). Toto je předmětem následujících omezení:

reálné 3D objekty jsou znázorněny v jedné rovině (ohnisková rovina)
velikost tohoto znázornění v rovině obrazu není skutečná
nahrávání není plynulé, ale děje se v určitých intervalech, například 25krát za sekundu

Při pozdějším vyhodnocování záznamu se mohou projevit vzniklé problémy a můžeme zvážit jejich řešení:

hloubka informací je ztracena. Tato ztráta může být kompenzována použitím několika kamer a kombinací informací z nich dosažených (viz Kapitola o kalibraci). Avšak pořízení několika nahrávek předpokládá větší úsilí a práci.
velikost ohniskové roviny je omezena. Pouze určitý počet pixelů je k dispozici v horizontálním i vertikálním směru. Jedná se o rozlišení konkrétní použité kamery nebo filmu. Obvyklá rozlišení jsou 768 × 576 a také 640 × 480 pixel. Čím větší je rozlišení, tím přesněji může být pohyb zaznamenán.
pro každý obrázek zaostřuje kamera veškeré světlo procházející čočkou za určitý časový úsek (doba expozice). Doba expozice musí být co nejkratší, jinak se posuzovaný předmět posune příliš daleko což má za následek rozmazaný obraz. Obvyklá doba expozice při použití běžné videokamery (50 polí za sekundu) je 1/500 sekundy.
časový interval mezi dvěma následujícími snímky je relativně dlouhý (např. 50 snímků za sekundu znamená, že snímek je pořízen každých 0.020 s; mimo dobu expozice, která trvá 0.002 s, zůstává snímek neosvětlen po dobu 0.018s). Jakákoliv informace o pohybu mezi dvěma snímky je ztracena a lze ji pouze odhadovat. Jedná se o časové rozlišení použité kamery. Čím větší je časové rozlišení, tím více informací je k dispozici.

Nahoru

Bodové rozlišení

Bodové rozlišení kamery a velikost snímané plochy do značné míry udávají přesnost souřadnic: předpokládáme-li, že kamera může nahrát plochu 7 metrů na šířku, pak při použití kamery s normálním rozlišením 768 × 576 odpovídá jeden pixel jednomu centimetru. Je možné měřit v sub-pixelovém rozmezí za použití příslušných procesů analýzy obrazu, ale vzhledem k užitému systému je třeba počítat s odchylkou několika milimetrů. Přesnějších výsledků může být dosaženo jestliže je snímaná plocha omezena.

Nahoru

Časové rozlišení

Pro přesné měření musí být rychlost kamery přizpůsobena rychlosti pohybu: Jestliže je například použita standardní kamera (50 snímků za sekundu) k nahrání sprintera běžícího rychlostí 8 metrů za sekundu, pak se například kyčel pohne přibližně o 16 centimetrů a ruce a chodidla se mohou posunout až o 30 centimetrů! Přesný záznam pohybu pak pomocí této metody není možný. Zvláštní pozornost je třeba věnovat také raketám (golfová, tenisová, badmintonová) a míčům (tenisový, volejbalový).

Nahoru

Úplné snímky a pole

Standard evropské videokamery je PAL (768 × 576 pixelů, 25 snímků za sekundu), v Severní Americe je to NTSC (640 × 480 pixelů, 30 snímků za sekundu).

Oba typy kamer nahrávají v prokládaném módu, což znamená, že v první expozici (první pole) jsou nahrány sudé řádky (0, 2, 4, 6, 8, …) a ve druhé expozici (druhé pole) následující liché řádky (1, 3, 5, 7, 9, …)

Obr. 1 Tato dvě pole vytváří typický „efekt laťkového plotu“

Jestliže například sledujeme rychle se pohybující ručičku na ciferníku, je celkem jasné, že je v prvním poli (sudá čísla) ručička na jiném místě, než v druhém poli (lichá čísla). Toto je často nazýváno „efekt laťkového plotu“.

Obr. 2 Oddělená pole (vlevo) a interpolace chybějících čar (vpravo)

Kvůli analýze dokáže software SIMI Motion oddělit tato dvě pole, doplnit chybějící čáry díky interpolaci a zobrazit je jeden po druhém. Takto jsme schopni efektivně dosáhnout 50 (PAL) nebo 60 (NTSC) snímků za sekundu.

Poznámka: každé pole má pouze vertikální rozlišení, takže záběr může být zrnitý.

Ostatní kamery (např. vysokorychlostní kamery) obvykle nepoužívají tuto techniku polí. Namísto toho snímají kompletní záběry v doporučené frekvenci (např. 100Hz).

Nahoru

Synchronizace kamer

Abychom mohli vypočítat 3D souřadnice bodu, nestačí znát jeho polohu na jediném video záznamu. Požaduje se přinejmenším jeden další záznam, který ukazuje pozici bodu v přesně stejném čase ale z jiné perspektivy.

Jestliže pro nahrávku použijeme dvě standardní kamery, je velmi nepravděpodobné, že začnou snímat ve stejném čase. Toto platí zejména pokud mají velmi krátkou dobu expozice. Příklad: Kamera 1 snímá v následujících časových intervalech – 0.000 s – 0.020 s – 0.040 s – 0.060 s… se závěrkou 1/1000 s. Kamera 2 běží nezávisle na kameře 1 a snímá v následujících intervalech – 0,010 s – 0.030 s – 0.050 s … se stejnou závěrkou.

Kyčel člověka, který se pohybuje rychlostí 2 metry za sekundu pokrývá vzdálenost přibližně 2 cm v čase mezi expozicí kamer 1 a 2. Vzhledem k této odchylce nemohou být 3D souřadnice z těchto dvou záběrů přesně vypočteny. I v případě, že ignorujeme všechny ostatní chyby a předpokládáme, že pozice z obou kamer je zprůměrována, i tak nastane chyba v umístění, která je přibližně 1 cm z důvodu odlišné doby expozice. U sprintera (8 m/s) by se jednalo o přibližně 4 cm. Jestliže namísto toho použijeme kamery, které nahrávají rychlostí 200 snímků za sekundu, pak se chyba sníží na 0,25 cm (chodec) a 1 cm (sprinter). Jak vidíme, velikost chyby záleží na rychlosti kamery a snímaného pohybu.

Maximální časový posun mezi dvěma kamerami (v nejhorším případě) je přesně polovina času, který uplyne mezi expozicí dvou následujících snímků.

Zde jsou tři možná řešení tohoto problému:

Spouštění kamer

Existuje několik možností (např. gen-lock), jež všechny spočívají v propojení kamer pomocí speciálních kabelů a jejich spouštění jedním signálem. Některé z metod pouze zaručují, že záběry jsou z kamer snímány simultánně. To nemusí nutně ovlivňovat reálný expoziční čas, který je určen závěrkou. Přesná synchronizace pixelů, nebo alespoň linek je možná pouze s požitím vysoce kvalitních, obvykle digitálních kamer. V každém případě to obnáší značné výdaj.

Užití digitálních kamer

Není možné nastavit standardní kamery v dostatečně krátkém čase (např. protože se musí mechanismus kamery uvést vchod). To ale není případ digitálních kamer. Tyto jsou aktivovány signálem (spoušť) a začínají simultánně s nahráváním. Jestliže jsou všechny kamery aktivovány tímto způsobem ve stejnou dobu, pak je na jedné straně zaručeno, že moment expozice bude simultánní a na straně druhé není třeba určovat souřadnicový systém, protože všechny sekvence kamery začínají stejným záběrem.

Měření časové odchylky

Použitím vhodného elektronického zařízení je možno změřit časovou odchylku mezi kamerami, které nejsou synchronizovány (s přesností 0,0001 s). Toto časové zpoždění pak musí být zahrnuto do matematického výpočtu 3D dat. Tímto může být chyba značně snížena. Nicméně stejně jako v předchozím případě je zde nebezpečí, že bude změřen pouze moment, kdy je pořízen záběr a ne doba expozice (rychlost clony). Nehledě na to se jedná o relativně ekonomické řešení.

Nahoru

Optimalizace rychlosti kamery vzhledem k rychlosti pohybu

Jestliže je pohyb dostatečně pomalý, nebo kamera dostatečně rychlá, pak je chyba tak malá, že je v porovnání s jinými chybami (např. optické rozlišení, kalibrační chyby atd.) zanedbatelná. Maximální časová odchylka mezi dvěma kamerami je přesně polovina času, který uplyne mezi expozicemi dvou ásledujících snímků. Navíc lze předpokládat, že chybu lze zmírnit použitím více než dvou kamer. V každém případě je důležité ve videosekvenci každé kamery určit ty snímky, které mají nejmenší možné časové zpoždění.

Nahoru

Hledání synchronních snímků

Jestliže nejsou k dispozici žádné přesné informace a použité vybavení nezaručuje synchronní nahrávání, pak musíme v každé kameře hledat snímky s nejmenším možným časovým zpožděním.

Zde jsou některá možná řešení:

Optický signál

Počátek měření je určen vytvořením signálu, který je viditelný z každé kamery. Nahrávání pohybu jednotlivými kamerami začíná tímto opticky označeným snímkem, nebo pomocí konstantního časového faktoru. Tento signál se také často užívá k ovládání ostatních měřících zařízení, nebo jimi může být vytvořen, když měření začíná. Problémem v tomto případě je, že maximální časová odchylka mezi dvěma kamerami není přesně polovina snímkové frekvence, ale v nejhorším případě je téměř shodná s celým snímkem (to nastane jestliže je signál vytvořen velmi krátce před začátkem expozice první kamery a velmi krátce po začátku expozice druhé kamery).

Akustický signál

Synchronní zvukový signál je zaznamenán pro každou kameru. Tento signál může být vytvořen buď samotným pohybem (např. úder míčku v golfu), asistentem (např. tlesknutím), nebo elektronicky (např. pípání).

Výhoda elektronických signálů spočívá v tom, že mohou být vygenerovány jinými měřícími zařízeními (viz Optický signál) a neslyšně ale přímo zaznamenány na zvukovou stopu.

Poznámka: Rozvodná krabice, kterou SIMI také nabízí, umí ve stejný okamžik poslat signál všem video zařízením.

Odhadováni na základě zaznamenaného pohybu

V nahrané sekvenci pohybů by mělo být určeno co možná nejvýraznější místo (např. místo dotyku nohy, nebo bod dopadu míčku). Tento časový okamžik pak musí být zadán pro všechny kamery a začátek analýzy nahrazen konstantním časovým faktorem (např. 40 snímků zpět). Nevýhodou této metody je, že zde nemusí být žádný výrazný bod, nebo je velmi obtížné nějaký najít. Navíc se málokdy stane, že se tento výrazný bod v čase objeví přesně během expoziční doby jedné z kamer. Uživatel se pak musí vždy rozhodnout, jestli danému momentu přesněji odpovídá snímek „těsně před“ nebo snímek „těsně po“. Toto má ovšem podstatnou výhodu, že v nejhorším případě je maximální odchylka pouze půl snímku. V určitých případech je dokonce možné přesně odhadnout interval mezi dvěma zmíněnými snímky a tím se vyhnout potřebě použití drahé elektroniky pro měření intervalů mezi snímky (viz výše).

Nahoru

Závěrečné poznámky

Technika zpracování obrazu je ideální metodou pro shromažďování kinematografických parametrů. Matematické techniky umožňují vypočet dat za pomoci prostorových souřadnic z nejméně dvou rovin. Abychom dosáhli uspokojivých výsledků, je třeba splnit pouze několik podmínek. Splnění těchto podmínek může být ověřeno v následujícím seznamu:

je kalibrační systém na záznamu viditelný?
vyplňuje testovaný objekt co největší plochu obrazu?
je znám časový interval mezi snímky?
jsou kamery umístěny tak, že jejích poloha stejně jako nastavení nemohou být během nahrávání změněno?
je osvětlení dostatečné?
jsou body, které mají být později označeny, jasně viditelné?

Jestliže jsou všechny tyto podmínky splněny, pak nic nestojí v cestě úspěšné analýze s použitím SIMI Motion.

Mgr. Martin Sebera, Ph.D. a kolektiv |
Fakulta sportovních studií, Masarykova univerzita |
Návrat na úvodní stránku webu, přístupnost |

| Technická spolupráce:
| Servisní středisko pro e-learning na MU
| Fakulta informatiky Masarykovy univerzity, 2012

Technické řešení této výukové pomůcky je spolufinancováno Evropským sociálním fondem a státním rozpočtem České republiky.

Nahoru

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ