Algoritmus ručního sledování společnosti Google v reálném čase využívá smartphone ke zlepšení rozpoznávání znakové řeči

Tech / Algoritmus ručního sledování společnosti Google v reálném čase využívá smartphone ke zlepšení rozpoznávání znakové řeči 2 minuty čtení Ruční sledování v reálném čase

Ruční sledování v reálném čase



Znakovou řeč používají miliony lidí po celém světě. Vědci pracovali na vývoji technologií, které dokáží porozumět gestům a automaticky je převést do srozumitelného jazyka. Tyto projekty však nezískaly obrovský úspěch, pokud jde o přesnost.

Google nedávno vyvinul algoritmus, který lze použít ke sledování rukou v reálném čase. Inteligentní systém využívá strojové učení k vytvoření mapy ruky. Mapa je vytvořena pomocí fotoaparátu nebo smartphonu. Nemůžeme popřít skutečnost, že většina systémů nedokáže přesně zachytit rychlé pohyby rukou. Google se tímto problémem konkrétně zabýval v tomto výzkumu. Zajímavé je, že omezili množství dat, která byla dříve zpracována algoritmy.



Jak funguje ruční sledování v reálném čase?

Většina stávajících projektů překládá znakovou řeč detekcí velikosti a polohy celé ruky. S tímto výzkumem. vědci eliminovali potřebu zpracovávat obdélníkové tvary v různých velikostech. Systém Google právě rozpoznává dlaň čtvercového tvaru. Zadruhé, pro prsty se provádí samostatný proces analýzy.



Google

Gesta rukou



Výzkumníci použili k trénování algoritmu strojového učení přibližně 30 000 ručních obrázků. Tyto snímky byly pořízeny za různých světelných podmínek a póz. Systém poté detekuje gesto porovnáním pozice ruky a seznamu známých entit, jako je míč nebo štěstí. Google popisuje rozpoznávání gest v a příspěvek na blogu .

Poté namapujeme sadu stavů prstů na sadu předdefinovaných gest. Tato přímá, ale účinná technika nám umožňuje odhadnout základní statická gesta s přiměřenou kvalitou. Existující kanál podporuje počítání gest z více kultur, např. Američané, Evropané a Číňané a různé ruční značky, včetně „Palec nahoru“, sevřená pěst, „OK“, „Rock“ a „Spiderman“.

Konečný algoritmus sledování ruky vytváří nejmodernější výsledky, pokud jde o jeho rychlost a přesnost. Algoritmus ke spuštění používá framework MediaPipe. Tato technika se jeví jako zásadní pokrok v doméně znakového jazyka. Přesto stále existuje velký prostor pro zlepšení. k lepšímu porozumění znakové řeči. Kdokoli může tuto práci rozšířit o použití výrazů obličeje a obou rukou k dosažení lepších výsledků.



I když o společnosti Google není ani slovo, existuje možnost, že Google může vylepšit tuto technologii sledování rukou v reálném čase, aby ji mohla používat ve svých produktech. Mezitím, pokud si chcete s kódem pohrát, je veřejně k dispozici na GitHubu .

Značky Google