Google nabízí bezplatné meta-datové sady s algoritmy hlubokého učení AI a strojového učení pro rychlou a efektivní klasifikaci obrázků v TensorFlow a PyTorch

Tech / Google nabízí bezplatné meta-datové sady s algoritmy hlubokého učení AI a strojového učení pro rychlou a efektivní klasifikaci obrázků v TensorFlow a PyTorch 2 minuty čtení

Google Pixel 5?



Google má oznámila dostupnost několika datových sad skládající se z rozmanitých, ale omezených přírodních obrázků. Vyhledávací gigant je přesvědčen, že veřejně dostupná data budou řídit tempo Strojové učení a umělá inteligence a zároveň zkracuje čas potřebný k trénování modelů AI na minimálním množství dat. Google nazývá novou iniciativu „Free Meta-Datasets“, která pomůže modelům AI „naučit se“ za méně dat. „Few-Shot AI“ od společnosti je optimalizována tak, aby zajistila, že se AI učí nové třídy pouze z několika reprezentativních obrázků.

Pochopil, že je potřeba rychle trénovat modely umělé inteligence a strojového učení s menším počtem datových sad, a proto Google uvedl „Meta-datovou sadu“, malou sbírku obrázků, která by měla pomoci snížit množství dat potřebných ke zlepšení přesnosti algoritmů. Společnost tvrdí, že pomocí technik klasifikace snímků s několika snímky získají modely AI a ML stejné poznatky z mnohem méně reprezentativních obrázků.



Google AI oznamuje Meta-datovou sadu: datovou sadu datových sad pro učení několika pokusů:

Hluboké učení pro AI a strojové učení již nějakou dobu exponenciálně roste. Klíčovým požadavkem je však dostupnost vysoce kvalitních dat, a to také ve velkém množství. Velké množství ručně anotovaných tréninkových dat je často obtížné získat a někdy může být také nespolehlivé. Pochopení rizik velkých datových sad společnost Google oznámila dostupnost kolekce meta-datových sad.



Přes ' Meta-datová sada: datová sada datových sad pro učení se učit se z několika příkladů “(Představeno v ICLR 2020 ), Google navrhl rozsáhlý a různorodý standard pro měření kompetence různých modelů klasifikace obrázků v realistickém a náročném prostředí několika výstřelů, který nabízí rámec, ve kterém lze zkoumat několik důležitých aspektů klasifikace několika výstřelů. Google v zásadě nabízí 10 veřejně dostupných a bezplatných datových sad přirozených obrázků. Tyto datové sady zahrnují ImageNet, CUB-200-2011, houby, ručně psané znaky a čmáranice. Kód je veřejnost a zahrnuje a notebook který ukazuje, jak lze meta-datovou sadu použít TensorFlow a PyTorch .



Klasifikace několika výstřelů jde nad rámec standardní tréninkové modely a modely hlubokého učení . Vyžaduje zobecnění na zcela nové třídy v době testu. Jinými slovy, obrázky použité během testování nebyly při tréninku vidět. V klasifikaci několika výstřelů obsahuje tréninková sada třídy, které jsou zcela disjunktní od těch, které se objeví v době testu. Každý testovací úkol obsahuje a sada podpory několika označených obrázků, ze kterých se model může dozvědět o nových třídách a disjunktu sada dotazů příkladů, které má model následně klasifikovat.

Meta-datová sada je velká součást zobecnění modelových studií na zcela nové datové sady , z nichž na tréninku nebyly vidět žádné obrázky žádné třídy. To je navíc k náročné výzvě generalizace nových tříd, která je vlastní nastavení učení několika pokusů.

Jak Meta-datová sada pomáhá hlubokému učení modelů AI a strojového učení?

Meta-datová sada představuje dosud nejrozsáhlejší organizovanou srovnávací metodu pro klasifikaci obrazů mezi datovými sadami a několika snímky. Rovněž zavádí vzorkovací algoritmus pro generování úkolů různých charakteristik a obtížnosti, a to změnou počtu tříd v každé úloze, počtu dostupných příkladů na třídu, zavedením nerovnováhy tříd a pro některé datové soubory změnou stupně podobnosti mezi třídy každého úkolu.



Meta-datová sada přináší nové výzvy pro klasifikaci několika pokusů. Výzkum Google je stále předběžný a je třeba jej pokrýt. Vyhledávací gigant však tvrdil, že vědci zažívají úspěch. Některé z pozoruhodných příkladů zahrnují použití chytře navrženého úkol klimatizace , sofistikovanější ladění hyperparametru , do meta-základní linie , Který kombinuje výhody předškolení a meta-učení a konečného využití výběr funkcí specializovat univerzální zastoupení pro každý úkol.

Značky Google