Google ponúka bezplatné metaúdaje s algoritmami hlbokého učenia AI a strojového učenia, ktoré umožňujú rýchle a efektívne triedenie obrázkov v TensorFlow a PyTorch

Tech / Google ponúka bezplatné metaúdaje s algoritmami hlbokého učenia AI a strojového učenia pre rýchle a efektívne klasifikovanie obrázkov v TensorFlow a PyTorch 2 minúty prečítané

Google Pixel 5?

Google má oznámila dostupnosť viacerých súborov údajov pozostávajúci z rozmanitých, ale obmedzených prírodných obrazov. Vyhľadávací gigant je presvedčený, že verejne dostupné údaje budú viesť tempo Strojové učenie a umelá inteligencia a zároveň skracuje čas potrebný na výcvik modelov AI na minimálnom množstve údajov. Google nazýva novú iniciatívu „Free Meta-Datasets“, ktorá pomôže modelom AI „naučiť sa“ za menej dát. Spoločnosť „Few-Shot AI“ od spoločnosti je optimalizovaná tak, aby zabezpečila, že sa AI učí nové triedy iba z niekoľkých reprezentatívnych obrázkov.

Spoločnosť Google pochopila potrebu rýchleho trénovania modelov umelej inteligencie a strojového učenia s menším počtom súborov údajov. Preto uviedla na trh súbor „Meta-Dataset“, malú zbierku obrázkov, ktorá by mala pomôcť znížiť množstvo údajov potrebných na zlepšenie presnosti algoritmov. Spoločnosť tvrdí, že pomocou techník klasifikácie snímok pomocou niekoľkých snímok získajú modely AI a ML rovnaké poznatky z oveľa menšieho počtu reprezentatívnych snímok.

ako skomprimovať súbor pdf do systému windows 10

Google AI ohlasuje metaúdaje: súprava údajov pre malé učenie:

Hlboké učenie pre AI a strojové učenie už pomerne dlho exponenciálne rastie. Hlavnou požiadavkou je však dostupnosť vysoko kvalitných údajov, a to tiež vo veľkom množstve. Veľké množstvo ručne anotovaných údajov o tréningu je často ťažké získať a niekedy môže byť tiež nespoľahlivé. Pochopením rizík veľkých množín údajov spoločnosť Google oznámila dostupnosť kolekcie metaúdajov.

Prostredníctvom „ Metaúdajová sada: množina dátových množín určených na učenie sa učenia z niekoľkých príkladov “(Prednesené na ICLR 2020 ), Google navrhol rozsiahly a rôznorodý štandard pre meranie kompetencie rôznych modelov klasifikácie obrázkov v realistickom a náročnom prostredí niekoľkých snímok, ktorý ponúka rámec, v ktorom je možné preskúmať niekoľko dôležitých aspektov klasifikácie niekoľkých snímok. Spoločnosť Google v zásade ponúka 10 verejne dostupných a bezplatne použiteľných súborov údajov prírodných obrázkov. Tieto súbory údajov zahŕňajú ImageNet, CUB-200-2011, huby, ručne písané znaky a čmáranice. Kód je verejné a zahŕňa a zápisník ktorý demonštruje, ako je možné použiť metaúdaje TensorFlow a PyTorch .

Klasifikácia niekoľkých rán presahuje rámec štandardné modely školení a hlbokého učenia . Na testovanie je potrebné zovšeobecniť úplne nové triedy. Inými slovami, obrázky použité počas testovania neboli počas tréningu viditeľné. V klasifikácii na niekoľko pokusov obsahuje tréningová sada triedy, ktoré sú úplne odlišné od tých, ktoré sa objavia v čase testu. Každá testovacia úloha obsahuje a podporná sada z niekoľkých označených obrázkov, z ktorých sa model môže dozvedieť o nových triedach a disjunkt sada dotazov príkladov, ktoré sa potom majú podľa modelu klasifikovať.

Meta-dataset je veľká zložka, v ktorej zovšeobecnenie modelových štúdií na úplne nové súbory údajov , z ktorého na tréningu nebolo vidieť žiadne obrázky žiadnej triedy. To je navyše k náročnej výzve zovšeobecňovania nových tried, ktorá je súčasťou nastavenia učenia sa niekoľkými pokusmi.

Ako pomáha metaúdajová sada hlbokému učeniu pre modely umelej inteligencie a strojového učenia?

Meta-dataset predstavuje doteraz najväčšiu organizovanú referenčnú hodnotu pre krížovú datasetovú klasifikáciu obrázkov. Zavádza tiež algoritmus vzorkovania na generovanie úloh s rôznymi charakteristikami a obtiažnosťou, a to zmenou počtu tried v jednotlivých úlohách, počtom dostupných príkladov na triedu, zavedením nerovnováh v triedach a pre niektoré súbory údajov rôznym stupňom podobnosti medzi triedy každej úlohy.

Meta-dataset prináša nové výzvy pre klasifikáciu niekoľkých riešení. Prieskum spoločnosti Google je stále predbežný a je potrebné ho pokryť. Vyhľadávací gigant však tvrdil, že vedci zažívajú úspech. Niektoré z pozoruhodných príkladov zahŕňajú použitie dômyselne navrhnutých úloha kondicionovanie , sofistikovanejšie ladenie hyperparametra , do ' základná čiara ‘, Ktorý kombinuje výhody predškolenia a meta-učenia sa a nakoniec aj využitia výber funkcií špecializovať univerzálne zastúpenie pre každú úlohu.

Značky google