Google hovorí o význame otvoreného zdroja a otvorených dát v nedávnom blogovom príspevku

Tech / Google hovorí o význame otvoreného zdroja a otvorených dát v nedávnom blogovom príspevku 3 minúty prečítané

Google



Google ako spoločnosť vždy podporoval softvér a dáta open-source, prinajmenšom v ich stánku. Je to takmer trend s veľkými spoločnosťami, pretože Google aj Microsoft významne prispeli k scéne open-source. „ Google tiež významne prispieva k softvéru s otvoreným zdrojovým kódom. Medzi kľúčové príklady patrí Android , náš operačný systém pre smartphone, Chróm , základ kódu pre náš prehliadač Chrome (teraz tiež poháňa mnohých konkurentov ) a TensorFlow , náš systém strojového učenia. Google vydal Guvernéri navždy zmenil cloudový hosting a umožnil inovácie a konkurenciu v celom cloudovom priemysle. Google je tiež najväčším prispievateľom otvoreného zdrojového kódu do služby GitHub , zdieľané úložisko pre vývoj softvéru. V roku 2017 vykonali zamestnanci spoločnosti Google iba na GitHube viac ako 250 000 zmien v desiatkach tisíc projektov.

Vo väčšine prípadov to nie je skutočne z veľkorysosti, ale skôr z toho, ako ťažiť z bezplatného rozvoja a potom profitovať z rozsiahleho prijatia. Bez ohľadu na to tieto príspevky pomohli tisícom výskumníkov a viedli vývoj softvéru jednotným spôsobom, čo treba oceniť. Google v nedávnom blogovom príspevku zdôraznil ich príspevok k otvoreným údajom a softvéru s otvoreným zdrojom.



S príchodom sledovania v reálnom čase a vývojom automobilov bez vodiča sa robí veľa výskumov v oblasti počítačového videnia a Google je jednou zo spoločností v čele Visual Tech.



Náš záväzok k otvorenému zdroju a otvoreným údajom nás priviedol k tomu, aby sme s každým zdieľali súbory údajov, služby a softvér. Napríklad spoločnosť Google vydala Datová sada otvorených obrázkov z 36,5 milióna obrázkov obsahujúcich takmer 20 000 kategórií objektov označených človekom. S týmito údajmi môžu vedci v oblasti počítačového videnia trénovať systémy rozpoznávania obrazu. Podobne milióny komentovaných videí v YouTube-8M zbierka sa môže použiť na trénovanie rozpoznávania videa.



- Variantná vec

Hlavný ekonóm spoločnosti Google

Google tiež zhromažďuje množstvo údajov, ktoré môžu pomôcť pri výskume NLP a počítačom pomôžu lepšie porozumieť ľudskej reči. V blogovom príspevku spoločnosť Google zdôraznila zdieľanie databázy kľúčov s uvedením „ Pokiaľ ide o jazykové spracovanie, zdieľali sme Prírodné otázky databáza, ktorá obsahuje 307 373 otázok a odpovedí vytvorených ľuďmi. Sprístupnili sme tiež Korpus biliónov slov , ktorý je založený na slovách použitých na verejných webových stránkach, a Prehliadač Ngram , ktoré možno použiť na preskúmanie viac ako 25 miliónov kníh v Knihy Google . Tieto zbierky je možné použiť na štatistický strojový preklad , rozpoznávanie reči, oprava pravopisu , detekcia entít, extrakcia informácií a ďalší jazykový výskum. “



Vyhľadávač je jednou z hlavných firiem spoločnosti Google a každú sekundu získava viac ako 63 000 otázok. Tieto údaje sú pre spoločnosť veľmi dôležité a Google ich analyzuje na účely cielenej reklamy. Niektoré poznatky o celkových údajoch sa napriek tomu zverejňujú na portáli trendov spoločnosti Google.

Google tiež ponúka Google Trends , bezplatná služba, ktorá komukoľvek umožňuje od roku 2004 vidieť a sťahovať si súhrnné vyhľadávacie aktivity pre Vyhľadávanie Google, Vyhľadávanie obrázkov, Vyhľadávanie správ, Nakupovanie a YouTube. Informácie o krajinách, regiónoch, metropolitných oblastiach a mestách môžete získať na mesačnej, týždennej, dennej a dokonca hodinovej báze. Údaje z Trendov široko využívajú vedci v oblastiach, ako sú medicína a ekonómia. Podľa Google Scholar existujú viac ako 21 000 výskumných prác ktoré ako zdroj údajov uvádzajú Trends. “

Prečo pracovať na projektoch s otvoreným zdrojom?

Hovoril som o tom krátko na začiatku článku. Nový softvér môže implementovať vynikajúci nápad a inovovať priestor, ale to nezabráni ostatným v implementácii podobných nápadov a v snahe o ich zlepšenie. Mnoho spoločností sa to naučilo veľmi ťažko, napríklad Windows Phone. Ako vieme, išlo o zjavné zlyhanie a to z mnohých dôvodov, ale jeho súčasťou bola veľká časť uzavreté prostredie a kontrola licencií. Hardoop a HDFS boli verzie MapReduce s otvoreným zdrojom vyvinuté spoločnosťou Google a spoločnosť si dôležitosť open-source osvojila už na začiatku. Stručne povedané, rozhodnutie urobiť IP otvorený zdroj je strategické.

Google sa vo svojom blogovom príspevku zaoberá niekoľkými ďalšími dôvodmi a uvádza: „ Naším primárnym poslaním je v prvom rade „organizovať informácie o svete tak, aby boli všeobecne prístupné a užitočné“. Jedným zo zrejmých spôsobov, ako urobiť informácie všeobecne prístupnými a užitočnými, je určite ich rozdávanie ! '

Hovoria tiež o tom, prečo nemôžu vydať nejaké veci, pričom uvádzajú „ Samozrejme, nemôžeme uvoľniť všetky údaje, ktoré používame v našom podnikaní. Musíme chrániť súkromie používateľov, zachovávať mlčanlivosť o firemných zákazníkoch a chrániť vlastné duševné vlastníctvo spoločnosti Google. Ale na základe týchto úvah sa všeobecne snažíme, aby boli naše údaje čo najviac „všeobecne prístupné a užitočné“.

Značky google