Rekommenderas, 2024

Redaktionen

Allt du behöver veta om Google Brains TensorFlow

Vem som helst som har provat Google Foton skulle vara överens om att den här kostnadsfria lagrings- och hanteringstjänsten från Google är smart. Den packar i olika smarta funktioner som avancerad sökning, förmåga att kategorisera dina bilder efter platser och datum, skapa automatiskt album och videor baserat på likheter och gå ner i minnesfältet genom att visa bilder på samma dag för flera år sedan. Det finns många saker som Google Foton kan göra för flera år sedan skulle vara omöjligt. Google Foton är en av de många "smarta" tjänsterna från Google som använder en maskininlärningsteknik som heter TensorFlow. Ordet lärande indikerar att tekniken kommer att bli smartare med tiden till den punkt som vår nuvarande kunskap inte kan föreställa sig. Men vad är TensorFlow? Hur kan en maskin lära sig? Vad kan du göra med det? Låt oss ta reda på.

Vad är TensorFlow?

TensorFlow är Googles öppna källkod och kraftfull programvara för artificiell intelligens, som driver många tjänster och initiativ från Google. Det är andra generationen av ett system för omfattande implementering av maskininlärning, byggt av Googles hjärnteam. Detta algoritmbibliotek lyckas med DistBelief - den första generationen.

Tekniken representerar beräkning som stateful dataflödesdiagram. Det som gör TensorFlow unik är dess förmåga att modellera beräkningar på ett stort antal hårdvaror, från mobila enheter till konsumenter på världsklass med flera GPU-servrar. Den kan köras på olika GPUer och processorer och lovar skalbarheten hos maskininlärning bland olika enheter och gadgets utan att behöva ändra en betydande mängd kod.

TensorFlow härrörde från Googles behov av att instruera ett datorsystem för att efterlikna hur en mänsklig hjärna arbetar med att lära och räkna. Systemet, som kallas neurala nätverk, borde kunna utföra på multidimensionella datarrayer som kallas tensors. Slutmålet är att träna neurala nätverk för att detektera och dechiffrera mönster och korrelationer.

I november 2015 gjorde Google denna öppen källkod och tillåter att den antas i alla typer av produkter och undersökningar. Vem som helst, inklusive forskare, ingenjörer och hobbyister, kan hjälpa till att påskynda tillväxten av maskininlärning och ta den till en högre nivå på kortare tid.

Det här verket visade sig vara det rätta, eftersom det finns så många bidrag från de oberoende utvecklarna till TensorFlow att de långt överstiger Googles bidrag. Wikipedia nämner att "det finns 1500 repositorier på GitHub som nämner TensorFlow, varav 5 är från Google." Det sägs att en av diskussionerna i Quora misstänker att den släppta källkoden är "renad" -versionen från en som Google använder i sina tjänster.

Hur fungerar TenserFlow?

Med hjälp av det enkla normala mänskliga språket och en tung förenkling kan vi se ena sidan av TensorFlow som en avancerad autonom filtreringsteknik. I sitt hjärta är tekniken ett enormt mjukvaru bibliotek med maskininlärning. Den använder databasen för att hjälpa till att "fatta beslut".

Till exempel laddar någon upp ett foto till Google Foton. Tekniken kommer att jämföra alla detaljer från bilden till sin databas och bestämma om det är en bild av ett djur eller en människa. Då, om det är en människa, kommer det att försöka bestämma kön, ålder hela vägen till vem personen är. Samma process upprepas för andra objekt i bilden.

Den använder också användarens data såsom identiteten på personen i bilden och platsen där bilden tas, för att förbättra sitt bibliotek så att det kan ge bättre resultat i framtiden - både för den person som laddat upp fotot och för alla annan. Därav termen "lärande". Men det stoppar inte bara vid att veta och lära in data från foton. Det finns så mycket att tekniken kan göra med information från ett foto. Det kan till exempel gruppera foton med liknande detaljer som samma person, samma plats, samma datum; se mönstret av ansikten för att bestämma vilken familj och vänner personen i bilden tillhör, och använd informationen för att göra videor av familjesemester eller animeringar från kontinuerliga skott.

Det skrapar knappt ytan på hur TensorFlow fungerar, men jag hoppas att det kan ge dig en allmän bild av tekniken. Användning av bara ett exempel kan inte göra rättvisa till vad den kan.

Och för alla artificiella intelligensentusiaster där ute, är det värt att nämna att Google redan skapat en datorkretssteknik optimerad för maskininlärning och integrering av TensorFlow i den. Det kallas Tensor Processing Unit (TPU) ASIC-chip .

De som vill lära sig mer om TensorFlow kan besöka sin handledningssida.

Tillämpningar av TensorFlow

Vi är på ett tidigt stadium av maskininlärningsteknologi, så ingen vet var det kommer att ta oss. Men det finns några initiala applikationer som kan ge oss en titt på framtiden. Eftersom det här kommer från Google är det uppenbart att Google använder tekniken för många av sina tjänster.

  • Mer om bildanalys

Vi har diskuterat exempelet på att använda tekniken för bildanalys i Google Foton. Men programmet för bildanalys används också i Google Maps "Street View-funktionen. TensorFlow används till exempel för att ansluta bilden med kartkoordinaterna och för att automatiskt ta bort registreringsskyltnumret för varje bil som oavsiktligt ingår i bilden.

  • Taligenkänning

Google använder också TensorFlow för sin talassistent taligenkänning programvara. Tekniken som tillåter användarna att tala ut instruktioner är inte ny, men inklusive det ständigt växande biblioteket av TensorFlow i mixen kan bringa funktionen upp ett par noter upp. För närvarande känner talteknikstekniken över 80 språk och varianter.

  • Dynamisk översättning

Ett annat exempel på "lärande" delen av maskininlärningstekniken är Googles översättningsfunktion. Google tillåter sina användare att lägga till nya vokabulär och fixa misstagen i Google Translate. Den ständigt växande data kan användas för att automatiskt identifiera det inmatningsspråk som andra användare vill översätta. Om maskinen gör fel i språkdetektering, kan användarna rätta till dem. Och maskinen kommer att lära av dessa misstag för att förbättra sin framtidens prestanda. Och cykeln fortsätter.

  • Alpha Go

Ett roligt exempel på TensorFlow-användningen är Alpha Go. Det är en applikation som är programmerad för att spela Go . För de som är obekanta med Go, är det ett abstrakt brädspel för två spelare från Kina för mer än fem tusen fem hundra år sedan, och det är det äldsta brädspelet som fortfarande spelas kontinuerligt idag. Medan reglerna är enkla - att omge mer territorium än motståndaren, är spelet oerhört komplext och enligt Wikipedia: "har fler möjligheter än det totala antalet atomer i det synliga universum."

Så det är intressant vad en lärande maskinteknik kan göra med oändliga möjligheter. I sina matcher mot Lee Sedol - 18-timmars Go-världsmästare, vann Alpha Go 4 av 5 matcher och fick den högsta högsta ranken för Go Grandmaster.

  • Magenta Projekt

En annan intressant applikation av TensorFlow är Magenta-projektet. Det är ett ambitiöst projekt för att skapa maskingenererad konst . Ett av de tidiga konkreta resultaten av experimentet är 90-sekunders pianoljud. På sikt hoppas Google generera mer avancerad maskingenererad konst via sitt Magenta-projekt och bygga en samling konstnärer kring den.

I februari 2016 höll Google också en konstutställning och auktion i San Fransisco med 29 datorgenererade bilder - med lite hjälp från mänskliga konstverk. Sex av de största verken såldes för så mycket som 8 000 dollar. Datorn kan fortfarande ha en mycket lång väg att gå innan den kan imitera en riktig artist, men hur mycket pengar människor är villiga att betala för konsten visar oss hur långt tekniken har gått.

Stöd för iOS

Medan vi redan har sett förmågan hos TenserFlow på Android, med sin senaste version, lägger TensorFlow till slut support för iOS-enheter. Eftersom det finns massor av bra mobilappar tillgängliga exklusivt för iOS eller släpptes först på iOS, betyder det att vi kan förvänta oss fler bra mobilappar som antar maskininlärning inom en snar framtid. Samma sak kan sägas om möjligheterna till bredare adoptioner och tillämpningar av TensorFlow.

Framtiden för TensorFlow

Vad kan man eventuellt göra med en maskin som kan lära sig och fatta sitt eget beslut? Som en person som behandlar mer än ett språk som en del av det dagliga livet är det första som dyker upp i mitt sinne språköversättning. Inte i ordet på ordnivå, men mer på längre textnivå som dokument eller till och med böcker. Dagens översättningsteknik är begränsad till vokabulärerna. Du kan enkelt ta reda på vad som är "sova" på kinesiska och vice versa, men försök att kasta in ett kapitel i Eiji Yoshikawa's Musashi i sin ursprungliga japanska och översätta kapitlet till engelska. Du får se vad jag får på.

Det är också roligt att se vad framtiden för artificiell intelligens kan göra med musik. Medan det fortfarande är väldigt grundläggande, kan Apples Music Memo-app redan ge automatiskt bas- och trummansamling till din inspelade sång. Jag kommer ihåg ett avsnitt av en SciFi-tv-show där ett tecken på showen skapade en maskin som analyserar alla de bästa låtarna i diagrammen och kan skriva egna hitsångar. Kommer vi någonsin att komma dit?

Och som avslutande tanke, skulle jag vilja nämna Sunspring . Det är en kort science fiction-film skriven helt av en AI-manusförfattare som kallade sig Benjamin - som även komponerade popsången musikaliska interlude. Filmen sammanställdes av regissören Oscar Sharp för 48-timmars filmutmaningen av Sci-Fi London-evenemanget.

Nu kan jag inte sluta tänka på Terminator. Välkommen till framtiden.

Bildkrediter: Wikipedia, TechInsider, The Verge, Wall Street Journal

Top