Logo sk.androidermagazine.com
Logo sk.androidermagazine.com

Čo je duplex Google?

Obsah:

Anonim

Na Google I / O 2018 sme videli ukážku najnovšej novej skvelej veci spoločnosti Google, Duplex. Obrazovka na ploche 60 stôp ukázala, čo vyzerá rovnako ako vaša aplikácia Google Assistant, s priamym prehrávaním asistenta, ktorý zavolá kaderníkovi a nastaví schôdzku s pauzy, ummms a ahhhs a zvyšok idiosynkrasií, ktoré sprevádzajú ľudskú reč. Zdá sa, že osoba, ktorá sa stretla s schôdzkou, nevedela, že hovorí s počítačom, pretože to neznelo ako počítač. Ani trochu.

Takéto demo vyzerá úžasne (a možno trochu strašidelne), ale čo detaily? Čo je presne duplex? Ako to dokonca funguje? Všetci máme otázky, keď vidíme niečo iné a nájsť odpovede šírené po internete je bolesť. Poďme sa pozrieť na to, čo vieme o službe Google Duplex.

Čo je Google Duplex?

Ide o nový nástroj od spoločnosti Google, ktorý sa zameriava na využívanie umelej inteligencie (AI) na „vykonávanie úloh v reálnom svete po telefóne“ podľa výskumníkov a vývojárov AI spoločnosti Google. Pre túto chvíľu to znamená veľmi špecifické úlohy, ako je menovanie, ale táto technológia sa vyvíja s ohľadom na expanziu do ďalších oblastí. Výdavky miliárd na vytvorenie skvelého spôsobu zarobenia rezervácií na večeru znie ako niečo, čo by spoločnosť Google urobila, ale nie je to skvelé využitie času alebo peňazí.

Duplex je tiež viac, ako sme videli v demonštrácii, a ak vôbec niekedy opustí laboratórium, bude oveľa viac, ako na konci uvidíme alebo počujeme. Existujú obrovské banky údajov a počítače na ich spracovanie, ktoré nie sú až také chladné ako konečný výsledok. Sú však nevyhnutné, pretože hovorenie pomocou počítača a premýšľanie v reálnom čase, ako je človek, je ťažké.

Nie je to ako reč na text?

Nie. Ani zďaleka. A to je dôvod, prečo je to veľký problém.

Duplex je určený na zmenu spôsobu, akým počítač „hovorí“ v telefóne.

Cieľom Duplexu je urobiť veci prirodzeným zvukom a Asistentovi premýšľať za behu, aby našiel čas na stretnutie, ktorý bude fungovať. Ak Joe povie: „Áno, o tom - nemám nič otvorené do 10, je to v poriadku?“ Asistent musí pochopiť, čo hovorí Joe, zistiť, čo to znamená, a premýšľať, či to, čo Joe ponúka, bude pre vás fungovať. Ak ste zaneprázdnení mestom v desiatke a cesta do garáže Joe's Garage bude trvať 40 minút, asistent musí byť schopný to zistiť a povedať, že 11:15 by bolo dobré.

Rovnako dôležité pre spoločnosť Google je to, že spoločnosť Duplex odpovedá a znie ako osoba. Google uviedol, že chce, aby osoba v telefóne nevedela, že hovorí s počítačom, hoci sa nakoniec rozhodla, že bude najlepšie informovať ich. Keď hovoríme s ľuďmi, hovoríme rýchlejšie a menej formálne (čítaj: nesúvislé bľabotanie z pohľadu počítača), ako keď hovoríme s asistentom na telefóne alebo počítači na DMV, keď voláme. Duplex musí porozumieť toto a pri odpovedi znova vytvoriť.

A najpôsobivejšie je, že spoločnosť Duplex musí chápať kontext. Piatok, budúci piatok a piatok po budúcom týždni sú všetky pojmy, ktorým rozumiete. Duplex ich musí tiež pochopiť. Keby sme hovorili rovnakým spôsobom, aký píšeme, nebol by to problém, ale vieme, že nie, pretože to znie jednoducho tak znervózne, že to nie je také mätúce, hoci sme to počuli celý život a sme na to zvyknutí. nie, nemáme problémy, o ktorých viete, že tomu rozumiete, alebo nič podobné.

Spravím prvú pomoc svojmu editorovi po napísaní, že keď to vyslovíte nahlas, tak uvidíte, čo to znamená.

Ako funguje duplex?

Z hľadiska používateľa je to také jednoduché ako povedať asistentovi, aby niečo urobil. Ako už bolo spomenuté, toto sa obmedzuje len na menovanie, a tak by sme povedali: „Ahoj, Google mi urobil schôdzku na výmenu oleja v garáži Joe v utorok ráno, “ a (potom, čo nám to pripomenula, aby sme povedali, prosím) by to volalo zostaviť Joe's Garage a nastaviť veci a potom ich pridať do svojho kalendára.

Pokračujúce konverzácie používajú veľa rovnakej technológie ako Duplex.

Docela šikovný. Ale to, čo sa deje s kamerou, je ešte krajšie.

Duplex používa tzv. Opakujúcu sa neurónovú sieť. Je postavený pomocou technológie spoločnosti TensorFlow Extended od spoločnosti Google. Spoločnosť Google školila sieť na všetky anonymizované hlasové správy a konverzácie Google Voice, s ktorými ste súhlasili, aby vám umožnili počúvať, ak ste sa rozhodli používať kombináciu softvéru na rozpoznávanie reči a schopnosť zvážiť históriu konverzácie a podrobnosti, ako napríklad čas a miesto dňa. oboch strán.

Celá sieť vysokovýkonných počítačov v podstate drtí údaje v cloude a hovorí cez asistent na telefóne alebo inom produkte, ktorý má na palube asistenta.

A čo bezpečnosť a súkromie?

Ide o jednu jednoduchú vec: dôverujete spoločnosti Google. Inteligencia strojového zariadenia je skutočná vec, hoci je obmedzená a relatívne nová. Spoločnosť Google vyvinula balík ML Kit, ktorý vývojárom pomáha robiť viac tohto druhu na samotnom zariadení, ale je to všetko záležitosť výpočtového výkonu. Trvá to neuveriteľné množstvo výpočtov, aby ste si naplánovali stretnutie s vlasmi, a neexistuje žiadny spôsob, ako by sa to dalo vykonať v telefóne alebo na domovskej stránke Google.

Aby ste mohli používať jej inteligentné produkty, musíte spoločnosti Google dôverovať svojim údajom a spoločnosť Duplex sa nebude líšiť.

Spoločnosť Google musí využiť väčšinu vašich osobných údajov, aby urobila špeciálne veci, ktoré môže Asistent urobiť práve teraz, a spoločnosť Duplex to nemení. Novinkou je, že teraz existuje ďalšia zúčastnená strana, ktorá spoločnosti Google výslovne nedala povolenie počúvať ich konverzáciu.

Ak sa Duplex stane skutočným spotrebiteľským produktom pre kohokoľvek, kto ho použije, očakávajte, že bude na súdoch kritizovaný a napadnutý. A malo by to byť; nechať spoločnosť Google rozhodnúť sa, čo je najlepšie pre naše súkromie, ako je staré porekadlo dvoch líšky a kurča rozhodujúce o tom, čo je na večeru.

Kedy budem mať na telefóne duplex?

Očakávajte niektoré veľké zmeny v Asistentovi koncom tohto roka.

Momentálne nikto nevie. To sa nikdy nestane. Google je nadšený, keď dokáže robiť také fantastické veci a chce ho zdieľať so svetom. To neznamená, že bude úspešný alebo sa niekedy stane skutočným produktom.

Duplex sa zatiaľ testuje v uzavretom a kontrolovanom prostredí. Ak všetko pôjde dobre, koncom tohto roku príde iba experimentálne vydanie pre spotrebiteľov, aby si zarezervoval rezervácie v reštauráciách, naplánoval si stretnutia s kaderníckymi salónmi a získal hodiny pracovného času po telefóne.

Kde sa môžem dozvedieť viac?

Spoločnosť Google je prekvapivo otvorená v súvislosti s technológiou, ktorú používa na vytváranie duplexu. Relevantné informácie nájdete na týchto webových stránkach:

  • Blog Google AI (Google)
  • Deepmind
  • Tensorflow.org
  • Cornell University Library
  • Google Research (Google)
  • Kľúčové slovo (Google)
  • Sada ML (Google)

Samozrejme, pozorne sledujeme aj duplex a hneď tu budete počuť najnovší vývoj hneď, ako budú k dispozícii.