Il futuro della realtà aumentata sarà noioso

Molte persone sembrano entusiaste di qualcosa chiamato AR, o "Realtà Aumentata", ultimamente. Ci sono tonnellate di fantastiche demo in giro su Twitter. Facebook ha lanciato la sua piattaforma di effetti fotografici. Apple ha un kit per sviluppatori di Realtà Aumentata e ha dimostrato un gioco AR appariscente sul palco durante il suo evento iPhone X. Google ha lanciato ARcore e una serie di esperimenti. Magic Leap si sta ancora nascondendo segretamente, rilasciando teaser simili a demo. Un hot dog che balla è apparentemente "la prima superstar della realtà aumentata al mondo".

Principalmente per la mia sanità mentale, userò "AR" o "Realtà Aumentata" da qui in poi per significare cose che puoi fare tramite la fotocamera dello smartphone oltre a scattare foto o video.

-

La maggior parte delle fantastiche demo AR che vediamo oggi sembrano sovrapporre oggetti, personaggi, filtri o altri effetti al mondo che ci circonda. Lo fanno tramite (principalmente) disegnando cose su un feed della fotocamera dello smartphone, o in alcuni casi, un auricolare (hololens, salto magico).

Un hot dog, sul mio computer.

Queste "demo sovrapposte" sono super rad e molto condivisibili perché ti mostrano qualcosa di impossibile. Nella "vita reale", non puoi vedere mario kart che guida per strada o un hot dog che balla sulla tua scrivania.

Questo tipo di Realtà Aumentata, che potresti chiamarla "AR additiva", è radicata nella tradizione fotografica e cinematografica - non solo perché il modo in cui la maggior parte di noi consuma AR è guardando video di demo registrate, ma anche perché consideriamo ancora macchina fotografica come abbiamo fatto un secolo fa. Pensiamo ancora alla fotocamera come un modo di registrare i media. Le prime fotocamere hanno scattato foto esponendo sostanze chimiche alla luce; poi film; e poi hanno registrato video; quindi foto e video digitali, che continuano a migliorare. La loro funzione era quella di registrare il mondo intorno a loro.

L'AR additiva è il logico passo successivo in un lignaggio di miglioramento delle nostre foto e video. Questa stirpe risale a filtri per lenti colorate, effetti pratici, polarizzatori, sottotitoli, CGI digitale e, più recentemente, filtri snapchat. Comprime sostanzialmente l'intera pipeline CGI in qualcosa che si verifica in tempo reale, con il semplice tocco di un dito. Il telefono sta eseguendo tutte le operazioni AR, dal tuo punto di vista, attraverso la fotocamera. Questo è uno dei motivi per cui l'AR additivo sembra intuitivo; è il circuito di feedback più breve possibile. La fotocamera vede cose, aggiunge cose a ciò che vede, e poi te le mostra.

Oltre a ciò, la percentuale di tutti i media che sono foto o video è cresciuta notevolmente negli ultimi dieci anni. I colpevoli sono piattaforme che rendono follemente semplice l'hosting e il consumo di contenuti fotografici / video: Facebook, Instagram, Snapchat, YouTube, ecc. Sono tutti abilitati dal fatto che schermi e fotocamere sono continuamente più economici da produrre. Non sorprende che le persone stiano scattando più foto anno dopo anno e il "pivoting to video" è qualcosa che molti dirigenti dei media sono convinti sia una buona idea.

Tutto questo per dire: è una scommessa abbastanza sicura che farai foto e video per il prossimo futuro. L'aggiunta di filtri AR, caratteri, adesivi, ecc. A tutti i nostri comportamenti esistenti (filtri Instagram, adesivi snapchat, ecc.) È il modo più semplice per visualizzare e utilizzare i tuoi contenuti AR. Nuovi modi per rendere più fredde foto e video sono il caso d'uso più chiaro e più vicino per AR. (Inoltre, questo approccio si collega direttamente alle piattaforme che già utilizziamo.)

-

Ho la sensazione che esista un'applicazione della Realtà Aumentata meno eccitante, più noiosa, ma in realtà potrebbe essere utile nella vita di tutti i giorni. Invece che l'AR sia solo il prossimo passo nella tradizione della fotografia, potremmo pensare all'AR come al prossimo passo nelle piattaforme di calcolo. L'AR potrebbe essere il modo più veloce per portare la tradizione e la pratica del calcolo al mondo che ci circonda e agli oggetti in essa contenuti. (Per calcolo qui mi riferisco a un po 'come mio padre potrebbe pensare al calcolo: qualcosa che ti consente di fare cose ingegnose con la tecnologia e Internet che non potresti farne a meno, come condividere una foto attraverso l'oceano in un millisecondo, o correggere automaticamente i tuoi errori di battitura.)

L'AR additiva è ora possibile perché le telecamere sono finalmente abbastanza intelligenti (ish) da sapere cosa stanno guardando. Al livello più elementare, stanno guardando il pavimento e sanno dove sono le pareti e gli angoli. Altre app per fotocamere possono anche capire quale libro, scarpe o auto stanno guardando e non è difficile immaginare un futuro in cui conosca la maggior parte dei prodotti, dei luoghi e persino delle situazioni.

Quindi, cosa succede se si risparmia l'eccitante, impossibile roba additiva AR e si concentra solo sulla telecamera che vede le cose? Non "vedere una tabella e aggiungere una mappa di Minecraft sopra di essa, solo vedere la parte di una tabella.

Non hai bisogno della realtà aumentata per dirti che un tavolo è un tavolo. Ma la cosa bella della tua fotocamera che sa cosa è un tavolo potrebbe avere poco a che fare con la fotocamera: la più grande opportunità potrebbe essere che il tavolo abbia ora accesso al calcolo e a una rete. La tua fotocamera vede "tabella" e il tuo telefono ha una connessione a Internet; ergo, quel tavolo ora ha una connessione internet. La tua fotocamera funge solo da intermediario per l'app / il complesso Internet e quel tavolo - o quel libro, o divano, o altro. La foto o il video che hai scattato sul tavolo è solo un artefatto del processo. Quello che stai facendo è più vicino a fare clic sul tavolo che a scattare una foto.

Quindi cosa succede quando un tavolo, un libro o un soggiorno hanno accesso al calcolo? Perché è eccitante? Cosa succede quando punti una fotocamera (o, in futuro, chissà, una bacchetta magica) verso oggetti, luoghi o situazioni? Non sono abbastanza intelligente da prevederlo, ma potremmo guardare altre categorie di oggetti che, a un certo punto, hanno ottenuto l'accesso a una rete. Quando gli oratori hanno avuto accesso a una rete, hanno iniziato a parlare con noi, ascoltandoci e dicendoci quando partire per lavoro. Quando le auto hanno avuto accesso a una rete (uber / lyft,) in pochi anni è stata trasformata un'intera industria dei trasporti. Quando le case ottengono l'accesso a una rete (airbnb,) potresti viaggiare in qualsiasi parte del mondo e avere un posto dove stare. Quando i tuoi amici hanno avuto accesso a una rete (Facebook, Instagram), come abbiamo comunicato radicalmente cambiato durante la notte (gli adolescenti non escono più, vero?).

Quando il tuo tavolo ha accesso a una rete, forse quando lo punti, ordina la cena; forse si confronta con altre tabelle; forse si vende da solo. Puntare il telefono verso un forno o una lampada ti dà accesso a tutte le possibili azioni e informazioni che vorresti in quella situazione. Questa ricetta si adatterebbe al forno? Quanto risparmierei se accendessi quelle lampadine? La realtà aumentata è la tecnologia immaginabile più vicina che ci consente di portare gli aspetti utili (e anche del tutto inutili, perché altrimenti, dov'è il divertimento?) Nel mondo che ci circonda.

Alcune persone stanno già sperimentando il modello "riconoscere gli oggetti - eseguire il calcolo - mostrare i risultati". Il Magic Sudoku di Brad Dwyer è un'app che riconosce quando stai indicando un puzzle di sudoku e lo risolve nel contesto. I cubetti di carta di Judith Amores e Anna Fusté riconoscono alcuni oggetti e li usano come ancore interattive per le piccole persone che corrono intorno alla fotocamera.

C'è una grande sfida nel raggiungere il modello "riconoscere - calcolare - mostrarti" su larga scala. Per la maggior parte, il modo in cui sono stati creati i programmi per computer è stato che per ogni nuova categoria di cose che potevamo calcolare (parole / lettere, canzoni, foto, amici) abbiamo costruito manualmente tutte le azioni e le informazioni e le cose che potevamo fare con esso . Quando è possibile utilizzare le fotografie sui computer, abbiamo creato app di fotoritocco. Quando il tuo telefono sapeva dove ti trovavi con il GPS, abbiamo creato app di mappatura.

Ma se le telecamere continuano a riconoscere meglio le cose, aggiungeremo una nuova cosa su cui potremmo agire con i computer radicalmente più velocemente. È possibile programmare un'app per ogni categoria di oggetto a cui si potrebbe puntare un telefono? Anche se lo è, non hai intenzione di scaricare un'app diversa per ogni possibile oggetto a cui potresti puntare il telefono.

-

Affinché AR funzioni come un'ampia piattaforma computazionale (leggi: elegante e utile) e non solo un mucchio di fantastiche singole app, ci sono molti pezzi che devono essere allineati. Per la maggior parte, il contesto e la scoperta sembrano il maggiore ostacolo da superare. Non vuoi andare a cercare app AR diverse per ogni contesto e oggetto in cui ti trovi, perché ce ne sono migliaia e non sai nemmeno cosa c'è e per cui non è un'app AR. Quello che vuoi è la capacità di puntare il telefono su qualcosa e ricevere suggerimenti contestuali su ciò che stai indicando e sulle cose che puoi fare in quella situazione. Quindi cosa deve sapere il tuo telefono per permetterti di farlo?

  1. Object-riconoscimento. Il tuo telefono deve sapere cosa sta guardando. Negli ultimi anni ci sono stati passi da gigante e i grandi giocatori cercano costantemente di migliorarlo.
  2. Contesto globale. Il tuo telefono deve sapere dove ti trovi nel mondo. (per fortuna, il GPS è in circolazione da un po 'di tempo.) Potresti desiderare informazioni diverse dal mondo nella tua città rispetto a quanto faresti in vacanza.
  3. Contesto locale. Il telefono deve sapere dove ti trovi nello spazio locale, in modo che il contenuto locale appaia in modo coerente a tutti coloro che interagiscono con esso.
  4. Segnali personali. Il mio telefono deve sapere che ho appena spostato gli appartamenti, quindi è per questo che sono in Target che punta la mia fotocamera verso un gruppo di divani. I segnali personali consentono al tuo telefono di restringere le tue intenzioni da "potresti desiderare tutto il possibile" a "probabilmente sei interessato alla bici qui, perché vai in bici ovunque".

(Riconosco anche che un dispositivo o un'azienda che conosce tutte queste cose insieme è una ricetta per una distopia della privacy del disastro ferroviario. Ne parliamo un'altra volta.)

-

Escludendo gli ostacoli tecnici da superare, l'AR come piattaforma di elaborazione sarebbe utile? Cosa c'è da guadagnare permettendo alle persone di calcolare il mondo che li circonda? Non so. Ma per ogni categoria di cose per ottenere l'accesso al calcolo, le potenziali applicazioni e connessioni sono esponenziali.

Ci sono voluti ben 5 anni per renderci conto che avere un gps combinato con una fotocamera nello stesso dispositivo rende davvero interessanti le app di appuntamenti. Se il tuo telefono conosce il mondo che ti circonda, quali sono le applicazioni che non possiamo ancora immaginare? Qual è l'esca per tazze di caffè? Cosa succede quando si fa clic su un frigorifero o un pesce? Cosa succede quando la Realtà Aumentata diventa l'ennesimo modo noioso di usare un computer? Non lo so, ma per me è radicalmente più eccitante che aggiungere hot dog danzanti alle mie foto.

Grazie a Prit Patel, Amit Pitaru, Heather Luipold, Ryan Harms e Teo Soares per un feedback straordinario.