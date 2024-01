Crediti immagine: coniglio

Nel mare di gadget abilitati all'intelligenza artificiale al CES, coniglio r1 (Tutto in minuscolo, insistono) Non solo si distinguono per la verniciatura di alta qualità e il fattore di forma unico, ma anche per la loro dedizione all'artigianato. L'azienda spera che tu possa portare con te un secondo dispositivo per risparmiarti la fatica di sbloccare il telefono e ha compiuto sforzi tecnici straordinari per farlo funzionare.

L'idea alla base dell'R1 da $ 200 è semplice: ti consente di tenere il telefono in tasca quando devi svolgere alcune semplici attività come fermare un'auto per raggiungere la tua posizione, trovare alcuni posti dove mangiare dove incontrerai gli amici o trovarne qualcuno possibilità di alloggio per un weekend fuori porta.la costa.

“Non stiamo cercando di uccidere il tuo telefono”, ha detto il CEO e fondatore Jesse Liu in una chiamata con la stampa prima del Tech Show di Las Vegas. “Un telefono è un dispositivo di intrattenimento, ma se stai cercando di fare qualcosa, non è il dispositivo più efficiente. Per organizzare una cena con un collega, avevamo bisogno di 4-5 applicazioni diverse che lavorassero insieme. I modelli linguistici di grandi dimensioni sono naturali universali soluzione linguistica e ne vogliamo una a livello universale per questi servizi: dovrebbero semplicemente essere in grado di capirti.

Invece di tirare fuori il telefono, aprirlo, trovare l'app, aprirla e lavorare attraverso l'interfaccia utente (il che è molto noioso!), puoi invece estrarre r1 e dargli un comando in linguaggio naturale:

“Chiama un Uber XL per portarci al Museum of Modern Art.”

“Dammi un elenco di cinque ristoranti economici a 10 minuti a piedi da lì.”

“Elenco delle cabine con le migliori valutazioni per 6 adulti su Airbnb entro 10 miglia dalla spiaggia e non più di $ 300 a notte.”

L'r1 funziona mentre fai un'offerta e dopo pochi secondi presenta una conferma e qualsiasi contenuto tu possa aver richiesto.

Sembra familiare, vero? Dopotutto, questo è ciò che presumibilmente hanno fatto i nostri cosiddetti “assistenti AI” negli ultimi cinque o sei anni. “Siri, fai questo”, “Ehi Google, fai quello”. hai ragione! Ma c'è una grande differenza.

Siri, Google Assistant, Alexa e tutto il resto possono essere meglio descritti come “interfacce vocali per widget personalizzati”, per nulla simili ai modelli linguistici con cui molti di noi hanno iniziato a chattare nell'ultimo anno. Quando chiedi a Google di portarti un Lyft nella tua posizione attuale, utilizza l'API Lyft ufficiale per inviare le informazioni pertinenti e ottenere una risposta: fondamentalmente sono solo due dispositivi che comunicano tra loro.

Non che ci sia qualcosa di sbagliato, ma ciò che puoi fare tramite l'API è spesso molto limitato. Naturalmente deve esserci un rapporto formale tra l'assistente e la domanda, un collegamento approvato e retribuito. Se l'app che preferisci non funziona con Siri o l'API a cui Alexa può accedere è obsoleta, allora sei sfortunato. E che dire di alcune app di nicchia che sono troppo piccole per ottenere un accordo ufficiale con Google?

Ciò che Rabbit ha progettato è più in linea con i modelli di intelligenza artificiale di tipo “agente” che abbiamo visto emergere nell'ultimo anno, che sono modelli di apprendimento automatico addestrati su normali interfacce utente come siti Web e app. Di conseguenza, possono ordinare la pizza non tramite un'API Domino personalizzata, ma nello stesso modo in cui farebbe un essere umano: facendo clic su pulsanti e campi regolari su un normale sito Web o un'app mobile.

L'azienda ha addestrato il suo “modello di business di grandi dimensioni”, o LAM, su innumerevoli screenshot e video di app popolari e, di conseguenza, quando le chiedi di riprodurre un vecchio album di Bob Dylan su Spotify, non si perde a metà strada. Sa che dovrebbe andare sulla pagina dell'artista di Dylan, organizzare gli album per data di uscita, scorrere verso il basso e mettere in coda uno degli album più vecchi. O comunque lo fai.

Puoi vedere il procedimento nel video Nel video del coniglio qui.

Sa già come funzionare con una serie di app e servizi popolari, ma se ne hai uno no, il Rabbit afferma che l'R1 può imparare semplicemente guardandoti utilizzare l'app per un po', anche se questa modalità di insegnamento non lo farà. Fai quello. Non sarà disponibile al momento del lancio. (Leo ha detto che sono riusciti a farlo funzionare con successo in Diablo 4, quindi probabilmente può gestire AllTrails.)

Ma ovviamente r1 non può premere da solo quei pulsanti nell'app: da un lato non ha le dita per premerli e dall'altro non ha un account. Per il secondo problema, Rabbit ha creato quella che chiama “Rabbit Hole”, una piattaforma in cui è possibile attivare servizi utilizzando le credenziali di accesso, che non vengono salvate. Dopo che è diventato attivo, il server avvia l'applicazione premendo regolarmente i pulsanti proprio come faresti, ma in un ambiente simulato di qualche tipo (non sono molto specifici al riguardo).

“Pensa a come passare il telefono al tuo assistente”, ha detto Leo, generosamente, supponendo che tutti conosciamo questa comodità speciale. “Tutto ciò che facciamo è premere pulsanti per te. Tutto ciò che vedono sul loro backend è te che provi a fare qualcosa. È completamente legale e rientra nei loro termini di servizio.”

Più piccolo, più economico e più veloce

L'azienda ha chiaramente lavorato molto sul lato tecnico, ma la vera domanda è se qualcuno vorrà davvero portare con sé questo oggetto oltre al telefono. Costa $ 200, senza abbonamento, anche se dovrai fornire una carta SIM. Questo è più economico degli AirPods e fa molte promesse interessanti.

L'unica cosa che sta chiaramente succedendo è l'apparenza. Come se Playdate avesse un cugino fondatore di una startup che guidava una Tesla rosso brillante con targhe di cortesia (conosci il tipo). Progettato da Teenage Engineering, il che rende tutto ciò che vale la pena avere al giorno d'oggi.

Potresti chiedere, perché c'è uno schermo su qualcosa con cui dovresti parlare? Bene, lo schermo è necessario per mostrarti cose visive come i risultati di ricerca o la conferma della tua posizione. Ho due menti qui. Uno pensa, beh, come lo farai? L'altro pensa, se devi controllare tutte queste cose in primo luogo, perché non usare semplicemente il telefono nell'altra tasca?

L'equipaggio di Rabbit crede chiaramente che aprire questo gadget piccolo (3 x 3 x 0,5 pollici) e leggero (115 grammi) e dire quello che vuoi, quindi usare la rotella di scorrimento e il pulsante per scorrere i risultati sia un'esperienza più semplice che usare un'app in molti casi. Posso capire come ciò possa essere vero, molte app sono mal progettate e ora presentano anche il rischio aggiuntivo di pubblicità.

Ma perché la fotocamera? Questa è una caratteristica per la quale non sono riuscito a ottenere una risposta diretta. Ha un interessante asse magnetico/flottante che ruota per essere livellato e puntare in qualsiasi direzione desideri. Sembra che ci siano alcune funzionalità che non sono ancora pronte per essere implementate, ma pensa: “Quante calorie ci sono in questo sacchetto di caramelle?” o “Chi ha progettato questo edificio?” E quel genere di cose. Potrebbero essere disponibili videochiamate e social media.

Il dispositivo è ora disponibile per il preordine e Lyu ha dichiarato che intendono spedirlo negli Stati Uniti alla fine di marzo.

Concorrenza spaventosa

In definitiva, tuttavia, la grande domanda non è se l’R1 Rabbit riuscirà a raggiungere ciò che si propone di fare – da quello che posso dire, lo fa – ma se questo approccio sia fattibile di fronte a forze molto potenti. una gara.

Google, Apple, Microsoft, OpenAI, Anthropic, Amazon, Meta e molti altri stanno lavorando duramente per creare ogni giorno agenti più potenti per l'apprendimento automatico. Il rischio più grande per il coniglio non è che nessuno lo comprerà, ma che nel giro di sei mesi un’azienda da cento miliardi di dollari crei il proprio agente che fa l’80% di quello che fa il coniglio e lo rende disponibile gratuitamente sul tuo dispositivo. telefono intelligente.

Ho chiesto a Liu se questa fosse una preoccupazione per lui e la sua azienda, che con 17 dipendenti non è proprio sulla stessa lunghezza d'onda.

Lui ha risposto: “Certo che siamo preoccupati, siamo una startup. Ma solo perché possono farlo non significa che dobbiamo fermarci”.

Ha sottolineato che, nonostante le loro enormi risorse, a queste aziende manca anche la flessibilità delle startup, che oggi spediscono ciò che potrebbe spedire in seguito, compresi i dati. Ha osservato che i modelli linguistici “si basano su una ricetta aperta: cinque articoli, tutto qui”. Ci sono poche possibilità di creare una trincea lì. Ma la LAM di Rabbit si basa su dati proprietari e mira a fornire un'esperienza utente molto specifica su un dispositivo molto specifico.

Tuttavia, anche se il coniglio r1 è migliore o carino, le persone preferiscono la semplicità e la comodità. Perché dovrebbero pagare per trasportare un secondo dispositivo quando il primo dispositivo svolge la maggior parte di queste attività? A breve termine, la risposta è sì: Liu ha affermato che i preordini si stanno accumulando. Il coniglio vivrà abbastanza da produrre la prossima generazione, presumibilmente R2? E anche se così non fosse, questo piccolo ed entusiasmante dispositivo potrebbe continuare a vivere nei nostri ricordi come un modello adeguatamente ambizioso dell’etica dell’IA.