La miscela di AI umani per la trascrizione audio di Facebook sta ora affrontando il controllo della privacy in Europa: TechCrunch


di Facebook il principale regolatore della privacy in Europa sta ora chiedendo alla società informazioni dettagliate sul funzionamento di una funzionalità di voice-to-text nel Messenger di Facebook app e come è conforme al diritto dell'UE.

Ieri Bloomberg ha riferito che Facebook utilizza appaltatori umani per trascrivere i messaggi audio degli utenti delle app, ma la sua politica sulla privacy non menziona chiaramente il fatto che le persone reali potrebbero ascoltare le tue registrazioni.

Una pagina del centro assistenza di Facebook include anche una "nota" che dice "Voice to Text utilizza l'apprendimento automatico", ma non dice che la funzione sia anche supportata da persone che lavorano per l'ascolto di Facebook.

Un portavoce della Irish Data Protection Commission ci ha detto: "A seguito del nostro impegno costante con Google, Apple e Microsoft in relazione al trattamento dei dati personali nel contesto della trascrizione manuale delle registrazioni audio, stiamo ora cercando informazioni dettagliate da Facebook sul trattamento in questione e su come Facebook ritiene che tale trattamento dei dati sia conforme ai loro obblighi GDPR “.

Il rapporto di Bloomberg segue rivelazioni simili sulle tecnologie dell'assistente AI offerte da altri giganti della tecnologia, tra cui Apple, Amazon, Google e Microsoft, che hanno anche attirato l'attenzione delle autorità europee di regolamentazione della privacy nelle ultime settimane.

Ciò che ci dice è che l'hype attorno agli assistenti vocali di AI è ancora sorvolando un backend molto meno high-tech. Anche se le frustate del marketing di apprendimento automatico sono state usate per mascherare i componenti del "turk meccanico" (cioè gli esseri umani) necessari affinché la tecnologia sia all'altezza delle affermazioni.

Questa è davvero una storia molto antica. In parole povere: un pieno decennio fa, una startup del Regno Unito chiamata Spinvox, che aveva affermato di avere una tecnologia di riconoscimento vocale avanzata per convertire messaggi vocali in messaggi di testo, è stata segnalata come molto impegnata nei call center in Sudafrica e nelle Filippine … con personale, sì, veri umani.

Tornando ai giorni nostri la tecnologia "all'avanguardia", a seguito del rapporto di Bloomberg, Facebook ha affermato che ha sospeso le trascrizioni umane all'inizio di questo mese – unendosi ad Apple e Google interrompendo le revisioni manuali degli snippet audio per i rispettivi IIS vocali. (Amazon da allora ha aggiunto la disattivazione delle impostazioni dell'app Alexa.)

Abbiamo chiesto a Facebook dove nell'app Messenger stava informando gli utenti che gli appaltatori umani potevano essere usati per trascrivere le loro chat vocali / messaggi audio; e come ha raccolto il consenso degli utenti di Messenger a questa forma di elaborazione dei dati, prima di sospendere le revisioni umane.

La società non ha risposto alle nostre domande. Invece un portavoce ci ha fornito la seguente dichiarazione: “Proprio come Apple e Google, abbiamo sospeso la revisione umana dell'audio più di una settimana fa. "

Facebook ha anche descritto i frammenti audio che ha inviato agli appaltatori come mascherati e non identificati; ha detto che sono stati raccolti solo quando gli utenti hanno optato per la trascrizione su Messenger; e sono stati utilizzati solo per migliorare le prestazioni di trascrizione dell'IA.

Ha inoltre ribadito una confutazione di vecchia data da parte della società alle preoccupazioni degli utenti in merito alle intercettazioni generali da parte di Facebook, affermando che non ascolta mai i microfoni delle persone senza il permesso del dispositivo né senza l'attivazione esplicita da parte degli utenti.

Tuttavia, il modo in cui Facebook ottiene l'autorizzazione al trattamento dei dati è una domanda chiave.

La società ha recentemente utilizzato, ad esempio, un flusso di consenso manipolativo per spingere gli utenti in Europa a attivare la tecnologia di riconoscimento facciale, ripristinando la sua posizione precedente, adottata in risposta a precedenti interventi normativi, di spegnere la tecnologia attraverso il blocco.

Quindi molto si basa sul modo in cui Facebook ha descritto l'elaborazione dei dati in qualsiasi momento sta chiedendo agli utenti di consentire ai loro messaggi vocali di essere rivisti dagli umani (supponendo che si basi sul consenso come base legale per l'elaborazione di questi dati).

È improbabile che il raggruppamento del consenso in termini e condizioni generali per l'utilizzo del prodotto sia conforme alla legislazione sulla privacy dell'UE, dato che il regolamento generale sulla protezione dei dati del blocco richiede che il consenso sia limitato allo scopo, nonché pienamente informato e fornito liberamente.

Se Facebook fa affidamento su interessi legittimi per elaborare i frammenti audio degli utenti di Messenger al fine di migliorare le prestazioni della sua IA, dovrebbe bilanciare i propri interessi con qualsiasi rischio per la privacy delle persone.

Gli IA vocali sono particolarmente problematici a questo proposito perché le registrazioni audio possono acquisire anche i dati personali dei non utenti, dato che le persone nelle vicinanze di un dispositivo (o effettivamente una persona all'altro capo della linea telefonica che ti sta lasciando un messaggio) potrebbero essere acquisiti i loro dati personali senza aver mai avuto la possibilità di consentire agli appaltatori di Facebook di ascoltarli.

Le perdite di frammenti di Google Assistant sulla stampa belga hanno recentemente messo in evidenza sia la natura delicata delle registrazioni sia il rischio di reidentificazione identificato da tali registrazioni – con i giornalisti in grado di identificare alcune delle persone nelle registrazioni.

Molteplici resoconti della stampa hanno anche suggerito che gli appaltatori impiegati dai giganti della tecnologia stiano regolarmente ascoltando i dettagli intimi acquisiti attraverso una gamma di prodotti che includono la capacità di registrare l'audio e trasmettere questi dati personali al cloud per l'elaborazione.