Ho assistito a un seminario di Bengio sul suo progetto e ne avevo riferito in ista il 9 aprile.

Bengio dice di aver utilizzato un “sintetizzatore” per produrre nuovi esempi di apprendimento, da aggiungere a quei pochi “inizialmente" a disposizione.

"the ML model is initially trained with synthetic data to a degree that provides a moderately effective risk predictor, the model requires training on real data in order to yield a risk predictor with the level of accuracy needed to reduce the spread of Covid-19"

È una tecnica consolidata di ML ampliare i dati annotati gold con dati prodotti in modo artificiale, anche se imprecisi.
Una delle tecniche più comuni è di aggiungere i dati predetti da un primo modello per costruire il successivo.
Non sono stati usati annotatori manuali per questi dati.

Bengio spiega che con la app in funzione, sarà possible ottenere ulteriori dati reali, chiedendo a un certo numero di utilizzatori volontari della app di fornire informazioni ulteriori, rispetto allo stretto necessario per il tracing, al fine di migliorare l’accuratezza delle previsione diella app. 

"While the information collected for the purpose of training the machine learning model is necessary, it is only necessary that a certain quantity of such information be collected. For any given user, it is not necessary that information be collected from that user. As such, in recognition of the privacy preserving nature of the application, the application allows individuals to opt-in to allowing COVI Canada to access and use this information notwithstanding its necessity. The potentially sensitive analytics data obtained here is brought under this opt-in consent for similar reasons. As necessary as it is to provide the best possible recommendations, we do not need to track the correlations between recommendations made and risk levels over time for each and every user in order to assess the efficacy of the recommendations made.

Naturally, we hope that many Canadians will choose to volunteer their data so that we can build better risk prediction and better recommendations into the app, and create better epidemiological models to guide public policy."

— Beppe

On 19 May 2020, at 21:39, nexa-request@server-nexa.polito.it wrote:

Date: Tue, 19 May 2020 12:44:37 +0200 (CEST)
From: Antonio Casilli <antonio.casilli@telecom-paris.fr>
To: nexa <nexa@server-nexa.polito.it>
Subject: [nexa] L'app magica di Yoshua Bengio
Message-ID:
<1627638310.27764937.1589885077844.JavaMail.zimbra@enst.fr>
Content-Type: text/plain; charset=utf-8


Notizia dal Québec: Yoshua Bengio ha finalmente presentato la sua applicazione di contact tracing che è doppiamente magica, perché è anonima e in più c'è anche l'IA. 

"COVI utilizza l'intelligenza artificiale per dare ai cittadini la possibilità di proteggersi, limitare la diffusione del virus e facilitare l'allentamento sicuro e informato delle misure di distanziatione sociale da parte delle autorità sanitarie". 
https://www.indexsante.ca/nouvelles/845/yoshua-bengio-et-ses-collaborateurs-devoilent-le-nom-de-leur-application-de-tracage-de-la-covid-19-et-lancent-un-livre-blanc.php

Il grosso dell'annuncio concerne la pubblicazione di un grosso documento LaTeX, ottimisticamente definito "libro bianco" che spiega come funziona l'applicazione. 
https://mila.quebec/wp-content/uploads/2020/05/COVI-whitepaper-V1-1.pdf

La cosa interessante è che, a differenza della quasi totalità dei documenti di questo tipo, questo non è stato fatto da criptografi, quindi non parla solo ed esclusivamente di anonimizzazione e privacy, come se i dati smettessero di esistere una volta raccolti. Qui c'è un minimo di approfondimento sui modelli epidemiologici usati per valutare lo score di rischio delle persone tracciate. 

Ed è proprio qui che ho incontrato un po' di difficoltà e se qualcuno della lista potesse aiutarmi a capire meglio la parte di ABM/ML, gliene sarei grato.

"We have trained a machine learning predictor in a supervised way using data generated from the simulator,
using a simple contact tracing heuristic to generate the messages. To obtain preliminary results measuring the
impact of using machine learning to predict contagiousness and obtain risk level messages, we have then
used that predictor inside the simulator to influence the behavior of the agents according to four levels of
recommendations associated with different thresholds of risk levels. This has allowed us to simulate (with
different random seeds than those used for generating training data), how the ML predictor would impact the
reproduction number Rt of the disease and the growth of infections in a small pilot population of 1000 (it is
indexed by time t because it can evolve over time, depending on the recommendations received by citizens
from public health authorities and their app). The simulation was performed with the assumption that 60% of
the population was using the app and users at the strongest level of recommendation (quarantine level) got
tested. " 

In parole povere, un gruppo di scienziati ha progettato una simulazione multi-agenti piena di bias e di assunzioni legate alla loro percezione non-specialistica della realtà sociale, ha fatto annotare i dati così ottenuti da micro-lavoratori le cui condizioni di lavoro sono sconosciute, ha utilizzato il predittore così ottenuto all'interno della stessa simulazione di prima, assumendo un livello di adozione (60%) mai osservato in un contesto empirico. Perché dovremmo fidarci dell'app magica di Yoshua Bengio?

Cheers, 

---a

-- 
Antonio A. Casilli
Professor, Telecom Paris, Institut Polytechnique de Paris
Member, Interdisciplinary Institute for Innovation (i3 UMR 9217 CNRS) 
Associate Member, LACI-IIAC (EHESS)
Faculty Fellow, Nexa Center for Internet & Society

*We respect your right to disconnect. This email send time is due to my own workflow efficiency. You are in no obligation to take action or reply to it outside your office hours.*