Il Classificatore Nearest Neighbor
Il “vicino più prossimo”, letteralmente ciò che intendiamo con Nearest Neighbor.
Cos’è questo classificatore e perché risulta così importante nel nostro mondo AI?
Si tratta di un sistema in grado di classificare gli elementi che riceve come informazione, al fine di trovare dei dati di allenamento che si avvicinano di più all’elemento analizzato.
Facciamo un esempio con il diagramma seguente, proprietà di Elements of AI, il corso gratuito ufficiale e riconosciuto sull’intelligenza artificiale, nonché il corso più completo su quest’argomento.

Nel diagramma abbiamo un insieme di dati, con due classi diverse, di colore blu e verde.
Le stelle invece rappresentano i dati di test, che in questo caso vengono classificati di classe “verde” poiché il dato di allenamento più vicino a loro è appunto di classe “verde”.
Semplice, vero?
Non sempre, poiché alcuni dati dati non saranno per forza semplici puntini colorati in uno spazio definito. Potremmo incappare anche in dati di tipo testuale che renderebbe più complicato il tutto.
Proprio per questo la distanza è un dato che deve essere definito a seconda del caso che andremo a trattare.
L’utilizzo del Classificatore Nearest Neighbor
Altri tipi di applicazione di questo metodo potrebbero essere quelli dovuti al comportamento degli utenti, come ci suggerisce sempre Elements of AI.
Persone con un determinato comportamento in fase d’acquisto nel passato, tenderanno ad avere lo stesso tipo di comportamento anche in futuro.
Il sistema utilizzerà un metodo chiamato “filtraggio collaborativo” per prevedere le preferenze dei consumatori, in base alle preferenze degli altri consumatori, utilizzando dei filtri specifici.
Rendiamola leggermente più semplice.
Acquisto un film in streaming, sono residente a Milano, siamo ad agosto e nello stesso periodo acquisterò anche la tazza bellissima che compare proprio in quel film.
Il nostro comportamento influenzerà gli utenti futuri che acquisteranno quello stesso film alle stesse ipotetiche condizioni, per cui il sistema potrebbe pensare e consigliare successivamente l’acquisto della tazza.
Diciamola ancora meglio. Magari il nostro comportamento è già stato influenzato da un comportamento passato e non siamo i primi a comprare quella tazza.
La potenza del classificatore Nearest Neighbor è chiara?
Il classificatore Nearest Neighbor viene utilizzato dalle aziende per intercettare i gusti dei consumatori e proporre quel tipo specifico di prodotto, nel momento opportuno per uno specifico utente.
Questo sistema ha i suoi incredibili vantaggi ma anche punti d’ombra parecchio importanti.
Uno su tutti è la possibile creazione delle “Filter Bubbles”. Qui si apre un discorso complesso.
Ancora una volta, cerchiamo di renderlo semplice.
Le Filter Bubbles mostrano la loro potenza estrema sui social media, ovvero con l’allenamento del proprio algoritmo, quindi apprendimento e contenuti specifici per l’utente.
Mettere mi piace, commentare sempre gli stessi post, seguire le persone che trattano solo uno specifico argomento e non concentrarsi invece “sull’insieme”, farà capire all’algoritmo che ci interesserà solo quel tipo di contenuti.
D’altronde lo scopo principale dei social è quello di farti passare sempre più tempo sulla piattaforma e questo si può fare mostrando agli utenti finali qualcosa che invogli loro a restare più tempo sulla piattaforma. Quindi dei contenuti mirati e specifici.
Le bolle di filtraggio dette così potrebbero non sembrare pericolose e anzi, molto utili, ma potrebbero nascondere qualcosa di più criptico e di difficile gestione futura.
Il rischio negativo è quello di NON mostrare realtà che accadono al di fuori del gusto dell’individuo stesso. L’utente continuerebbe a vedere solo cose inerenti al suo interesse ma questo non sempre è positivo.
Pensate ai possibili risvolti di questi classificatori o algoritmi.
Un classificatore così potente da poter essere utilizzato per proporre le giuste cose alle giuste persone, ma anche per ricevere i giusti consigli nel momento migliore.