Voici un article sur quelque-chose que je viens de découvrir un peu par hasard, et qui m’a un peu voir beaucoup surpris ! On en apprend tous les jours, et aujourd’hui je le partage !

Les Captcha ou le double effet KissCool

Tout le monde connaît et a eu affaire aux Captcha sur des sites web ou formulaires de contact : ces petites cases vous posent des questions afin de prouver que vous êtes bien un humain et non une machine. Rien de sensationnel dans tout cela, cela sert juste à éviter les méchants spammers d’envoyer des messages de pub via les formulaires en ligne non ?

Et bien oui et non comme on va le voir !

Détournement de la fonction originale

Les Captchas ont peu a peu ajouté des « fonctionnalités » a leur but initial. Voici un petit aperçu de cette évolution.

Niveau 0 – pas encore de détournement

Pour la petite histoire, les captcha ont été inventés en l’an 2000 dans une université américaine. Le terme CAPTCHA est l’acronyme de Completely Automated Public Turing test to Tell Computers and Humans Apart (test public de Turing complètement automatique afin de différencier les humains des ordinateurs). A l’origine vers les années 50, le test de Turing tentait tout simplement de répondre à la question : « une machine peut-elle penser ? ».

Les captcha de cette époque était juste des questions du type  » 3 + 4 = ? « .

Niveau 1 – transcription de textes en travail dissimulé

L’un des inventeurs du Captcha se dit qu’il pourrait mettre à profit les interactions avec les humains (estimés à 200 million par jour en 2006)  pour aider l’intelligence artificielle à « retranscrire » des textes scannés.

Google repère cette opportunité qui s’ouvre et rachète reCaptcha en 2009.

Google a depuis sa création la volonté de créer le plus grand ensemble de contenu numérisé existant. reCaptcha va lui permettre de combler les lacunes de l’IA de son système reconnaissance de caractère.

Les captcha ont donc été composés de deux mots à retranscrire : l’un d’eux est connu par la machine, et l’autre non. Si le mot connu est entré correctement, alors le second est enregistré. Si plusieurs utilisateurs donnent la même retranscription au mot inconnu, alors celui-ci est validé.

Ce process a duré environ deux ans, puis a du être modifié pour deux raisons :

  • l’intelligence artificielle de transcription est devenue « trop » efficace (les mots restant trop difficile à déchiffrer même pour les humains),
  • toutes les ressources numérisables l’ont été en 2011 (tous les références de Google Books ainsi que l’intégralité des 13 millions d’articles de presse du New York Times depuis 1851 entre autre !).

Que faire alors de toute ces secondes de cerveaux disponibles ?

Niveau 2 – collecte de données pour Google Maps

A partir de 2012, l’intelligence « collective » est utilisée pour la reconnaissance d’image, bien moins perfectionnée alors que pour l’OCR.

Google commence par street view, avec le même système de validation de l’utilisateur que précédemment (c’est tout de même le but des captcha il ne faut pas l’oublier !), mais avec un deuxième mot à reconnaitre provenant d’une image de street view, par exemple des numéros de maison ou des panneaux de signalisation.

Les données collectées à force de secondes « volées » aux utilisateurs (moins de temps serait nécessaire par personne pour la seule validation humain/robot, ce temps supplémentaire est estimé à 250 000 heures par jour en 2006) sont ajoutées à la base de donnée de Google Maps. Pratique non ?

Pourtant, comme on l’a vu ci-dessus, les machines peuvent réussir à résoudre ce type de captcha : le système était bien pour Google Maps mais ne répondait plus au besoin initial. Il a donc fallu inventer de nouveaux systèmes de tri.

Niveau 3 – double but pour la nouvelle version de reCaptcha

En 2014, fini les mots ou les chiffres à taper : il y a juste une case à cocher ! Pratique !

Comment cela fonctionne-t-il ? Les outils de reCaptcha sont-ils devenus devins pour savoir en un clic si vous êtes humains ou non ?

Afin de savoir si vous êtes ou non un robot, les outils de Google sont mis en place non plus juste sur le formulaire à « protéger ». L’analyse des comportements des visiteurs sur la page est étudié, grâce au temps passé pour remplir le formulaire ou avec les mouvements de souris, mais les cookies ou les paramètres du navigateurs sont aussi passés en revue. Tout cela permet de déterminer si vous êtes plutôt du genre robot ou humain.

3.1 : marketing comportemental

Fini le travail dissimulé alors ? Au contraire : au lieu d’être un travailleur anonyme, votre travail est personnalisé. Grâce aux cookies de votre navigateur, vous êtes identifiés et votre comportement sur chaque site « équipé » est enregistré et vient compléter votre profil. Si vous n’avez pas de compte Google connecté, alors les cookies sont tout de même utiles pour remplir une sorte de shadow profile, qui pourra peut-être être relié plus tard à votre véritable profil et qui en attendant donne des informations sur les comportements globaux des internautes.

Si votre navigateur est paramétré pour être bien « protégé » contre ces méthodes de pistage, alors vous leur êtes totalement inutile : vous êtes donc fichés comme « suspect » et cocher la case ne fonctionne pas : on vous renvoie vers la caisse pour payer le captcha du site que vous visitez : direction les cases à cocher !

3.2 : nourrissage de réseaux neuronaux

Ce n’est pas une blague ! Si pour les raisons évoquées si dessus ou tout simplement si Google en a besoin, alors vous êtes redirigés vers les cases à cocher de ce type là :

Et comme vous l’avez peut-être remarqué, généralement il n’y en a pas qu’un à remplir. On se dit généralement « merde j’aurai dû mettre le haut de la 3e case je me suis trompé » en fait pas du tout : certaines grilles sont connues et permettent de vous classifier humain ou non, tandis que d’autres sont juste du travail bonus ! Et quel est le job ? Entraîner un réseau neuronal d’un système d’intelligence artificielle !

Saurez-vous distinguer un feu rouge d’un lampadaire ?

Comment cela fonctionne-t-il ? l’IA n’est au début pas vraiment intelligente : tout comme les humains au cours de leur vie, pour reconnaitre un feu rouge par exemple il faut que savoir à quoi ça ressemble généralement, pour définir quelques caractéristiques communes de ceux-ci : on est ensuite capable de reconnaître un feu rouge dans a peu près n’importe quel pays par la suite, et les différencier des lampadaires sans trop de problèmes. Et bien c’est pareil pour l’IA, il faut lui apprendre ou vérifier ce qu’elles ont appris et c’est ce que font les internautes en cochant les cases des captchas : c’est le deep learning.

Quelle utilisation pour l’Intelligence Artificielle que nous participons tous à former ?

Site internet de Waymo, la voiture autonome de Google

Comme on pouvait s’en douter avec les panneaux de signalisation, passages piétons et autres infrastructures routières que l’on doit reconnaitre dans les Captcha, c’est dans le domaine de la voiture autonome que les logiciels sont à présent entraînés. Le slogan de Waymo aurait d’ailleurs pu être « You‘re building the World’s Most Experienced Driver » !

En tout état de cause, il semblerait aujourd’hui que Google n’ai plus besoin trop besoin de nous pour les voitures, car il lance sa nouvelle version de reCaptcha : que nous réservent-t-ils pour la suite ?

 

Niveau 4 – data mining

Le nouveau système, appelé « No Captcha Recaptcha » annonce fièrement qu’il n’est désormais plus nécessaire ne serait-ce que de cocher une case pour savoir si l’on est un robot ou non. Il s’agit tout simplement d’une évolution de la première étape de leur système précédent : analyse du comportement et de l’historique, mais cette fois-ci appliquée à toutes les pages du site (et de toutes celles des autres sites visités avant grâce aux cookies). Il vous est ensuite attribué une note en fonction du risque potentiel que vous présentez.

La vidéo de présentation de l’outil est très claire : plus l’outil est mis en place largement sur le site, plus il sera efficace. Il faut qu’il soit en mesure de scanner toutes les interactions avec les utilisateurs pour détecter les robots.

« Les utilisateurs ne sont plus dérangés, tout le monde est content, sauf les robots ! ». Et les plus heureux sont sûrement les analystes de Google, qui peuvent désormais compter sur une quantité impressionnantes de données comportementales sur un maillage de millions de site web différents, afin rendre leurs activités toujours plus rentables (il faut rappeler que 75% des 30’700’000’000 de dollars de bénéfices de Google en 2018 proviennent de la publicité).

En conclusion

Est-il si gênant que cela de perdre quelques secondes par-ci par là ? Pourquoi ne pas profiter tout simplement d’un internet gratuit grâce à ces entreprises du web qui ont trouvé un business model qui profite à tout le monde ?

Je ne le souhaite pas personnellement. D’une part, rien n’est vraiment gratuit et les milliards de bénéfices ont bien été payés par quelqu’un. D’autres part tout le monde se retrouve à payer le prix de la surproduction, elle-même conséquence de notre société basée sur la croissance infinie de la consommation – et de son moteur, la publicité toujours plus efficace pour créer nos besoins.

Lutter à son niveau contre la publicité -directe ou indirecte – est une lutte contre cette forme de société.

Le sujet de la conclusion nécessiterait bien plus que trois ligne pour être traité correctement et convaincant, mais ce n’est pas le but de l’article ! Si vous avez pu vous rendre compte d’une des nombreuses méthodes utilisées pour faire tourner la grande machine des GAFA, alors c’est tout bon !

 

Pour aller plus loin dans les rouages des géants du net, et par conséquent dans les coulisses de nos vies numériques actuelles, je vous conseille le livre « Capitalisme de plateforme« , ouvrage très pointu dans le domaine de l’économie traitant des conditions qui ont permis l’émergence et le développement des grandes plateformes numériques (entre autre les GAFA – Google Apple Facebook Amazon), puis détaille leur mode de fonctionnement pour comprendre quel est « pour de vrai » leur modèle économique.

 

 

 

PS : je viens de retirer « voici un petit article » du premier paragraphe. Si j’en doutais encore, il faut que je me rende à l’évidence : je ne sais pas écrire de petits articles, rapides et efficaces, il faut toujours que j’aille chercher la petite bête et comprendre tout dans les moindres détails… J’ai pourtant fait des efforts, et il reste sûrement quelques zones d’ombres, erreurs ou omissions que vous me pardonnerez ! :)

Bonjour à tous,

Lors de la création de l’association nous avons réfléchi au choix de la banque pour notre association, afin de s’occuper de notre futur pactole ;). Nous avons tout d’abord réfléchi au fait d’avoir un compte en banque ou non, mais malheureusement c’est une question  qui est aujourd’hui assez vite tranchée.

L’influence de l’argent des banques dans le financement des grand projets dans des domaines que ne l’on souhaite pas forcément voir perdurer est très importante, la plupart des grandes banques bidouillent pour envoyer leurs bénéfices dans les paradis fiscaux, et en ne se préoccupant pas à quoi sert « son » argent, qui est en fait celui des banques tant que l’on ne s’en sert pas, on se retrouve vite à être complice sans le vouloir de toutes ces entourloupes.

Pour se renseigner sur ces pratiques et ce qu’il est possible de faire je vous conseille ce très bon article d’attac :

Petit guide pour prendre le contrôle sur la finance – #PasAvecNotreArgent

Concrètement, au Labo M, nous avons choisi de nous orienter vers une banque qui serait, si ce n’est meilleure que les autres, au moins moins pire du point de vue environnementale et sociétale.

Voici les recherches que nous avons menées pour trouver cette banque parfaite :

Les TOP 10 selon plusieurs sites

  • Sur http://epargneclimat.com/ on trouve le classement suivant (de la moins pire à la pire) en termes d’empreinte carbone:
  1. Nef
  2. Crédit Coopératif *
  3. Banque Postale
  4. BPCE
  5. Crédit Mutuel
  6. Société Générale
  7. BNP Paribas
  8. HSBC (Groupe)
  9. Crédit Agricole

 

  1. La Nef
  2. Crédit Coopératif
  3. Banque Postale
  4. Crédit Mutuel – CIC
  5. Banque Populaire
  6. Caisse d’Epargne
  7. Société Générale
  8. Crédit Agricole – LCL
  9. BNP Paribas
  • Sur www.fairfinancefrance.org, qui émet une analyse sur d’autres critères d’éthique (droits humains, droits du travail, transparence,…), le site ne propose malheureusement pas de classement mais offre la possibilité de comparer les banques 1 à 1. La Nef et le Crédit Coopératif s’en sortent mieux que les autres. Ensuite, ça colle à peu près au classements ci-dessus, même si c’est un peu plus difficile de trancher en faveur de la Banque Postale…

Fort de ces informations, nous choisissons donc fièrement Le Crédit Coopératif, la NEF n’étant pas une banque à proprement parler.

Ouverture du compte au Crédit Coopératif

Notre choix arrêté, nous récupérons donc les papiers pour faire le dossier, et là les premières difficultés apparaissent :

  • quelle agence choisir, entre Besançon, Strasbourg et l' »agence virtuelle » ? Il n’y en a pas de plus proches…
  • comment fournir le papier d’inscription de l’association au RNA (Registre Nationnal des Associations) alors que notre asso n’y est pas, étant une asso loi 1908 spécifique à l’Alsace Moselle ?
  • Comment communiquer avec la banque, sachant que chaque réponse à nos mails est envoyé par une personne différente, avec une réponse stéréotypée ?

De nombreux autres couacs des deux côtés ont poussé le crédit coopératif à nous renvoyer la totalité de notre dossier, pourtant a priori complété, sans aucune explication… Les coups de fils n’ont pas aidé non plus, et après plus de six mois à essayer nous sommes un peu découragés : la distance ne favorise pas le « contact humain », or nous avons absolument besoin d’un compte en banque pour résoudre une autre problématique parallèle : la retenue des recettes des entrées du Folk par Paypal sur leur système, tant que l’on a pas de compte pour le récupérer (sujet qui sera peut-être abordé plus tard !). Bref, on décide de passer au plan B.

Le marketing de la Banque Postale s’appuie plus sur la proximité et la simplicité que par son engagement dans l’ESS…

Plan B : la Banque Postale

Assez déçus par la réaction du Crédit Coopératif, et finalement assez dubitatifs sur la pertinence de prendre une banque qui ne connait pas les spécificités des règles du monde associatif alsacien et qui se trouve à plusieurs centaines de kilomètres de notre association locale, nous nous retranchons sur la banque suivante dans notre classement : La Banque Postale.

Ses avantages sont sa proximité, sa connaissance de l’Alsace, son habitude du monde associatif local. Les visées environnementales et sociétales de notre choix tombent un peu à l’eau, et même si ce n’est pas la pire des banques il n’y a pas beaucoup d’efforts fait spécifiquement dans ce sens… la vie est une question de compromis.

L’ouverture est assez rapide, dans l’agence de Ferrette à 12km du Morimont : ce sera plus facile si on décide d’y déposer notre liquide et chèques de cotiz !

Conclusion

A-t-on manqué de volonté sur ce coup là ? Le Crédit Coopératif a-t-il fait le nécessaire pour favoriser notre adhésion ou sont-ils débordés au point de ne pas se soucier d’une nouvelle petite association, qui plus est de droit local alsacien ?

Je pense qu’on peut dire qu’on a fait ce qu’on a pu, et que le résultat n’est pas si désastreux que cela.

Par ailleurs, comme pour beaucoup d’autres sujets, il est sûrement plus efficace de changer ses usages en plus de ses outils pour faire pencher la balance dans un sens donné (par exemple, réduire ses déplacements sera toujours plus économe que d’opter pour une voiture plus « écologique »).

En plus du reste donc, à nous de trouver des usages de notre argent pour éviter que les banques en fassent n’importe quoi !

Des petites recommandations pour ceux qui sont encore chez Google !

Au Labo M, nous tentons de nous dégoogliser. Ou plutôt, comme c’est une nouvelle structure, nous cherchons à utiliser des services libres et ouverts, ou au moins respectueux des données personnelles, la monnaie locale sur internet.

Pourquoi ? D’autres sites expliquent cela beaucoup mieux ! A commencer par Framasoft, qui explique tout cela sur la page dédiée :

https://degooglisons-internet.org/

En attendant le déclic…

Ne pas rentrer dans le système Google ou consorts est plus facile que d’en sortir, je l’expérimente personnellement depuis quelques années… Cela prend du temps et demande certains sacrifices, et tout le monde n’est pas prêt ou n’a pas les capacités techniques de s’en sortir.

Il faut continuer à essayer, et ce que je vous conseille en attendant, c’est de contrôler les données qui sont stockées et utilisées par Google pour vous faire vendre : comme tout bon produit Google c’est assez bien fait, en quelques minutes vous aurez tout décoché !

C’est clair et en français : naviguez sur ce site et décochez tout ce qui vous semble empiéter sur votre vie privée, notamment :

  • Les activités : enregistre, jour par jour et heure par heure, tout ce que vous recherchez/regardez sur GMail, Youtube, Maps et Google bien sûr.

Exemple pour le 16 mai 2018 : 71 éléments enregistrés, des itinéraires, des recherches web, les messages gmail regardés, fichiers drive utilisés, en gros on peut se refaire le planning de la journée : pratique si on a besoin d’un alibi !

-> Conseils :

  • supprimer les activités déjà enregistrées.

  • désactiver l’enregistrement de nouvelles activités.

 

  • Personnalisation des annonces : utilise vos données/activités pour vous pousser à la consommation en trouvant des produits dont vous n’avez pas besoin mais qui peuvent vous faire envie. -> Conseil : désactiver la personnalisation

Petit clin d’œil : une fois qu’on désactive les publicités personnalisées, Google nous propose un site web externe qui permet de désactiver les pubs personnalisées de toutes les autres entreprises du secteur ! Malin jusqu’au bout ce Google ! :)

 

Voilà qui permet de réduire les conséquences à titre personnel de l’utilisation des services Google ! Il faut juste espérer que tout le monde ne va pas faire cela, sinon Google va faire faillite !

N’hésitez pas à me faire part de vos commentaire ci-dessous si nécessaire.

Guilhem pour le Labo M