Nom de Diou (.com), Carnet de découvertes et réflexions au jour le jour...

Aller au contenu | Aller au menu | Aller à la recherche

mardi 13 avril 2010

reCAPTCHA, ou une (autre) idée géniale...

Ce matin, je rassemblais quelques scans en pdf quand j'ai eu l'idée d'essayer la fonction de détection OCR (optical character recognition). Cela consiste à rechercher du texte dans les images pour pouvoir l'extraire. Techniquement -et rapidement- le logiciel compare le symbole détecté aux lettres connues en essayant de les superposer et en choisit la meilleure.

De façon encore plus simple, c'est un peu l'inverse d'une impression. L'imprimante transforme le texte numérique en texte dactylographié alors que la numérisation et détection OCR prend le texte dactylographié pour le transformer en texte numérique. Ce n'est pas nouveau mais je n'avais pas essayer depuis des années car je n'en gardais pas un très bon souvenir : A l'époque, plus d'un mot sur quatre était mal interprété... Aujourd'hui, je n'ai constaté que quelques erreurs et j'ai vraiment été bluffé.

Numériser des livres est un problème majeur et toujours d'actualité. En effet, cela permet de diffuser les connaissances plus facilement mais aussi de mieux les préserver des dégâts du temps... Lire un livre au format PDF ne l'altère pas et les lecteurs suivants, même beaucoup plus tard, ne constate aucune dégradation. Il n'y a certes pas la même sensation et il faudrait prévenir les éditeurs que c'est un peu l'arnaque de vendre les versions numériques juste un euro de moins que la version papier... Message passé, "ça c'est fait" comme dirait l'autre.

Toujours est-il qu'il est évident que dactylographier manuellement tous les anciens livres seraient un travail de titan, c'est pour éviter cela qu'ont été inventés les logiciels de détection OCR. Ainsi il n'y avait qu'à vérifier le contenu et à corriger la transcription proposée. Si tout se passait bien comme cela, le monde serait merveilleux et les éléphants seraient roses... Pour les livres très anciens, i.e. très altérés par le temps, la détection OCR ne fonctionne plus. En effet, les lettres ne sont plus que de gros pâtés donnant l'impression que c'est mon voisin de classe qui les a "écrites"... Plus aucune lettre n'est alors réellement identique au pâté et le logiciel est contraint de choisir la moins mauvaise. On transforme ainsi aisément le mot "blog" en "oiac", ce qui est (sensiblement) différent...

J'en arrive au véritable sujet de cet article. Il nous arrive à tous d'avoir des idées brillantes (au moins pour notre vie quotidienne) mais certaines sont plus remarquables que d'autres... Comment faire si la machine ne peut parvenir à décrypter les gros pâtés ? Prendre une consultation chez ceux qui sont habitués à en faire (non je n'ai pas parlé des médecins...) pour qu'ils nous les lisent ? C'est une idée mais cela risque d'être assez onéreux à force...

On peut faire cela plus discrètement et plus utilement. C'est ce que reCAPTCHA a fait. D'une pierre, deux coups. Je suis quasiment certain que vous avez déjà croisé leur signature sur internet :

Comme vous l'aurez remarqué, il s'agit d'un système CAPTCHA, comme on l'appelle, c'est-à-dire la vérification que vous êtes bien une personne et non un programme malveillant en vous demandant de recopier un texte qu'une machine ne serait pas capable de lire (c'est-à-dire des mots difficilement détectables via OCR).

Vous ne trouvez pas ça idiot vous de vous demander de recopier deux mots alors qu'un seul suffirait ? Et vous ne trouvez pas ça complètement débile de vous demander de recopier des mots qui sont difficilement visibles même pour vous ? Je suis d'accord avec vous... Enfin, je l'étais avant de connaitre la véritable utilité du système.

En effet, l'un des deux mots est connu par le système de vérification. C'est lui qui va servir à vérifier que vous avez correctement recopier les mots et donc s'assurer que vous n'êtes pas une machine. Ensuite, le deuxième mot est un mot que les systèmes OCR n'ont pas réussi à décrypter. Ainsi, si vous avez le bon premier mot, reCAPTCHA en déduit qu'il y a une forte probabilité pour que le deuxième soit vrai aussi. Après plusieurs réponses identiques pour un même mot inconnu, il est donc convaincu de sa transcription... Tadam ! Magie !

Tout cela pour vous dire de ne plus vous énerver quand vous verrez ce système. Vous participez à la numérisation de nombreux livres tout en montrant votre caractère humain au site... Et si vous voulez aider le projet dès maintenant ou juste essayer, c'est par ici ! ;)

Edit : Il s'avère que Google a racheté la société fin 2009. Cela ne change rien pour mon article, mais je tenais à le préciser afin qu'on ne pense pas que j'ai délibérément omis cette information.

Edit 2 : Pour information, Agoravox a reprit l'article à cette adresse. Vous avez la possibilité de vous exprimer sur le site (un débat s'est déjà installé).

samedi 6 mars 2010

Et toi, tu l'as trouvé x ?

Bonjour à tous !

J'écris ce petit billet pour vous informer que je viens d'ouvrir un nouveau blog parlant de ce qui prend une très grande partie de mon temps maintenant : les mathématiques.

Je n'ai pas l'ambition d'y écrire des cours magistraux, mais je souhaite plutôt donner un aperçu des mathématiques à tous en transmettant le plaisir de la "recherche mathématique" aux non initiés pour finalement montrer les jolies facettes de cette matière souvent incomprise des élèves...

Je me suis fixé l'objectif de publier chaque samedi une petite énigme mathématique dont sa solution est publiée le mercredi suivant.

A quoi ça sert les maths ? A trouver x... Et plus si affinités !

Soyez les bienvenue sur www.trouverx.com.

PS : Si vous avez des problèmes ou énigmes mathématiques que vous souhaitez partager via ce site, envoyez-les à : nicolas@trouverx.com. De même, contactez-moi si vous aimeriez être co-rédacteur de ce blog.

mardi 29 décembre 2009

Il court, il court le p'tit Jack... Attrapez-le vite !

Aujourd'hui, c'est un petit billet non sponsorisé que j'ai envie d'écrire pour promouvoir un jeu peu connu mais tout bonnement génial (que la Mère Noël m'a gentiment offert cette année). Je vous présente donc le jeu digne d'un Cluedo à deux joueurs et même plus encore : Mister Jack !

C'est un jeu pour deux joueurs se déroulant à Londres, plus précisément dans le quartier de Whitechapel, à l'époque de Jack l'Eventreur. Voici une rapide présentation du jeu :

Le but du jeu dépend du camp que vous jouerez. Le détective devra démasquer Jack l'Éventreur, qui se cache derrière l’un des huit personnages présents sur le plateau, et ce, avant la fin du 8e tour. En tant qu’assassin, vous devrez éviter à tout prix que votre véritable identité soit dévoilée durant les 8 tours du jeu. C’est encore mieux si vous arrivez à faire sortir Jack du quartier de Whitechapel ! Au début d’une partie, Jack va tirer une carte Suspect parmi les 8 (une par pion présent sur le plateau de jeu) qui sont en pile, face cachée. Il ne la montre pas à l’inspecteur, car c’est la véritable identité de l’assassin ! C’est ce pion que vous devrez protéger et faire sortir du quartier.

Tous les personnages présents sur le plateau se déplaceront sur deux tours : quatre au tour impair et les quatre autres au tour suivant. À la fin de chaque tour – après le déplacement de 4 personnages, donc –, le joueur Jack regarde dans quelle position se trouve son assassin. Si celui-ci est à côté d’un lampadaire ou d’un autre pion, le joueur annonce « Il y a un témoin ». Sinon, il dit « Il n’y a pas de témoin ». Dans un cas comme dans l’autre, l’inspecteur va pouvoir innocenter tous les personnages qui sont dans la situation opposée. Petit à petit l’étau se resserre ! Quand l’inspecteur est certain de l’identité du tueur, il n’a plus qu’à arrêter le pion en amenant un autre personnage sur la case du suspect. Si 8 tours ne se sont pas déjà écoulés, la partie est gagnée pour lui.

La subtilité du jeu réside dans la bonne utilisation des personnages, qu’il s’agisse de leurs déplacements ou de leurs pouvoirs. En effet, aux tours impairs, 4 personnages sont donc piochés au hasard et activés. L’inspecteur en jouera un, puis Jack deux, et enfin l’inspecteur le dernier. Au tour suivant, pour les 4 autres personnages, ce sera l’inverse. Quand un joueur joue un personnage, il le déplace de quelques cases puis utilise son pouvoir. Et ceux-ci sont variés : éteindre un lampadaire, innocenter un suspect, déplacer un barrage de police, ouvrir une plaque d’égout, échanger la place de deux personnages… C’est par le biais de ces déplacements et de ces pouvoirs que Jack tentera de faire s’échapper son suspect, et l’inspecteur de l’identifier et de l’arrêter !

Le jeu, une fois que l'on commence à en comprendre les mécanismes, devient vraiment addictif et même après plusieurs parties, je peux affirmer que je suis encore loin d'avoir atteint les limites du jeu. C'est un excellent jeu pour deux où la déduction et la stratégie règnent laissant peu de place à la chance (sauf peut-être pour les premières parties).

Voilà pour le coup de pub du jour... Et comme tout le monde ne voudra peut-être pas dépenser pour essayer le jeu, il existe une version gratuite jouable en ligne à l'adresse http://mrjack.hurricangames.com. Que demande le peuple ? Sachez aussi qu'une extension du jeu de base est sortie depuis (car le jeu date et gagne a être connu) ainsi qu'un tout nouveau jeu (ne nécessitant aucune des versions précédentes) : Mr Jack à New-YorK. Il parrait cependant qu'il serait plus difficile de jouer à ce dernier si l(on a jamais essayer le premier opus...

Vous aimez aussi ce jeu et vous voulez m'affronter en ligne ? Laissez un petit commentaire et si j'ai le temps, on verra ce qu'on peut faire ;) !

Bon jeu ! Fuyez maintenant ! Sherlock arrive...

Source : Présentation du jeu et image dénichée sur Asmodée.

jeudi 24 décembre 2009

Et Joyeux Noël à tous :)

Bonjour tout le monde,

En ce jour de fête, je vous souhaite à tous un joyeux Noël. Et voilà, j'ai finit ce billet. Comment ça, ça manque d'originalité ? Et vous vouliez un cadeau ? Ah... Bon c'est bien parce que c'est notre avant avant dernier Noël avant la fin du monde...

Je vais donc vous présenter, en guise de cadeau (qui n'en sera surement pas un pour votre porte-monnaie), un film merveilleux diffusé en ce moment dans tous les bons cinémas. J'ai nommé Twilight Tentation (nan je déconne je ne suis pas mordu de cette saga ;)). J'ai donc nommé Oscar et la dame rose. Mais qu'est-ce que ce film au titre digne d'un conte de Noël pour enfants ?

Et bien justement, c'est un conte de Nöel sur grand écran, et pour tous. Une histoire dramatique génialement mise en scène pour alterner larmes et rires et surtout pour raviver en chacun de nous l'envie de vivre pour au moins une dizaine d'années. Je n'ai pas d'autres mots que "Superbe" à la bouche pour décrire ce film et je suis certain que rien que la bande annonce vous donnera envie de courir le voir :

Même s'il ne me lira certainement jamais, je tiens à remercier le jeune Amir (dans le rôle d'Oscar) pour tout le bien qu'il m'a transmit pendant et après le film.

Joyeux Noël à tous.

mercredi 25 mars 2009

Welcome

Quel film que celui-là ! Une histoire bien ficelée, une réalisation réaliste, des personnages attachants, une fin inattendue. Si bien ficelé, que je ne peux en dire plus que la bande annonce sans dévoiler le scénario du film.

Je vous le recommande sincèrement... sauf si vous avez peur d'en ressortir bouleversé.

Voici, en complément, l'article de loi en question (L622-1 du Code de l'entrée et du séjour des étrangers et du droit d'asile) :

Toute personne qui aura, par aide directe ou indirecte, facilité ou tenté de faciliter l'entrée, la circulation ou le séjour irrégulier, d'un étranger en France sera punie d'un emprisonnement de cinq ans et d'une amende de 30 000 Euros.

Cette loi n'est fort heureusement pas toujours respectée comme l'explique Pierre Henry, directeur général de France Terre d'Asile :

Avec un tout petit peu de bon sens, on peut détourner la loi. Aider un sans-papier, c'est possible, mais à condition de le faire discrètement.

A bon entendeur.

NB : L'association SALAM (montrée dans le film) existe bel et bien : http://www.associationsalam.org/

samedi 24 janvier 2009

Le billet du (presque) dimanche...

Que vois-je ? Ils sont de retour pour la saison 4... Non, je ne vous parle pas des acolytes du Docteur House (eux, on les attend toujours), mais des deux compères de la Chanson du Dimanche...

Mon enthousiasme de retrouver les folles paroles des deux joyeux lurons a été décuplé en découvrant la vidéo que je partage avec vous ci-dessous. Il s'agit de l'épisode 3 de cette nouvelle saison. Episode engagé envers les expulsions massives, sur un ton humoristique, parfois décalé, mais toujours très revendicatif et avec... ô grande surprise... des blagues de geek... et des blagues mathématiques !

Sur les règles un peu déformées du mythique jeu de l'Oie, ils nous invitent ainsi à jouer au jeu de Loi... Pour tout comprendre de ce nouveau jeu, regardez donc cette vidéo :

J'adore, j'adhère, j'admire. J'arrête... et je vous souhaite une bonne fin de week-end.

A bientôt !

samedi 18 octobre 2008

Le Big Livre de l'Incroyable

Bonjour à tous,

La semaine dernière, je recevais un mail de la part de Medhi de l'agence YouToYou dans le but de m'envoyer gratuitement un exemplaire du Big Livre de l'Incroyable.

Et bien ce matin, le facteur est venu jusqu'à chez moi pour me donner un gros colis, et j'y ai trouvé sans surprises ce livre :

Le livre est très grand, agréable à regarder et le contenu est pour le moins... incroyable ! Comme en témoigne, cet exemple choisi non sans hasard :

A tout juste un an, Rudi, le lapin d'une habitante de Berlin, pesait 10kg, mesurait 94cm de long avec des oreilles de 20cm... et continuait de grandir.

C'est Alice qui serait comblée avec un lapin comme ça... Leila a du chemin à faire...

La chose la plus incroyable que j'ai vu dans ma vie de mes propres yeux, c'est... l'étendue de la connerie de mon collègue cet été... Et vous ?

dimanche 12 octobre 2008

Et y'en a qui bossent encore...

Vous avez surement déjà vu des lipdubs d'entreprises (un playback animé dans les locaux), et bien c'est l'IUT de Rouen qui s'y est mit récemment et ça donne ce résultat :

Une jolie prestation qui a surement du demandé beaucoup d'entrainement... Ce même temps que nous, à Nantes, nous passons à faire des... maths...

dimanche 21 septembre 2008

Max la menace, drôle sans être lourd...

Il se trouve que la semaine dernière nous sommes allés à la rentrée du cinéma (avec les places à 3,50€). Nous avions en tête d'aller voir Batman ou Mirrors mais en fait le décompte des places s'est fait sous nos yeux jusqu'au seuil de zéro quand nous arrivions en caisse. Laurie avait entendu parler de Max la menace, un espion raté, et c'est donc ce que nous sommes allés voir.

Personnellement, je m'attendais à un film lourd, avec des gags à la "Juste pour rire" tout le long du film, sans accroche, et pas vraiment drôle... Ce n'est pas bien de juger au premier regard... Quoique dans le film, Max aurait mieux fait de s'y fier, mais moi j'avais tort sur toute la ligne...

L'humour est en fait très fin et toute la salle rigolait dès qu'il y avait un gag... J'ai trouvé les acteurs excellents et le scénario pas mal non plus... Basé sur la série du même nom (que je n'ai jamais vu), il semble y'avoir quelques clins d'œil comme la chaussure téléphone mais on en trouve aussi beaucoup d'autres comme par exemple à James Bond et ses gadgets sophistiqués...

Je vous conseille donc ce film et suis déçu de penser qu'il passe un peu aux oubliettes... La Nuit Noire lui fait de l'ombre...

jeudi 28 août 2008

Graphistivo, drôle et talentueux.

Chers lecteurs,

Cela ne m'arrive pas souvent mais quand certains blogs le méritent, j'aime les mettre en avant ici pour vous les faire connaître.

Je suis tombé hier par hasard (en fait en regardant la dernière VDM illustrée) sur un blog BD qui m'a tenu en haleine (si bien que j'ai visité une grande partie des archives).

Voilà un petit exemple que j'ai retenu car je sais qu'ici, nombreux sont ceux qui aiment Docteur House :

Je ne peux que vous conseiller le blog BD de Stivo, et ses services.

- page 1 de 3