Vous en parlerez à votre cheval...

Des anecdotes plus ou moins inintéressantes sur la vie d'une tortue folle de grammaire et de langues anciennes et à l'esprit tordu. Blog créé juste parce que l'envie m'en démangeait.

20 novembre 2012

Akinator, le retour

akinator_defi

J'en avais déjà parlé, et en farfouillant dans l'historique des visites sur ce blog, je suis retournée voir ce qu'il devenait. Mais si rappelez-vous ! Akinator, ce fameux "génie du Web" télépathe, qui devine à quelle personne vous pensez.

Je me rappelle qu'on en a parlé une fois avec un prof, parce qu'en réalité, la technique derrière tout ça est extrêmement simpliste. Même si j'imagine qu'il faut une base de données en amont assez colossale, le principe est le même que notre "ni oui ni non". Et s'il échoue une fois, le personnage auquel vous avez pensé est ajouté à la base. Ainsi il s'enrichit et s'améliore à chaque échec.

Malgré tout, ce petit logiciel reste bluffant. Il a tout de même trouvé Julia Ogden (Les Enquêtes de Murdoch), Monk de la série éponyme et Julie Teeger, la fille de son assistante, Virgile, mon frère, Bertrand Russel, Ingvar Kamprad (fondateur d'Ikea) et Richard Stallman (père de GNU) ! Par contre, je l'ai vaincu avec Antoine Culioli (linguiste spécialiste de l'énonciation), Félix Gaffiot et Solédango (Candélabres). Les deux derniers étaient déjà un échec il y a quatre ans et demi.

montage

 

Posté par incitatus à 06:30 - Commentaires [2] - Permalien [#]
Tags : , ,

08 septembre 2012

Nouvelle marotte

La série a déjà deux ans, mais je ne suis pas à ça prêt. Découverte à la télé la semaine dernière, quatre épisodes d'un coup, j'ai eu du mal à m'arrêter. Finalement, la fin de la première saison va m'apporter un répit d'un jour ou deux, j'espère.

ALEX-nikita-26446335-1920-1200 nikita

Alex et la fameuse Nikita

Tirée du film, que j'ai envie mais pas encore eu l'occasion de voir, Nikita a tous les ingrédients pour me plaire. Espionnage, intrigues intriquées et tordues, trahisons, retournages de veste à la pelle, on ne sait plus qui est avec qui, complots et machinations politiques, et beaucoup d'action (les anglophones emploieraient volontier le mot si délicat de "mind fuck" à ce sujet, mais je suis trop sophistiquée pour ça). Et des personnages féminins forts. Ce n'est pas compliqué : les deux personnages centraux sont des femmes et le plus terrifiant des personnages (les psychologues sont effrayants quand ils œuvrent « pour le mal ») est une femme. Les hommes, en comparaison, semblent plus effacés, mais ce n'est qu'une vue de l'esprit. J'ai une affection toute particulière pour le hacker-geek-génial.

nikita-saison-1-2-10290447otaom_1798 Nikita-1x05-The-Guardian-Birkhoff-Cap-02amanda-nikita_4aox7_1uca8b Nikita-1x12-free-ryan-fletcher-cap_mid

En haut à gauche, Michael, un méchant-gentil-loyal-on-ne-sait-pas-envers-qui.
A sa droite, Birkhoff, mon geek préféré.

En bas à gauche, Amanda la psy traumatisante et très bizarre et détestable.
Enfin, Ryan, des renseignements à la CIA (il en fallait bien un).

Par contre, le doublage français n'a pas eu l'heur de vouloir laisser les intrigues internationales en multilingue : déjà que l'anglais a tendance à être parlé aussi facilement en Ouzbékistan qu'au fin fond de la Sibérie dans la VO, mais quand même les morceaux sous-titrés anglais sont doublés, ça devient ridicule (sans doute est-ce la faute au torrent, mais chut, faut pas le dire) ! C'est dommage, les complications linguistiques sont toujours tout-à-fait fascinantes dans les films d'espionnage. En dehors de ces détails, les voix françaises sont plutôt réussies, ce qui n'est pas souvent le cas.

En attendant, j'ai synthétisé cinq seconde de voix (clic clic pour écouter), et fait des arbres syntaxiques de ouf !

tour2

Posté par incitatus à 02:40 - Commentaires [0] - Permalien [#]
Tags : , , , , , ,

26 juin 2012

Concordancier mortel

J'ai aujourd'hui fait la découverte d'un concept que je ne connaissais pas : il s'agit du concordancier, qui est un corpus permettant de présenter un mot recherché dans son contexte.

Bref, si je vous en parle, c'est parce qu’une collègue nous a transféré le mail d'un chercheur qui en développe un. C'est là que les choses étranges commencent (ces bizarreries démontrent que les scientifiques, et les linguistes ici en particulier, ont le sens de l'humour et des références).

- Le projet s'appelle Sarcophagus.

- Le chercheur précise que "pour les fans, l'ouverture du logiciel est digne d'un film de Tim Burton ;-)".

Il dépend de deux autres projets.

- Le premier s'appelle Carcass (le site précise "If you just want to use our corpora, all you need is Carcass.").

- Le second s'appelle Corpse.

- Les différentes versions de ce dernier ont des noms fort imagés : Iron Maiden, Killers, The Number of the Beast, ou encore Revelations...

Pour plus de détails sur ce concordancier, visitez le site.

Ils sont fous ces linguistes !

Posté par incitatus à 09:00 - Commentaires [1] - Permalien [#]
Tags : , , ,

10 mars 2012

[Désespoir inside]

C'est en des moments comme celui-ci que je me rends compte que le désespoir est un mélange violent de colère et de tristesse, auquel on peut ajouter, si on le souhaite, un trait de frustration.

Depuis trois semaines, je suis sur un projet. On travaille dessus à deux, et avec mon binôme, nous n'avons pas compté nos heures. Notre support est un corpus de dix mille phrases. Pour le moment, nous nous contentons de cinq mille. Ce corpus est sous forme d'arbres, c'est-à-dire que les phrases sont analysées syntaxiquement et transformées en arbres syntaxiques. Et un arbre, sur un fichier texte, ça ressemble à ça :

( (SENT (ADV Toujours) (VN-SUJ (V est) (CLS -il)) (Ssub-OBJ (CS que) (NP-SUJ (DET le) (NC gouvernement)) (VN (V a) (VPP cédé))) (Ssub-MOD (CS alors_que) (NP-SUJ (DET ses) (NC adversaires) (AP (ADJ politiques))) (VN (ADV ne) (V proposent)) (NP-OBJ (DET aucune) (NC solution) (AP (ADJ alternative))) (COORD (CC et) (VN (V considèrent)) (PONCT ,) (ADV avec_un_bel_ensemble) (PONCT ,) (Ssub-OBJ (CS que) (NP-SUJ (NPP la_défense) (PP (P+D des) (NP (NC intérêts) (PP (P+D des) (NP (NC malades)))))) (VN (V passe)) (PP-P_OBJ (P par) (NP (DET le) (NC maintien) (PP (P d') (NP (DET un) (NC système) (Srel (NP-SUJ (PROREL qui)) (VN (V aboutit)) (VPinf-A_OBJ (P à) (VN (VINF multiplier)) (NP-OBJ (DET les) (NC actes) (AP (ADJ inutiles)))) (COORD (CC et) (PP (P+D au) (NP (NC dépassement) (VPpart (VPP généralisé)) (PP (P+D des) (NP (NC honoraires) (PP (P de) (NP (DET la) (PONCT ") (NPP Sécu) (PONCT ")))))))))))))))) (PONCT .)))

Autrement dit, c'est illisible.

Nous créons des petits programmes pour modifier certaines données dans ces arbres. Et pour l'instant, il y en a un qui nous pose problème depuis près d'une semaine. Nous avons donc résolu de lister les erreurs et d'en corriger une partie à la main. J'avais donc cent cinquante-sept erreurs à corriger.

Cet après-midi, entre 13 et 20h, j'ai corrigé mes cent cinquante-sept erreurs. Ma tendinite à l'épaule et mes contractures musculaires m'ont rarement autant fait souffrir (qui a dit que l'informatique n'était pas une activité physique ?), et, épuisée, j'ai décidé de tester si mes corrections avaient été prises en compte.

Et j'ai écrasé mon fichier de corrections.

Ecrasé. Pas mis à la corbeille, écrasé. Sept heures de travail foutues en l'air ! J'en pleurerais de rage.

Le_Cri___Auguste_Rodin_1840_1917___Mus_e_Rodin___La_Porte_de_l_Enfer__vers_1886

Il paraît que c'est de Rodin.

Sur le merveilleux site 8tracks, il y a une playlist qui s'intitule "soundtrack to my suicide"...

Posté par incitatus à 21:56 - Commentaires [2] - Permalien [#]
Tags : , , , ,

09 mars 2012

Si vous voulez sauter par la fenêtre, tapez 1.

Projet sur les "serveurs vocaux interactifs", qui ne me servira à rien, et qui me fait perdre mon temps. Rien ne fonctionne, si bien que je me suis sentie obligée de commencer mon rapport en ces termes :

"Malgré les trois nuits plus quelques heures diurnes que j'ai passées sur mes scripts et grammaires, mes innombrables tests, essais et autres brouillons, les conseils de mes collègues, mes nombreuses lectures de cours et tutoriels en ligne pour compléter ceux que nous avons eus à la maison de la Recherche, mon dépouillement minutieux des normes W3C et de mes dits scripts, rien n'y a fait : je ne suis pas parvenue à faire fonctionner le moindre script un peu élaboré.

J'ai essayé le pas à pas, le copié collé, le « tout depuis le début », tout. Rien n'y a fait. Sitôt passée la complexité d'un unique prompt, dès l'ajout d'un <if>, la charmante dame à la voix synthétique s'acharne à me renvoyer une erreur ou – pire encore – un assez horripilant « Failed to access page. The conversation will be terminated. ». Je suis donc navrée de vous rendre un projet inachevé et amputé de sa mise en pratique, mais j'ai fait tout ce que j'ai pu."


Le serveur vocal

Posté par incitatus à 01:40 - Commentaires [6] - Permalien [#]
Tags : , , , ,

25 février 2012

Par-dessus la tête

J'écris peu ces jours-ci. Il faut dire que j'ai à peine le temps de penser. J'ai un peu la tête dans le guidon, comme on dit. J'ai du mal à sortir la tête de l'eau, et j'ai souvent l'impression de pédaler dans la semoule.

Le semestre (le second) est officiellement terminé depuis une ou deux semaines, je ne sais plus. Je dois encore envoyer un projet pour le 12 décembre 2011, un autre pour le 16 janvier dernier, un pour il y a deux semaines, j'ai une soutenance vendredi prochain et un rendu de rapport de projet de fin d'étude le 10 mars - soutenance le 16. Entre temps, je n'ai pas encore eu le temps de demander ma convention de stage - qui commence le 26 mars.

Ces derniers jours, je passe ma vie avec mon binôme, assise dernière mon bureau, à essayer de faire tourner des programmes qui prennent un malin plaisir à planter. Dual boot, machine virtuelle ou émulateur, on a tout essayé, passé des heures, avant que le prof nous dise que c'était son code qui était érronné. Je me suis débattue avec au moins quatre ou cinq versions de Linux, pour avoir celle qui ramerait le moins, mais tout en ayant un bureau et les compilateurs nécessaires. Au bout de cinq ou six heures d'essais d'installation, j'ai trouvé une version qui me satisfait presque.

Pendant ce temps, mon binôme galère avec son propre ordi, tout en téléphonant à notre serveur vocal interactif pour tester ses grammaires VoiceXML. Les miennes attendront le dernier moment, comme d'habitude.

Je vous parle peut-être chinois, mais sachez que tout ce vocabulaire, je l'ai plus ou moins apprivoisé ces deux derniers jours. Et encore, je ne vous parle pas de syntaxe et d'analyse temporelle dans les textes ! Ajoutez à cela quelques langages informatiques, saupoudrez le tout de quelques titres de bande-originale de Bollywood - qui me polluent les oreilles dès que mon collègue a quitté l'appartement - et vous aurez un aperçu de l'ambiance dans laquelle je baigne depuis la semaine dernière.

Mélange des univers, à la fois geek, esprit hacker, linguiste, étudiant, chercheur, esprit curieux, mélomane aux goûts douteux. Je n'ai peur de rien, surtout pas des mélanges. Celui-ci ne s'est pas encore avéré explosif, donc tout va bien sous le soleil.

En parlant de soleil, si j'ai le courage et le temps, je vous racconterai peut-être ma traversée de Paris à pied en compagnie de Melendili.

Posté par incitatus à 01:06 - Commentaires [0] - Permalien [#]
Tags : , , , ,

10 janvier 2012

Où je me dois de dire une expression de mon grand-père

Mon grand-père avait une expression, d'une élégance rare et d'une absolue finesse, qui colle parfaitement à la chance écoeurante que j'ai eu une fois de plus. Mon grand-père disait de quelqu'un de chanceux qu'il avait "le cul bordé de nouilles". Bon, s'il-vous-plaît, n'essayer de pas de visualiser, ce n'est pas très joli.

Pourquoi une telle introduction ? Tout simplement :

La semaine dernière, mon directeur de mémoire de l'an dernier m'envoie une offre de stage. Je jette un oeil : sujet intéressant, milieu de la recherche industrielle, petite boîte récente et... à dix minutes de chez moi. Je saute sur l'occasion. En un week-end, je mets à jour mon CV et rédige ma lettre de motivation. J'envoie le tout. Le lendemain, on m'appelle, on fixe un rendez-vous.

Ce matin, l'angoisse et l'impatience font un mélange détonnant. Le coeur qui accélère brutalement, l'estomac qui se tord. Rien que de très normal. Lorsque j'arrive, j'ai l'impression qu'ils ont déjà décidé de me prendre. Aussi, à la fin de l'entretien n'attendent-ils que ma réponse, qui est immédiate, bien sûr ! J'ai même le droit de continuer le club BD !

La vie n'est-elle pas merveilleuse ? Une offre, un CV, une réponse, un stage trouvé. J'ai parfois l'impression que je vais me réveiller un matin et que tout aura été un rêve. Je plane complètement.

Posté par incitatus à 15:23 - Commentaires [5] - Permalien [#]
Tags : , , , , ,

30 novembre 2011

Interminable liste

Examens passés :

  1. Morphologie et multilinguisme (écrit d'1h - fini en 37 minutes)
  2. Sciences affectives (oral + rapport - article "Emotional Effects of Music: Production Rules" de Klaus Scherer)
  3. English for specific purposes (oral - sujet libre : j'ai choisi de traiter les aspects socilinguistiques dans le film My Fair Lady)

my_fair_lady

A peine fini le premier semestre, nous enchaînons sur le deuxième. Pourtant, il nous reste encore mille projets à rendre dans les semaines à venir :

  1. Web sémantique (ontologie + rapport - sujet libre : la mythologie gréco-romaine)
  2. Recherche d'information (projet + rapport - sujet : la racinisation du latin)
  3. ExCom (projet + rapport : je n'ai pas encore choisi mon sujet)
  4. Unitex ("reconnaître toutes les formes des verbes du premier groupe")
    Unitex
  5. Sociolinguistique (3 transcriptions + commentaire de transcription + dissertation sur thème libre tiré du documentaire Les Roses Noires - sujet choisi : le genre, plus particulièrement la question du parler masculin et du parler féminin)
  6. Synthèse de la parole (projet + rapport - je n'ai pas encore osé regarder le contenu du sujet)

Sinon, dans le désordre :

  • une chanson faite en voix synthétique (et croyez-moi, ça prend un temps monstrueux à créer !) par le groupe du logiciel Mbrola :


  • je devais travailler cet après-midi : j'ai lu le dernier tome de One Piece et j'ai dormi
  • j'ai envie de religieuses au chocolat
  • j'ai eu un cours de droit (3h, c'est long) : c'est extrêmement intéressant, quoiqu'un peu beaucoup aride
  • Wikipédia recense 34 types de nymphes différents, dont les lampades, à l'origine du nom "lampadaire"
  • on a eu un cours de veille passionnant, même si étrangement flippant : on en ressort traumatisé de savoir qu'on se fait manipuler par l'information et un peu paranoïaque.
  • quelqu'un est arrivé sur ce blog en cherchant "surnageait invinciblement sa robe rouge ou sa figure pâle toujours aussi noble et aussi mélancolique, mais qui ne laissait paraître aucun trouble de cette transverbération" : la classe, non ?

lampade

Posté par incitatus à 20:39 - Commentaires [4] - Permalien [#]
Tags : , , , , , ,

21 octobre 2011

Sociologie et émotions

Cette année, j'ai deux matières vraiment nouvelles, qui m'effrayaient un peu à cause de leur forte composante linguistique et le risque que l'on avait d'y lire plein d'articles universitaires (et de fait, ce sont les seules disciplines où l'on nous demande de lire des articles), et qui finalement se révèlent passionnantes malgré tout. D'une part parce que les profs sont absoluments géniales, chacune dans son genre, et d'autre part parce qu'elles abordent la linguistique d'un point de vue biaisé, et nous offrent un regard complètement neuf sur la langue.

1/ Sciences affectives et affective computing. Drôle de bête. Dans l'intitulé on trouvait aussi "cognition", mot qui me fait bondir à chaque fois et me donne envie de partir en courant.

En réalité, pour l'instant on a parlé beaucoup de psychologie, de neurobiologie (je ne sais pas s'il convient de retenir toutes les parties du cerveau qu'elle nous a nommées), d'intelligence artificielle (les robots, c'est bien ^^), mais très peu de l'inguistique. Bien sûr, on va y venir. Mais une chose est certaine, il y a des théories de l'émotion très esthétiques. Voyez plutôt celle de Plutchik :

plutchik_scriptol_fr

2/ Sociolinguistique. Passionnant. La prof a l'art de nous poser des questions auxquelles on n'avait jamais pensé, ou qu'on n'avait jamais jugées compliquées avant d'essayer d'y répondre. Exemple ? Combien de mots connaît-on ? Est-ce que l'illéttrisme, c'est grave ? Ou ce genre de choses. On a parlé des DOM-TOM, des immigrés, des langues de France, des ouvriers, de la mutation du travail. Et on a à lire un article sur langues croisées et transgenres ("Crossing Genders, Mixing Languages", de NiKo Besnier).

Pour la première fois de ma vie, je prends plaisir à lire des articles et à me creuser un peu la cervelle et à participer en classe (bon, en même temps, on est cinq, et on se connaît tous, donc l'enjeu n'est pas non plus insurmontable). Et la prof nous a parlé d'un documentaire, Les Roses noires, que j'ai regardé hier : très beau et extrêmement intéressant. Des jeunes filles des banlieues (Marseille et 93 essentiellement) parlent de leur langue, de leur vie dans la cité. Absolument passionnant.

Sinon, je vais devoir créer une ontologie (un modèle conceptuel) de la mythologie gréco-romaine, annoter trois minutes de commentaire sportif (deux commentateurs radio sur le tour de France, tout à fait inintéressant, et même crispant, et trois minutes c'est TRES long), transcrire une minute de vidéo (encore plus long : la prof nous a dit qu'en moyenne, elle mettait 45h pour une minute de film...) et d'autres projets encore, dont je n'ai pas le sujet.

Posté par incitatus à 08:07 - Commentaires [4] - Permalien [#]
Tags : , , ,

12 mai 2011

Java... niaise

"Ne vous déplaise, en dansant la javanaise..." la lala lalala !

Bref. Bientôt deux semaines que je m'arrache les cheveux sur ce projet en java.

Je comptais sur l'aide de mon binôme, qui en fin de compte s'est révélé plus lent que moi... Cette collaboration nous a au moins permis de rester éveillés jusqu'à pas d'heure, pour avancer un tout petit peu plus.

javapasdutout

Des dizaines d'essais, infructueux. Le dernier, échec cuisant lui aussi, a au moins eu l'avantage de faire fonctionner la récusrivité qui m'a posé tant de problèmes jusque-là.

Je vois le bout. De toute manière, c'est à rendre pour demain...

Je sais, je vous parle javanais, mais peut-importe, comme dirait je ne sais plus quel(le) humoriste.

Entre deux lignes de code, ma soeur est rentrée d'Inde, et j'ai fait passer des oraux à des 4e (soutenance de rapport de stage).

J'ai peur d'avoir oublié comment on respire entre temps. Pourvu que ça revienne!

Posté par incitatus à 01:20 - Commentaires [4] - Permalien [#]
Tags : , , ,