Feeds:
Articles
Commentaires

Archive for the ‘Question d’informatique’ Category

Voici un site de recherche linguistique, encore en version beta, mais qui vaut le coup d’oeil. Wordnik est plus qu’un simple dictionnaire, il contient:

étymologie: du American Heritage Dictionary of the English Language et du Century Dictionary

définitions: du American Heritage Dictionary, du Century Dictionary, du Webster’s Unabridged et de Wordnet

synonymes et antonymes: du Reogat’s New Thesaurus et du Allen’s synonyms and antonyms

Mais ce n’est pas tout, le site contient aussi des exemples d’utilisation du mot en contexte tirés du Projet Gutenberg,  la prononciation, les dernier messages contenant ce mot sur Twitter et les images correspondant à cette recherche sur Flickr. Le tout sur un seul site Internet, avec un joli design simple et moderne, chouette, non?

Publicités

Read Full Post »

VocabGrabber vous permet de copier un texte et vous propose ensuite de schématiser son contenu linguistique. Il crée une liste de mots à partir de votre texte, les trie selon leur appartenance à 7 catégories thématiques, le nombre d’occurrences, leur pertinence dans le texte. Vous pouvez choisir de visualiser les résultats sous forme de nuage d’étiquettes, de liste ou d’afficher leur image tirée du Visual Thesaurus.

Read Full Post »

Les informations personnelles disponibles sur Internet peuvent être source de problèmes, aujourd’hui chacun en est conscient. On peut trouver de très bons articles sur le sujet, je vous recommande spécialement les 10 règles simples pour contrôler son image sur Internet sur Presse-Citron.

Aujourd’hui Google lance les Google Profiles, un outil qui permet de se créer un profil Google. Un profil supplémentaire? Alors que j’en ai déjà sur une multitude de sites qui traduisent en pages la réalité du web social? Oui, seulement l’avantage de celui ci est qu’il devrait (je n’ai pas encore testé) apparaître en premier lorsque de futurs employeurs ou curieux en tout genre vous traqueront sur Internet. Une manière donc de contrôler un tant soit peu ce que le Web raconte de vous.

Pour ceux qui sont intéressés, voilà un billet très complet qui vous guidera pas à pas, si besoin est, vers la création de votre profil sacré, découvert sur Transnets.

Read Full Post »

Trouvaille intéressante sur l’excellent Presse-Citron, à ma connaissance le meilleur blog francophone concernant Internet et les nouvelles technologies et je dis pas seulement ça à cause du nom et de mon amour pour les agrumes, le contenu est vraiment tip top.

J’y ai donc découvert aujourd’hui Polyglot 3000, un programme qui permet de reconnaître la langue dans laquelle est rédigé un texte. Il fonctionne pour 474 langues. Il suffit de coller un texte dans la fenêtre du logiciel et il reconnaît la langue, donne un pourcentage de fiabilité de la reconnaissance, le temps de la recherche et les langues similaires. J’ai donc fait quelques essais par curiosité.

Premier essai, choisissons une langue qui ne soit pas des plus courantes:

  • ¿Khithitsa nayaxa?¿Jilxä ukjaxa kuna kankansa muniristhxa?¿Jilxä ukjaxa kunjamasa ka uraqi askiptayañapa muniristhxa?¿Aka uraqi sumañapatakixa kunsa lurañajaxa?¡Kunjamsa yaqha yatiqirinakaxa aka jach’a yatiqawina yatiqasipxki uñjapxañani! (Source: http://www.kidlink.org/kie/nls/aymara/response/lessons.html)
  • Langue reconnue: Aymara – Fiabilité: 67% – Langues similaires: Chichewa, Shuar, Indonesian.

Deuxième essai:

  • El president del PNB, Iñigo Urkullu, ha reiterat la voluntat del PNB d’encapçalar la formació del proper govern basc partint de la premissa que el partit nacionalista ha estat l’opció més votada, « amb 80.000 vots més que la segona força i amb sis escons més ». En aquest sentit, els nacionalistes iniciaran aquest dijous una ronda de converses amb la resta de forces que han obtingut representació al Parlament amb la intenció de gestionar la formació d’un govern de consens ampli que superi la política de blocs i garanteixi l’estabilitat del país, « en un moment delicat per la crisi », ha afegit. (Source: http://www.avui.cat/article/mon_politica/55289/urkullu/acusa/pse/dintentar/cop/instituiconal/amb/suport/pp.html)
  • Langue reconnue: Catalan – Fiabilité: 27% – Langues similaires: Aragonese, Latin, Occitan (Languedocien)

Troisième essai:

  • The International Criminal Court has issued an arrest warrant for Sudan’s president on charges of war crimes and crimes against humanity in Darfur. However, the court stopped short of accusing Omar al-Bashir, who denies the charges, of committing genocide. Reports say Sudan’s capital, Khartoum, was tense as people awaited the decision, with fears of unrest.The UN estimates some 300,000 people have died and millions been displaced in six years of conflict in the region. (Source: http://news.bbc.co.uk/2/hi/africa/7923102.stm)
  • Langue reconnue: English – Fiabilité: 11% – Langues similaires: Interlingue, French, Catalan

Quatrième essai:

  • I selected these organizations from publications, or they were submitted by users of these pages. If your organizations has a vital interest in the coloring of materials, or if you have an event that could benefit color specialists, please add yourself to the list of organizations and annoucements. I may choose to post your organization here. (Source: http://www.colorpro.com/info/orgs/organs.htm)
  • Langue reconnue: English – Fiabilité: 71% – Langues similaires: Interlingue, Occitan (Languedocien), Cherokee. (J’ai choisi ce petit texte parce qu’il contenait color et organization pour voir si le logiciel le reconnaissaît l’ English American, vu qu’il figure sur la liste des langues reconnues. Ce n’est pas le cas, peut-être que ça fonctionne avec un texte plus long.)

Parmi les langues reconnues, il y a notamment 12 variantes de quechua, je me demande si le programme peut vraiment les différencier. Je ne suis pas assez connaisseuse pour me lancer dans une vérification, à l’occasion je pourrais essayer de trouver quelqu’un pour s’y atteler avec moi.

Ce petit programme m’a l’air tout à fait intéressant, même si je n’y vois pas une utilité particulière pour les traducteurs, si ce n’est de savoir à quelle langue appartiennent certains mots dans les textes dits sourciers qui parfois regorgent d’exotismes, mais généralement le contexte permet de le savoir et nul besoin de faire de telles recherches.

Read Full Post »

Suite au billet d’hier à propos de quelques mots suisses, je me suis demandée si les traducteurs automatiques en avaient certains dans leur base de données. Voilà donc quelques essais de traductions:

J’ai bu un verre de fendant.

– Systran: I drank glass of splitting. (Je me demande pourquoi il oublie l’article).

– Reverso: I drank a glass of Swiss white wine. (Joli!)

– Google Translate: I drank a glass of Fendant.

J’ai utilisé la panosse pour nettoyer les catelles.

– Systran: I used the mop to clean the ceramic tiles.  (J’ai envie de dire: – Chapeau bas!)

– Reverso: I used the panosse to clean tiles.

– Google Translate: I used to clean panosse Catella (Je ne sais ni d’où viens ce changement d’ordre des éléments, ni pourquoi catelles se transforme en Catella lorsque Google pense avoir affaire à un nom propre).

Je ramasse des pives dans la forêt.

– Systran: I collect pine cones in the forest.

– Reverso: I collect pives in the forest.

– Google Translate: I pives collects in the forets. (Encore une inversion incompréhensible).

Mon grand-père a septante-trois ans.

– Systran: My grandfather has septante-trois years. (Mauvais, mauvais, il ne reconnaît même pas la formulation de l’âge…)

– Reverso: My grandfather has seventy three years old.

– Google Translate: My grandfather was seventy three years. (Mais où va-t-il chercher un imparfait?)

(Très fort l’utilisation du verbe avoir! C’est bizarre parce que si j’essaye de traduire « Mon frère a deux ans », aussi bien Systran que Reverso donnent bien  « My brother is two years old », Google Translate utilise bien un présent, mais fait l’impasse sur le « old » à la fin de la phrase…)

Il a retiré 200 francs au bancomat.

– Systran: It withdrew 200 francs with the bancomat.

– Reverso: He(It) removed 200 francs from the bancomat.

– Google Translate: He withdrew 200 francs in cash. (Là, j’en reste presque bouche-bée!)

RESULTATS: Avec aussi peu de phrases, impossible de faire des statistiques qui traduisent la réalité, chaque programme a reconnu 3 régionalismes sur 6, mais pas les mêmes. Rien de très nouveau, on voit bien que si parfois il y de quoi être agréablement surpris, ou décu en bien comme on dit Suisse, ces programmes ne sont pas près d’arriver à des résultats vraiment exploitables. Surtout que les phrases utilisées étaient grammaticalement très simples, puisque le test visait les régionalismes et pas les constructions syntaxiques. Je relève cependant les inversions bizarres qui semblent plutôt être le propre de Google Translate, quand on sait que c’est le programme le plus souvent utilisé pour traduire des sites Internet, il y a de quoi s’inquiéter.

Read Full Post »

Soitu.es

Depuis son lancement, je lis avec une certaine assiduité Soitu.es, un média espagnol en ligne créé il y a un peu plus d’une année et dirigé par Gumersindo Lafuente, ancien directeur de Elmundo.es . Le site Internet et la manière de traiter l’information m’ont rapidement convaincue. L’objectif est de « conjuguer la rigueur du journalisme traditionnel avec la philosophie d’Internet ». Pari réussi, les informations sont intéressantes, décalées, traitées selon des points de vue parfois inhabituels, et c’est agréable. Ancré dans le web 2.0, le site mise sur le côté participatif. Le design est jeune, coloré, nettement plus attrayant que celui de la majorité des médias en ligne .

La semaine dernière, le site s’est doté d’une nouvelle rubrique: El Selector de noticias, dans laquelle les collaborateurs de Soitu.es postent des liens vers des articles d’autres médias et sites Internet, en espagnol pour la plupart, mais pas exclusivement. Le principe est intéressant, bien que l’abondance de liens est presque affolante et frustrante car il faudrait énormément de temps pour aller jeter un œil à autant d’articles. Toutefois, leur grave erreur, à mes yeux, est  d’avoir mis un lien en bas des articles qui ne sont pas rédigés en espagnol, pour en lire la traduction made in Google Translate! Je ne crache pas totalement sur les traducteurs automatiques qui peuvent permettre de comprendre plus ou moins de quoi parle un texte, un e-mail reçu ou autre dans une langue que l’on ne maîtrise pas, mais que cet outil soit utilisé et promu par un média qui se veut de qualité, dépasse mon entendement. Comment peut-on prétendre valoriser la rigueur du journalisme et donner des articles en pâture à de tels programmes?

Read Full Post »