Affichage des messages blog dont le libellé est data mining. Afficher tous les messages blog
Affichage des messages blog dont le libellé est data mining. Afficher tous les messages blog

mardi 15 juillet 2008

CloseClinical.org

Bientôt vous je vais vous présenter la nouvelle version du site CloseClinical.org entièrement dédié à l'informatique médical. J'ai commencé ce site depuis un moment, et il a été en ligne pendant quelques semaines, mais dû à un accueil plus important que prévu, et le trafic chargé du site, il a été trop lent à charger.
Du coup, j'ai mis le site off-line, pour faire deux choses:
  • Changer le template du site pour en mettre un avec moins d'image.
  • Supprimer la langue française, car la majorités des personnes intéressées par l'informatique médicale ont l'habitude d'utiliser les sites anglophones, et donc, la langue française du site ne fait qu'alourdir son gabarit.
J'en ai profité aussi pour changer le CMS du site et passer à Joomla 1.5!
En attendant, je vous propose de regarder un peu le site OpenClinical.org. Mais sachez que le CloseClinical.org arrivera prochainement avec plein de bonnes nouvelles!
A bientôt

jeudi 7 février 2008

RAPID EYE MINER: un nouvel Oeuil pour Data Mining

Utiliser RapidiMiner gratuitement (double lisense) et explorez vos données! Simplifiez la construction des vos expérimentations avec les nouvelles approches. Essayez de trouver la meilleure combinaison de processus et des étapes d'apprentissages ou laissez RapidMiner le faire automatiquement pour vous.

Ce sont des jolis mots que RapidiMiner a mis sur sont site. Pourtant, ça ne veut rien dire. Il faut tester le logiciel: ce que j'ai fait pour vous!

Je l'ai installé sur un portable Centrino Duo avec 1MB de mémoire vive avec Window XP. L'installation c'est passé correctement sans produire d'alerte ni d'erreur. L'interface graphique est beau et s'intègre bien dans l'environnement Windows ( un défaut: il ne fonction pas sur Linux! ). Il y a une très bonne et complète documentation. Bref, tout en étant un logiciel gratuit, il est comparable à Clementin de SPSS dans son allure et ses présentation graphique.

Par rapport à sa richesse fonctionnelle, il dépasse pourtant quelques uns des plus chers logiciels de data mining. Il cumule les fonctionnalités proposés par Weka et quelques unes intégrées par Yale (son prédecésseur).

Parmi ces avantage encore, un menu déroulant catégorisant les différents tests statistiques et modèles de data mining dans des catégories qui ressemblent beaucoup aux chapitres d'un bon livre en la matière.

Son archituecture modulaire et l'existance de plus de 400 plugin montrent déjà son succès.

Il faut rajouter à ses capacités, un vaste arsénal de module de visualisation des données. On peut créer pratiquement toute forme de visualisation que l'on peut créer avec R.

Il faut finalement parler de quelques bémols: sa prise en main est assez compliquée et je j'ai du passé quelques heures avant de pouvoir l'utiliser et avoir mes premirères expérimentations. Je pense que c'est dû à son workflow original avec lequel on n'a pas l'habitude de travailler. Deuxième défaut, au niveau de la manipulation des fichiers des données il n'est pas encore à la pointe: j'ai été obligé de changer plusieurs fois le format de mes données, car il ne pouvait pas les importer.

Enfin, je félicite l'équipe allemande qui l'a créé et l'équipe américaine qui a crée son acnestre Yale, et je vous conseil fortement de l'utiliser.

vendredi 17 août 2007

TANAGRA pour Data Mining

TANAGRA est un logiciel gratuit de Data mining destiné à l’enseignement et à la recherche. Il implémente une série de méthodes de fouille de données issues du domaine de la statistique exploratoire, de l'analyse de données, de l’apprentissage automatique et des bases de données.

C'est un projet ouvert au sens qu'il est possible à tout chercheur d'accéder au code, d'ajouter ses propres algorithmes et de diffuser, toujours gratuitement, le logiciel modifié.

Finalement, Tanagra est aussi le nom d'un cité grècque d'où vient la statuette que vous voyez ici.

(Source: Wikipédia)

Si vous n'avez pas les moyens pharamineux de vous acheter un logiciel commercial tel que Clémentine, et que vous ne pouvez pas vous donnez la peine d'apprendre le language de programmation R, c'est une bonne solution pur vous.

Il vous permet de faire un peu tous que l'on fait en statistiques: les méthodes univariés et multivariés, les cartes topologique et les l'apprentissage supervisé.

Ce qui est bien, c'est que le code source est ouvert et gratuit, et donc - comme son concépteur Ricco RAKOTOMALALA l'indique, c'est un vrai laboratoire pour appredre à la fois la statistique, l'appretinssage artificeil et la programmation en Delphi.

Je l'ai installé, et il a fonctionné sans bug - ce qui est déjà bien pour un logiciel libre- mais je l'ai pas testé complètement. Finalement, je ne sais pas pourquoi ce projet est un peu abandonné, et qu'il n'y a pas de communauté autour. Il peut faire un logiciel libre contre la présence monopole de Clémentine.


Un petit bémol: le choix du langage de programamtion. Je pense que s'il était écrit en Java ou Python, il aurait pu mieu s'équiper d'une communaté de soutien, chose qu'il ne semble pas être le cas en ce moment. Mais en tout cas, bravo pour l'idée et la conception.

Lien vers le site du Tanagra

A plus,