TÉLÉCHARGER TANAGRA GRATUIT

D une part, en proposant une interface suffisamment conviviale, il est accessible aux utilisateurs nonspécialistes qui veulent effectuer des études sur des données réelles. D autre part, en définissant une architecture simplifiée à l extrême, les efforts de développement portent sur l essentiel, à savoir la mise au point et l intégration d algorithmes de fouille de données, les chercheurs peuvent ainsi mener des expérimentations sur les méthodes. Dans cet article, nous présentons les principales fonctionnalités du logiciel en essayant de le positionner sur l échiquier des très nombreux logiciels diffusés actuellement. Son premier objectif est d offrir aux étudiants et aux experts d autres domaines médecine, bio-informatique, marketing, etc.

Nom:tanagra gratuit
Format:Fichier D’archive
Système d’exploitation:Windows, Mac, Android, iOS
Licence:Usage Personnel Seulement
Taille:21.48 MBytes



D une part, en proposant une interface suffisamment conviviale, il est accessible aux utilisateurs nonspécialistes qui veulent effectuer des études sur des données réelles. D autre part, en définissant une architecture simplifiée à l extrême, les efforts de développement portent sur l essentiel, à savoir la mise au point et l intégration d algorithmes de fouille de données, les chercheurs peuvent ainsi mener des expérimentations sur les méthodes.

Dans cet article, nous présentons les principales fonctionnalités du logiciel en essayant de le positionner sur l échiquier des très nombreux logiciels diffusés actuellement. Son premier objectif est d offrir aux étudiants et aux experts d autres domaines médecine, bio-informatique, marketing, etc.

Le second objectif est de proposer aux chercheurs une architecture leur facilitant l implémentation des techniques qu'ils veulent étudier, de comparer les performances de ces algorithmes. TANAGRA se comporte alors plus comme une plateforme d'expérimentation qui leur permettrait d'aller à l'essentiel en leur épargnant toute la partie ingrate de la programmation de ce type d'outil, notamment la gestion des données. Point très important à nos yeux, la disponibilité du code source est un gage de crédibilité scientifique, elle assure la reproductibilité des expérimentations publiées par d autres chercheurs et, surtout, elle permet la comparaison et la vérification des implémentations.

TANAGRA n'intègre pas en revanche tout ce qui fait la puissance des outils commerciaux du marché : multiplicité des sources de données, accès direct aux entrepôts de 2 TANAGRA données et autres datamarts, interactivité des traitements avec des outils de visualisation sophistiqués.

Ces outils, aussi séduisants et utiles soient-ils dans le cadre d études sur des données réelles, imposent des standards de développement autrement plus élaborés avec une forte proportion du code source destiné à la gestion des données et de l interface. Nous avons voulu justement nous éloigner autant que possible de cet écueil en définissant sciemment une architecture simplifiée afin que le rapport code de calcul sur code de gestion soit le plus élevé possible tout en préservant un minimum d ergonomie.

Dans cet article, nous présentons dans la section 2 l architecture du logiciel et ses principales fonctionnalités. Enfin, dans la 4 ème et dernière section, nous conclurons en évoquant les enjeux de la diffusion du logiciel.

Nous le désignons également sous le terme de composant en référence au vocabulaire utilisé dans les outils de programmation visuelle. Ce mode de représentation qui est le standard actuel des logiciels de fouille de données autorise, par rapport aux logiciels pilotés par menus, la définition d enchaînement d opérations sur les données, tout en affranchissant l utilisateur, par rapport aux outils fonctionnant avec un langage de script, l apprentissage d un langage de programmation.

La fenêtre principale du logiciel est subdivisée en trois grandes zones Figure 1 : a un dessous la série des composants disponibles, ils sont regroupés en catégories ; b sur la gauche, le diagramme de traitements, représentant l analyse courante ; c dans le cadre de droite, l affichage des résultats consécutifs à l exécution de l opérateur sélectionné.

Il est bien sûr possible de sauvegarder, soit sous un format binaire, soit sous la forme d un fichier texte, la séquence d instructions le programme en quelque sorte -- définie par un utilisateur. Seuls le programme est sauvegardé, les résultats ne le sont pas. Le format texte permet à un utilisateur avancé de le manipuler directement afin de définir un nouveau diagramme de traitements.

En effet, seuls les fichiers texte avec séparateurs tabulation sont acceptés, les données manquantes ne sont pas gérées. Lors de l importation, les données sont automatiquement recodées, deux 3 Ricco Rakotomalala types de variables sont reconnus : les variables continues, codées en flottant simple précision 4 octets par valeur , et les variables discrètes où modalités sont acceptées 1 octet par valeur.

Après recodage, l ensemble des données est chargé en mémoire centrale, il est dès lors aisé de calculer les capacités théoriques du logiciel en fonction de la mémoire disponible. Le code source étant accessible, il est de plus possible pour tout un chacun de vérifier l implémentation réalisée. Les algorithmes sont regroupés en grandes familles, certains peuvent être discutables mais il ne nous semblait pas approprié de trop multiplier les catégories. Grosso modo, nous distinguerons deux grandes super-familles, à savoir les algorithmes d obédience statistique : statistique descriptive, statistique inférentielle, analyse de données et économétrie ; et les algorithmes issus des publications en apprentissage automatique et bases de données : filtrage d individus et de variables, apprentissage supervisé, règles d association.

Nous ne revendiquons nullement la pertinence du découpage choisi, il fallait à la fois composer avec la pratique des utilisateurs et une ergonomie plus ou moins heureuse.

Les composants ont pour point commun de prendre en entrée des données en provenance du composant qui le précède ; de procéder à des calculs donnant lieu à un affichage des résultats sous forme de page HTML Figure 2 ; ils sont le plus souvent paramétrables ; et enfin, ils transmettent aux composants en aval les données en y ajoutant parfois des données produites localement, les prédictions par exemple pour les méthodes supervisées.

La possibilité d enchaîner des méthodes d apprentissage à travers le diagramme de traitements est un atout indéniable, en effet, il rend aisé la combinaison des méthodes sans avoir pour autant à se lancer dans l apprentissage d un langage de script Figure 3.

La plupart des logiciels commerciaux du marché, même ceux qui disposent à l origine d un langage de programmation, proposent aujourd hui ce mode de représentation qui fait référence. Le programme est donc compilé, il est distribué tel quel, son exécution ne nécessite aucune bibliothèque supplémentaire.

En revanche, il ne fonctionne que sous Windows. La principale faiblesse du logiciel réside dans l obligation de charger, sous forme recodée, la totalité des données en mémoire. Un fichier de d observations avec variables exclusivement continues occupe approximativement Mo en mémoire centrale. On peut relativiser ce goulot d étranglement en ce qui concerne les fichiers usuellement rencontrés. Un PC de bureau doté de Mo de mémoire vive par exemple peut traiter directement l ensemble des clients d une grande banque régionale pour un ciblage marketing.

En revanche, traiter l ensemble des transactions journalières d une enseigne de grande distribution en chargeant les données en mémoire paraît inconcevable. Malheureusement pour les chercheurs, ces offres sont le plus souvent le fait d entreprises commerciales et, très souvent, les algorithmes implémentés ne sont ni documentés, ni référencés, rendant très difficile la publication d articles.

TANAGRA s inscrit dans la lignée des plates-formes d expérimentations ouvertes qui se sont rapidement répandues depuis le début des années Si ces références, pour la plupart en provenance de la communauté de l apprentissage automatique, semblent assez récentes, il ne faut pas perdre de vue que mutualiser des algorithmes de traitement de données a été depuis très longtemps mis en place dans la communauté des statisticiens, sous forme de code FORTRAN ou de scripts de haut niveau.

Zighed depuis une vingtaine d années. Nous avons intégré en cours de route le développement de la version 2. SIPINA était avant tout dédié à l apprentissage supervisé, il nous est apparu au fil du temps que son architecture n était plus adaptée, notamment parce qu il n était pas possible d enchaîner automatiquement des méthodes de construction et de sélection automatique de variables.

De plus, il était nécessaire pour chaque méthode ajoutée de définir une interface de visualisation spécifique. TANAGRA a donc intégré dès le départ les spécifications adéquates pour dépasser ces limitations qui étaient devenues contraignantes. Le choix de la licence ne fut pas aisé, le concept de logiciel libre, aussi séduisant soit-il, laissait la porte ouverte à l appropriation commerciale de l outil par de tierces personnes, avec des contraintes de publications de codes certes, mais difficile à faire respecter.

Notre premier enjeu aujourd hui est d assurer la diffusion du logiciel afin qu il soit utilisé dans différents domaines, les retours de ces utilisateurs nous permettent d affiner les fonctionnalités du logiciel, améliorant ainsi son efficacité. Depuis le début de l année , nous comptons une vingtaine de visiteurs par jour sur notre site web. Notre second objectif est de fédérer les bonnes volontés pour élargir la bibliothèque des méthodes de fouille de données.

Ce deuxième objectif est un peu plus délicat, seuls quelques chercheurs dans l entourage proche de notre laboratoire l ont réellement réalisé à ce jour.

Références Buntine W. Kohavi R. In Will Klosgen and Jan M. It tries to reconcile two kinds of users. On the one hand, non-specialists can use the soft, which proposes a userfriendly GUI. On the other hand, a simplified architecture makes it possible to the researchers to concentrate their efforts on the development and the evaluation of new data mining algorithms. In this paper, we present the main functionalities of this new data mining software.

TÉLÉCHARGER HFSQL GRATUIT GRATUITEMENT

TÉLÉCHARGER LOGICIEL TANAGRA GRATUIT

Taille: Didacticiel — Etudes de cas. Travaux pratiques avec WordPress Karine Warbesson Toutes les marques citées dans cet ouvrage sont grathit marques déposées par leurs propriétaires respectifs. Une nouvelle façon de faire de la statistique? L objet de base est un vecteur de données.

TÉLÉCHARGER APPLICATION TUXLER GRATUITEMENT

Tanagra (logiciel)

.

TÉLÉCHARGER FNAIR YAD LHANA MP3 GRATUITEMENT

TÉLÉCHARGER TANAGRA GRATUIT GRATUITEMENT

.

TÉLÉCHARGER SONNERIE ANTISOCIAL TRUST GRATUIT GRATUITEMENT

TANAGRA : un logiciel gratuit pour l'enseignement et la recherche

.

Similaire