Aqui está uma lista dos Melhores softwares gratuitos de mineração de dados para Windows. Esses softwares são usados para executar várias operações de mineração de dados, a fim de extrair informações úteis dos conjuntos de dados. Os formatos de arquivo suportados para importar conjuntos de dados incluem arquivos CSV, ARFF, DATA, TXT, XLS, etc. A maioria deles fornece um conjunto de arquivos de conjunto de dados de amostra que você pode importar para análise.
Em termos de operações, eles permitem realizar manipulação de dados, classificação, associação, regressão, agrupamento, modelagem e visualização de dados. Cada um deles fornece vários algoritmos para dar suporte às respectivas tarefas. Por exemplo, para Clustering, você pode usar algoritmos K-Means, Kohonen-SOM, LVQ, Neighborhood Graph, etc. Para Associação, você pode aplicar A priori, A priori MR, A priori PT, Assoc Outlier, Conjuntos de itens frequentes, etc. as regras. Para Visualização de dados, Scaterrplots, Box Plot, Distribuição, Mapa de calor, etc. os métodos podem ser nósed, e assim por diante. Um deles é um software de mineração de dados de texto que permite analisar dados de texto usando vários métodos.
Os resultados podem ser visualizados na interface e também podem ser salvos como relatórios em diferentes formatos. Em suma, esses são bons softwares que você pode usar gratuitamente para tarefas de mineração de dados.
Meu software de mineração de dados favorito para Windows:
Gostei bastante do Weka, pois fornece todas as ferramentas suficientes para realizar tarefas primárias de mineração de dados. Também não é tão difícil de usar. Laranja também é bom para profissionais, pois fornece uma abordagem única para realizar operações de mineração de dados usando widgets.
Weka
Weka é um software de mineração de dados gratuito e de código aberto para Windows, Mac e Linux. Ele contém todas as ferramentas essenciais exigidas nas tarefas de mineração de dados. Sua interface principal é dividida em diferentesaplicativos que permitem executar várias tarefas, incluindo preparação de dados, classificação, regressão, agrupamento, mineração de regras de associação e visualização. Você obtém várias técnicas e algoritmos para executar essas tarefas. Vamos dar uma olhada em suas principais características:
Mineração de dados com Weka:
Aqui estão os aplicativos que dividem as tarefas de mineração de dados em seções facilmente gerenciáveis:
- Explorer: este aplicativo é usado para pré-processamento de dados, classificação de dados, agrupamento de dados, associação e visualização de dados. Você pode abrir arquivos de dados em vários formatos, incluindo arff, data, CSV, JSON, arquivos Matlab ASCII, dat, etc. Você também pode abrir um conjunto de instâncias de um URL ou banco de dados. Ele também fornece uma ferramenta chamada DataGenerator para gerar dados artificiais. Várias regras de classificador podem ser escolhidas, incluindo DecisionTable, OneR, PART, ZeroR, etc. EM, Canopy, Cobweb, FarthestFirst, FilteredClusterer, HierarchicalClusterer, SimpleKMeans, etc. algoritmos de agrupamento estão disponíveis para seleção. As regras de associação, incluindo Apriori, FilteredAssociator, e FPGrowth, podem ser usadas. Ele fornece uma guia chamada Selecionar atributos que basicamente avalia a relevância dos atributos. Para isso, pode-se selecionar um avaliador de atributos (CfsSubsetEval, ClassifierAttributeEval, OneRAttributeEval, InfoGainAttributeEval, etc.) e um método (GreedyStepwise, BestFirst, Ranker). A respectiva saída é exibida nas respectivas guias para cada uma das tarefas mencionadas.
- KnowledgeFlow: executa os mesmos processos de mineração de dados mencionados no Explorer, mas com mais ferramentas. Ele lida com dados de forma incremental ou em lotes. Alguns de seus recursos incluem: filtragem em cadeia, mostrando modelos produzidos por classificadores para cada dobra em uma validação cruzada e visualizando o desempenho de classificadores incrementais durante o processamento. Aqui, você também recebe inúmeross métodos de visualização de dados, incluindo Visualizador de texto, Visualizador de imagens, Resumidor de atributos, Gráfico de tiras, Gráfico de desempenho de modelo, Plotador de limites, Matriz de gráficos de dispersão, Visualizador de gráficos e Análise de custo-benefício.
- Experimentador: Usando este aplicativo, você pode criar, executar e analisar experimentos de diferentes tipos, incluindo validação cruzada, divisão percentual de treinamento/teste, resultado de divisão aleatória, resultado da taxa de aprendizado, etc. Você pode definir um conjunto de dados, especificar controles de iteração e escolher um algoritmo para realizar o experimento.
Também é fornecido um aplicativo Workbench usado para executar as mesmas tarefas mencionadas nos aplicativos acima.
Em suma, é um bom software gratuito de mineração de dados. Também não é tão difícil de operar, mas se você ainda tiver dificuldade, pode verificar este tutorial em vídeo para visualizar detalhesexplicações das tarefas.
Página inicial Página de download
Laranja
Orange é outro software de mineração de dados gratuito e de código aberto para Windows. Ele fornece várias ferramentas para manipulação de dados, modelagem de dados, visualização de dados e análise de dados. Ele divide essas tarefas em diferentes categorias para executá-las facilmente.
Características do laranja:
- Dados: fornece tferramentas para manipulação de dados. As principais ferramentas fornecidas aqui são Paint Data, Data Sampler, Rank e Filter Data, Merge Datasets, Transpose Data Table, Randomize, Continuize, Feature Constructor, Purge Domain, Discretize, Outliers, etc. li>
- Visualizar: aqui, você pode realizar a visualização de dados. Você pode visualizar dados usando vários métodos, incluindo Tree Viewer, Box Plot, Distribution, Scatter Plot, Sieve Diagram, FreeViz Project, Linear Project, Radviz, Heat Map, Venn Diagram, Silhoutte Plot, Pythagorean Tree Visualization, Nomogram, em> etc.
- Modelo: você obtém vários modelos para a tarefa de modelagem e previsão de dados. Isso inclui indução de regra CN2, constante, regressão linear, regressão logística, Naive Bayes, AdaBoost, rede neural, descida de gradiente estocástico, etc.
- Avaliar: a partir daqui, você pode avaliar o desempenho de classificação ou regressão usando várias técnicas de estimativa como Teste e pontuação, previsões, matriz de confusão, análise ROC, curva de elevação e gráfico de calibração.
- Mineração de texto: contém ferramentas de mineração e análise de texto, como pré-processamento de texto, mineração de texto do Twitter, mineração de texto da Wikipédia, análise de sentimento, saco de palavras, etc. li>
- Não supervisionado: este módulo é usado para aprendizado não supervisionado, que fornece ferramentas para ler distâncias de arquivos, visualizar matriz de distância, agrupamento hierárquico, análise de correspondência, escalonamento multidimensional, aprendizado múltiplo, etc.
Como usar laranja:
Para trabalhar com este software, você precisa usar várias ferramentas como widgets. Para criar widgets, você pode arrastar as ferramentas do painel esquerdo e soltá-las na tela. Por exemplo, para importar um conjunto de dados, arraste e solte a ferramenta Arquivo na tela. Você pode conectar um widget a outro para executar a respectiva tarefa no conjunto de dados e visualizar os respectivos resultados. Aqui está um tutorial rápido em vídeo para comece a usar este software.
Este é outro bom software de mineração de dados fornecido gratuitamente.
Página inicial Página de download
Tanagra
Tanagra é outro software gratuito de mineração de dados para Windows. Ele permite que você execute diferentes operações de mineração de dadosons. Essas operações incluem Associação, Regressão, Clustering, Aprendizado Spv, Aprendizado Meta-spv, Estatística, Estatística Não Paramétrica, Análise Fatorial, PLS, Avaliação do Aprendizado Spv e Visualização de Dados. Todas essas tarefas de mineração de dados podem ser executadas usando vários algoritmos e técnicas relacionadas. Primeiro, permite importar conjuntos de dados em TXT, ARFF e XLS e criar um diagrama de mineração de dados com ele. Você pode então usar qualquer uma das operações de mineração de dados mencionadas acima para extrair informações úteis. O diagrama de mineração de dados pode ser copiado como uma imagem ou salvo como diagrama de mineração de dados de texto (tdm) ou diagrama de mineração de dados binários (bdm). Um relatório de resultado HTML também pode ser salvo localmente.
Vamos ver quais são os algoritmos que você obtém para executar uma tarefa de mineração de dados nele:
- Associação: A priori, A priori MR, A priori PT, Assoc Outlier, Frequent Itemsets, Spv Assoc Rule, Spv Assoc Tree.
- Regressão: Registro de eliminação retrógrada, Regressão C-RTna árvore, DfBetas, Epsilon SVR, regressão de entrada direta, regressão linear múltipla, Nu SVR, detecção de outlier, avaliação de regressão, árvore de regressão, regressão simultânea.
- Clustering: CT, CTP, EM-Clustering, EM-Selection, HAC, K-Means, Kohonen-SOM, LVQ, Neighborhood Graph, VARCLUS, VARHCA, VARKMeans.
- Visualização de dados: Correlation Scatterplot, Export dataset, Scatterplot, Scatterplot with Labels, View Dataset, View multiple scatterplots.
- Aprendizado Spv: Regressão Logística Binária, C4.5, C-PLS, C-RT, CS-CRT, CS-MC4, C-SVC, Lista de Decisão, ID3, K -NN, Análise Discriminante Linear, Log-Reg TRIRLS, Percepção Multicamada, Regressão Logística Multinomial, Naive Bayes, Naive Bayes Contínuo, PLS-DA, PLS-LDA, Protótipo-NN, Função de Base Radial, Rnd Árvore, Indução de regras, SVM.
- Meta-spv Learning: Arcing, Bagging, Boosting, Cost Sensitive Bagging, Const Sensitive Learning, Multicost, Aprendizagem Supervisionada.
- Avaliação de Aprendizagem Especial: Decomposição de Variação de Viés, Bootstrap, Validação Cruzada, Teste de Hosmer Lemeshow, deixar Um Fora, Resíduos de Regressão Logística, Teste, Teste de Trem.
- Estatísticas: ANOVA Randomized Blocks, Bartlett’s Test, Box’s M test, brown-Forsythe’s Test, Fisher;s Test, Group Characterization, Group exploit, Hotelling’s T2, Hotelling’s T2 Heteroscedastic, Levene’s Teste, correlação linear, estatística de cont mais univariada, teste de normalidade, ANOVA unidirecional, MANOVA unidirecional, teste T pareado, teste V pareado, correlação parcial, correlação semiparcial, teste T, variância desigual do teste T , Estatística Contínua Univariada, Estatística Discreta Univariada, Detecção de Outlier Univariada, Welch ANOVA.
- Estatísticas não paramétricas: Teste de escala Ansari-Bradley, r categórico, teste Q de Cochran, qui-quadrado de contingência, ANOVA de Friedman by Ranks, FYTH 1-way ANOVA, Goodman Krushkal Gamma, Goodman Krushkal Lambda, Goodman Krushkal Tau, Kendall Tau-b, Kendall Tau-c, Kendall’s tau, Kendall’s Concordance W, Klotz Scale Test, Kruskal-Wallis 1-way ANOVA, Teste K-S de 2 amostras, Comparação de Mann-Whitney, Teste de mediana, Teste de execução de humor, Teste de escala de humor, Theil U parcial, Teste de sinal, Sommers d, Spearman’s rho, Theil U, Van der Waerden ANOVA de 1 fator, Wald-Wolfowitz Runs Teste, teste de postos assinados de Wilcoxon.
- Análise Fatorial: Análise Discriminante Canônica, Análise de Correspondência, Rotação de Fatores, Análise de Correspondência Múltipla, NIPALS, Análise de Componentes Principais.
- PLS: PLS Conf. Intervalo, Fatorial PLS, Regressão PLS, Seleção PLS, PLSR.
- Pontuação: Curva de lista, Prob posterior, Curva de precisão, diagrama de confiabilidade, Curva Roc, Pontuação.
- Construção de recursos: Binning binário, tendência, pontuações residuais, MDLPC, Cont para disco, etc.
Ele fornece muitas ferramentas para executar tarefas de mineração de dados. Para entendê-lo mais de perto, você pode verificar este tutorial em vídeo.
Página inicial Página de download
Mineração de dados NeoNeuro
NeoNeuro Data Mining é o próximo software de mineração de dadosnesta lista. Ele basicamente permite o aprendizado de máquina para várias tarefas de clustering comuns e multidimensionais.
Nele, você pode abrir conjuntos de dados nos formatos TXT, CSV, XLS, etc. Você também pode criar um novo conjunto de dados para executar tarefas relacionadas. Ele fornece uma seção de Cálculo que contém opções como Validação Cruzada, Cálculo de Séries, etc. Ele também fornece uma ferramenta de Análise para análise de dados que estima os parâmetros mais importantes e representa visualmente a influência de cada valor paramétrico. Ele também cria uma fórmula do Excel que você pode usar em seus processos de negócios ou pesquisas científicas. Verifique este tutorial em vídeo em caso de qualquer dificuldade em entendê-lo.
Observação: é gratuito apenas para uso não comercial.
Página inicial Página de download
khcoder
khcoder é basicamente um software de mineração de dados de texto e é usado para análise quantitativa de conteúdo. Ele fornece muitas ferramentas para análise, que incluem Associação de palavras, Concordância KWIC, Estatísticas descritivas, Análise de correspondência, Escala multidimensional, Análise de agrupamento hierárquico, Rede de coocorrência, Mapa de auto-organização e Lista de frequência. Ele também fornece uma ferramenta Naive Bayes Classifier.
É usado basicamente para análise de texto. Ele processa arquivos de texto e cria número de frases, parágrafo, tokens, memorando, lista de frequência, frequência de coocorrência, etc. resultados. Você pode adicionar plug-ins a este software para adicionar mais recursos a ele. Os resultados finais podem ser salvos em seu formato nativo.