Mais uma vitória(zinha)!
Como acho que já comentei, uma das coisas que se destaca de uma leitura preliminar é a sobreposição de respostas entre "Deus" e "Jesus", em alguns questionários.
É coisa para dar informações importantes sobre a representação da Trindade.
O problema é que nós, humanos, somos bastante bons a detectar "parecenças". E as máquinas nem por isso.
Como fazer para automatizar este procedimento de medida da similitude entre dois campos?
Afinal, na área da data warehouse há uns fulanos que lidam com isso todos os dias. Há vários algoritmos disponíveis. Um deles é o de Jaro-Winkler-
Depois de umas tentativas frustradas de implementar a coisa, descobri que um outro sw com que estou a trabalhar (Pentaho kettle) consegue fazer isso razoavelmente.
O algoritmo jaro-winkler compara 2 textos e dá uma medida entre 0 (totalmente diferentes) e 1 (absolutamente semelhantes).
Mostrar mensagens com a etiqueta jaro-winkler. Mostrar todas as mensagens
Mostrar mensagens com a etiqueta jaro-winkler. Mostrar todas as mensagens
2010/12/23
2010/11/17
novidades de Novembro
Algumas novidades: um amigo enviou-me uns 250 questionários preenchidos, provindos do Sul. Assim a demografia fica mais bem distribuída. Ainda se mantém o peso excessivo da faixa 16-18 anos.
Descobri algumas possibilidades para medir a similitude das respostas relativas a Deus e a Jesus. Como disse lá para trás, estão a parecer questionários onde aquilo que se diz de Deus é igual (mais ou menos) ao que se diz de Jesus (e por vezes do Espírito). Era importante medir o impacto desta indiferenciação trinitária.
Por portas travessas (outro projecto em que estou metido) descobri vários algoritmos, entre os quais o de Jaro-Winkler. Problema: como é que o implemento em access ou noutra ferramenta acessível aos comuns mortais?
Descobri algumas possibilidades para medir a similitude das respostas relativas a Deus e a Jesus. Como disse lá para trás, estão a parecer questionários onde aquilo que se diz de Deus é igual (mais ou menos) ao que se diz de Jesus (e por vezes do Espírito). Era importante medir o impacto desta indiferenciação trinitária.
Por portas travessas (outro projecto em que estou metido) descobri vários algoritmos, entre os quais o de Jaro-Winkler. Problema: como é que o implemento em access ou noutra ferramenta acessível aos comuns mortais?
Subscrever:
Mensagens (Atom)