Os tipos de dados estão vinculados aos tipos de variáveis. Chama-se variável a uma determinada característica de algum fato ou fenômeno da realidade que altera o seu comportamento. A variável sexo, por exemplo, apresenta duas possibilidades: masculino ou feminino. Um dado é o registro de cada ocorrência daquela característica, indivíduo, por indivíduo, de maneira que o dado registra a característica no indivíduo (masculino ou feminino), enquanto a variável diz respeito à categoria do comportamento (sexo). Essa primeira observação é muito importante para que não venhamos a confundir estudos qualitativos e quantitativos de dados quantitativos e qualitativos. Os dados, mais uma vez, estão restritos à sua vinculação com a variável que se quer estudar, enquanto os tipos de estudos estão vinculados aos tipos de abordagens e procedimentos de investigação. Se pudéssemos sintetizar essa diferenciação, o mais próximo possível da realidade seria que a dimensão qualitativa ou quantitativa dos dados focam o registro das informações, enquanto a natureza qualitativa ou quantitativa da investigação dizem respeito à possibilidade de generalização da explicação alcançada.
A ciência reconhece dois grandes agrupamentos de variáveis, chamadas quantitativas e qualitativas. As variáveis quantitativas têm a característica singular de serem medidas diretamente. Essas variáveis apresentam, portanto, valores numéricos que fazem sentido quase que automaticamente. É importante essa ideia de sentido porque é dela que advém todo o esforço dos cientistas para a produção de conhecimentos. Quando se diz -30⁰, automaticamente vem na cabeça das pessoas ideias como “é muito frio”, “a temperatura é congelante” e similares. Advém disso que o número negativo remete automaticamente ao sentido de frio. As variáveis quantitativas apresentam duas subdivisões: discretas e contínuas.
As variáveis discretas são aquelas que representam as características inteiras, completas, integrais dos fatos e fenômenos do mundo. Número de alunos em uma sala é uma variável discreta porque não há a possibilidade de haver 30 alunos e meio e tampouco 17 alunos e um quarto. Não existe meio aluno, da mesma forma que não há meia casa ou meia rua, quando nos referimos à quantidade de casas e ruas de um bairro ou cidade. Novamente, quando se fala em 100 alunos em uma sala de aula, aquela representação numérica automaticamente produz um sentido na cabeça das pessoas.
As variáveis contínuas, em oposição às discretas, são as representações de fatos e fenômenos quebrados, incompletos, como é o caso da temperatura, altura, idade e inúmeros outros. Assim, quando se fala que alguém tem 100 anos, o número do registro automaticamente geram um sentido na mente do indivíduo, da mesma forma que quando se diz que alguém tem 1,17 metro de altura. Note que um dado é apenas o registro, o número. Dados quantitativos são os números utilizados para representar a característica que a variável (temperatura, altura, idade etc.) apresenta.
As variáveis qualitativas não são passíveis de serem medidas diretamente. Mas elas precisam ser medidas. Sem medição não tem ciência. O processo de mensuração se faz em dois estágios. O primeiro estágio corresponde à própria classificação dessas variáveis para, em seguida, ser feita a mensuração. É por isso que elas são classificadas em nominais e ordinais. Isso quer dizer que primeiro damos um nome a elas, em uma situação, ou as colocamos em ordem, na outra. Vejamos.
As variáveis qualitativas nominais não permitem ordenar, não deixam que os cientistas digam que é maior ou menor, superior ou inferior, primeiro ou último e assim por diante. Sexo, nome das pessoas, tipos de móveis, nome de disciplinas e assim por diante, são todos exemplos de variáveis nominais. Quando quero saber os motivos das reprovações de alunos em uma disciplina, o que pretendo, na verdade, é saber os nomes dos motivos para, em seguida, contar quantos eles são e quantas vezes cada um se repete. Comprovação de que os dados nominais precisam ser quantitativados para terem sentido porque, em torná-los quantitativos, são incompreensíveis.
As variáveis qualitativas ordinais já são mais elaboradas porque denotam ordem, já tem um princípio de sentido. Escolaridade é uma variável dessa natureza porque suas categorias podem ser primeiro, segundo e terceiro graus, da mesma forma que os estágios do processo de aprendizagem (apedeuta, iniciante, intermediário e avançado). Novamente aqui, sem que se aplique alguma forma de medida, os dados dessas variáveis não têm sentido.
O que queremos mostrar com essas classificações é que os dados são efetivamente os tijolos com os quais os cientistas constroem o edifício da ciência. Como os pedreiros, engenheiros e arquitetos, os pesquisadores que desejam se transformar em cientistas precisam conhecer e reconhecer cada um desses tipos para que possam elaborar seus instrumentos de coleta de dados em consonância com a arquitetura teórica que elaboraram a partir da revisão da literatura. Há coisas que não há como tratar que não seja a partir de dados quantitativos, enquanto outras só têm sentido a partir de dados qualitativos.
Finalmente, jamais se deve esquecer, que a pretensão da ciência é sempre universal. Isso significa que toda explicação precisa ser aplicada para todo o universo. A explicação sobre a gravitação universal, assim como a motivação humana, parecem valer para todo o universo, ainda que alguns ajustes precisem ser feitas para situações particulares. Buscamos, portanto, uma teoria de tudo, coisa que os dados qualitativos não são capazes de permitir, mas que, sem eles, na identificação localizada dos tipos de tijolos, o prédio da ciência não possa ser edificada.