Um dos grandes desafios na construção de bases de dados de data warehouses reside na qualidade dos seus dados. Como esses dados que servem de matéria- -prima para esses repositórios de dados podem ter as mais diversas procedências, vários tipos de problemas precisam ser resolvidos. Um exemplo da situação acima descrita encontra-se no fato de que os
campos numéricos das bases de dados de origem podem conter dados que não pertençam ao domínio de valores do atributo, por problemas relativos ao endereçamento dos cálculos efetuados pela ferramenta de extração, transformação e carga.
campos que armazenam datas precisam fazer menção à latitude e à longitude onde se encontra a base de dados do data warehouse, sob pena de comprometer o processo de construção de eventuais datamarts em momentos posteriores.
dados que representam medidas que ocorrem em diversas fontes de dados, como um atributo que armazene medições de temperatura de diversas regiões, podem, em algumas bases, se encontrar incompletos, necessitando tratamento.
atributos categóricos, tais como, sexo ou categoria funcional, necessitam, na integração, ser convertidos em valores numéricos, pois ferramentas OLAP possuem limitações quanto ao tratamento de valores de atributos discretos.
identificadores, tais como, atributos-chave de tabelas, podem, no processo de integração, conter valores de chaves primárias inválidas de outras tabelas, indicando problemas de integridade referencial e de unicidade.
{TITLE}
{CONTENT}
{TITLE}
Aguarde, enviando solicitação...