sexta-feira, 23 de maio de 2014

Grandes dados bater o ventilador? Nyquist-Shannon ferramenta de exemplo que você pode salvar


Automatização do ciclo de vida integrado: HP ProLiant Gen8


Big Big Data 5 Você está trabalhando em um projeto de dados grande que recolhe dados de sensores que podem ser consultados a cada 0,1 de segundo.


Mas só porque você pode não significa que você deve, então, como é que vamos decidir com que freqüência para consultar os sensores?







A resposta tentadora é coletar tudo, até o último ping. Dessa forma, não é só o seu coberto para trás, mas você também pode garantir a responder, no futuro, todas as possíveis perguntas que poderiam ser feitas dos dados.


Quando se tratar de dados transacional eu certamente o padrão para o "recolher tudo" abordagem, porque geralmente o volume de dados transacional é muito menor. Mas, com os dados do sensor não pode haver uma verdadeira troca.


Suponha que você pode capturar todos os dados (10 vezes por segundo) a um custo de R $ 45 milhões por ano. Mas você também pode coletar dados uma vez a cada 100 segundos (que é de 0,1 por cento dos dados) para 0,1 por cento do custo, um mísero £ 45.000. São todos aqueles pequenos detalhes pequenos realmente vale a pena o extra de £ 44.955 m?


Mais importante ainda, como é que você tomar a decisão?


Bem-vindo à amostragem de Nyquist-Shannon, também conhecido como Teorema de Nyquist, a partir de Harry Theodor Nyquist (1889-1976) e Claude Elwood Shannon (1916-2001).


Nyquist era um estudante talentoso virou emigrante suecos que tinha trabalhado no AT & T Bell Laboratories e até 1954 e que ganhou reconhecimento no para o trabalho de sua vida sobre o ruído térmico, transmissão de dados e na transmissão de telégrafo. O cinzelado Shannon é considerado o pai fundador da era da comunicação eletrônica, que inventou o conceito da teoria da informação, enquanto trabalhava na Bell Labs em 1940. Sua obra premiada olhou para as condições que afectam a transmissão e processamento de dados.


Seu teorema já foi usado pelos engenheiros para reproduzir sinais analógicos (contínua) como (discreto) digital e olhar para a largura de banda.


Vamos pensar em um exemplo real, onde sua teoria pode nos ajudar: votação medidores de eletricidade inteligentes em intervalos regulares. Se o único requisito é analítica para monitorar o uso em uma base diária não requer um gênio para perceber a taxa de amostragem necessário. Mas suponha que nos é dada uma especificação mais ampla.


Digamos que seu cliente lhe diz: ". Sabemos que nossos clientes têm aparelhos que vêm dentro e fora em um ciclo regular (geladeiras, freezers, etc) e que queremos analisar a utilização dos aparelhos individuais"


Eu não posso dizer-lhe como realizar a análise (que eu precisaria de mais informações), mas eu posso colocar imediatamente um limite mais baixo da freqüência com que você precisa para provar, a fim de ser capaz de garantir essa capacidade.


Leve o aparelho que liga e desliga mais rápido e provar um pouco mais do que duas vezes mais que ele muda. Então, se liga uma vez a cada 20 minutos e fora cerca de 10 minutos mais tarde (assim que vai dentro e fora cerca de três vezes por hora), você deve experimentar um pouco mais de seis vezes por hora.


Como disse, a nossa resposta é Nyquist-Shannon, que afirma:



Se uma função x (t) não contém frequências superiores a B hertz, é completamente determinada, dando suas coordenadas em uma série de pontos espaçados 1 / (2b) segundos de intervalo.




Nenhum comentário:

Postar um comentário