5 maneiras para reduzir a latência da rede de publicidade
AMD é a fabricação de microprocessadores que conectam seu processador on-board e componentes GPU mais inteligente do que nunca.
As próximas fichas irá utilizar uma técnica AMD chama heterogêneo Queuing (HQ). Esta nova abordagem coloca a GPU em pé de igualdade com a CPU: já não será o motor gráfico tem que esperar para o processador central para dizer-lhe o que fazer.
Atualmente, o CPU só gerencia as tarefas de aplicação, puxando em trabalho de filas expedição de emprego em memória do usuário. Ele pode ainda atribuir funções a si, uma programação de trabalho do núcleo em um outro núcleo, por exemplo.
A GPU não tem esses recursos. Normalmente ele é gerenciado como um recurso periférico por meio do sistema operacional e software de driver, um caminho que acrescenta latência considerável para acesso GPU.
As razões para isso são, em grande parte histórica: a GPU era originalmente um chip separado montado em um add-in bordo conectado ao barramento principal do sistema. Este modelo não foi alterado - embora a GPU é agora integrada no pacote da CPU e pode até mesmo ser parte de um mesmo molde.
A velha forma: a GPU é escravo da CPU e não pode gerir as suas próprias filas de tarefas
Nova abordagem da AMD, o resultado do seu trabalho de definir o que chama de uma arquitetura de sistema heterogêneo (HSA), concede o GPU o mesmo acesso à memória e capacidades de gestão do trabalho e como o CPU tem.
Um hQ GPU, então, pode monitorar filas de tarefas para aceitar e agendar tarefas, tanto para si e para a CPU. Aplicações com trabalho para a GPU apenas agrupar-se os detalhes do trabalho e adicioná-lo à fila de envio do GPU em memória do usuário. O caminho do driver nível do kernel é eliminado e com ele toda a latência que existe atualmente.
No coração do sistema é heterogêneo arquitetura de memória unificada da AMD (huma), em que a memória do usuário é compartilhada pela CPU e GPU. No entanto, uma nova adição expedição é uma tarefa formato do pacote padronizado capaz de ser compreendida por qualquer hardware HSA-compatível, de igual modo um formato padrão de filas. Apps pode gerar tarefas neste novo formato de pacote diretamente, e não há necessidade de traduzir os pacotes em intermediário ou formatos específicos do fornecedor, que é um dos trabalhos motoristas são actualmente obrigados a fazer.
Não mais ter que traduzir e fazer pacotes tarefa cópias melhora o desempenho. Assim, não tendo acesso direto a filas de tarefas na memória do usuário, pois não há mais necessidade para o kernel indutores latência mudanças de modo impostas porque o motorista deve operar em um espaço de memória protegida.
Igualdade de núcleos: a arquitetura Queuing heterogêneo
Ativando o QG GPU para operar de forma independente da CPU cria mais oportunidades para o último a ser colocado para dormir enquanto o GPU está prestando pixels e polígonos, ou mastigando números como um processador de dados massivamente paralelo. Como tal, diz a AMD, os benefícios da HQ ordenadamente escala de processadores de smartphones por todo o caminho até o centro de dados chippery.
Claro, tudo isso só faz sentido se houver mais de um fornecedor está apoiando a iniciativa, então a AMD foi rápido em apontar o formato do pacote HSA é apoiado por seus companheiros HSA Foundation, entre eles ARM, Qualcomm, Samsung, Mediatek e Texas Instruments .
Não deve haver falta de hardware HSA-compatível, então, mas vai aplicações tirar proveito dela? AMD espera que seus esforços para incorporar HSA em APIs padrão, como OpenCL e OpenCV, permitindo que programadores se beneficiar da nova abordagem sem esforço.
"Nós também planeja conectar HSA através de modelos de programação populares como Java e Python ... e que oferece alguns dos benefícios ", disse o AMD sênior colega Ben Sander.
"Mas você pode usar este material diretamente. Isso exige mais investimento por parte do programador, mas você está recebendo o controle final sobre o pacote eo que é enviado para a GPU. "
O que a AMD não está dizendo, no entanto, é quando ele vai implementar QG em seus próprios processadores. ®
Nenhum comentário:
Postar um comentário