sexta-feira, 10 de janeiro de 2014

Watson-as-a-nuvem da IBM: É um pássaro? É um avião? Não, é outro de mainframe


Lista principal da terminologia DNS


Tentativa de análise da IBM para girar o seu cum-TV supercomputador Watson estrela em uma unidade de negócio de US $ 1 bilhão podem, eventualmente, aumentar a linha de fundo da Big Blue - mas indo de bater Jeopardy para derrotar o câncer vai ser mais difícil do que o esperado!.


Mecanismo de decisão do sistema e avançada tecnologia de processamento de linguagem natural foi lançado como uma nova máquina de fazer dinheiro em um evento brilhante em Nova York na quinta-feira . Até agora, ao que parece, o mainframe inteligente provou menos uma panacéia e mais uma dor no pescoço para a IBM.







A partir de 2013, cerca de sete anos depois de ter sido concebido, Watson tem batido o gameshow acima mencionado , mas geraram menos do que US $ 100 milhões em receita. Alguns de seus projetos estão "em uma vala", de acordo com o Wall Street Journal, ainda, da IBM CEO Virginia Rometty espera que a tecnologia vai gerar US $ 10 bilhões por ano em 10 anos.


Watson, no entanto, não está cooperando. Demora muito tempo para criar e treinar para novas tarefas, e quando ele começa a fornecer previsões, eles não são sempre muito uso, para começar, o WSJ afirmou. Um olhar sobre a arquitetura subjacente do supercomputador nos diz o porquê.


Software sob o capô


Watson obtém sua magia a partir de um mecanismo de análise DeepQA , que se mistura Hadoop , Apache UIMA e outras ferramentas para alcançar a aprendizagem de máquina: isto permite que a máquina de ingerir uma grande quantidade de informações estruturadas e não estruturadas, analisar as ligações entre fatos, vem com provável respostas em resposta a perguntas e, finalmente, classificá-las em termos de confiança.


"Os princípios gerais em DeepQA são paralelismo maciço, muitos especialistas, a estimativa de confiança generalizada, e integração do conhecimento superficial e profundo", escreveu a IBM em um papel AI discutir a tecnologia em 2010.


DeepQA necessário IBM para fazer investigação fundamental em diversas áreas, tais como processamento de questão, a extração de relação, a extração estrutura linguística, conjuntos de correspondência de passagem, e refinar o conhecimento de dados extraídos. Todos os problemas extremamente difíceis, e as áreas onde a Big Blue fez grandes avanços.


Esses avanços significam que Watson pode, dada formação suficiente e bons dados suficientes, oferecer previsões eficazes sobre melhores cursos de ação. No entanto, a qualidade dos conhecimentos que podem gerar são obrigados pela quantidade de dados alimentados a ele.


Por esta razão, cada projeto Watson no local requer grandes quantidades de dados frescos, reciclagem, e um compromisso de longo tempo para chegar ao cérebro de silício zumbido enfrentar perguntas corretamente. IBM admite isso em um trabalho acadêmico [PDF] que discute os desafios da mudança de Watson vencedor Jeopardy para a medicina:



Aplicando DeepQA a qualquer novo domínio requer adaptação em três áreas:



  • Adaptação de conteúdo envolve organizar o conteúdo de domínio para a hipótese e geração de evidências, modelando o contexto em que as perguntas serão gerados

  • Adaptação de Treinamento envolve a adição de dados na forma de perguntas amostra de treinamento e respostas corretas a partir do domínio alvo, de modo que o sistema pode aprender pesos apropriados para os seus componentes ao estimar resposta confiança

  • Adaptação funcional envolve a adição de nova análise específica do domínio questão, a geração de candidato, hipótese de pontuação e outros componentes.



Pense em um mainframe. Watson parece muito parecido com um daqueles, como preferências de relacionamentos de longo prazo, um esforço financeiro não revelado, e trava-em-por-padrão como esta tecnologia é apenas em campo pela IBM.


Isso não é uma coisa terrivelmente ruim, mente, como para algumas organizações uma ferramenta como esta poderia ser útil. Mas isso não significa que você está certo para ser cético quando a IBM começa retratando Watson como um produto de nuvem que é é fácil de começar a usar.


Por esta razão, muito plano para oferecer impressionante o poder do cérebro de Watson como um Big Blue serviço baseado em nuvem é sedutora e pesado com a calda negra de marketing.


Cuja linha de cache é isso, afinal?


Embora Watson beneficiaria, sem dúvida, de ter mais dados em um repositório central, a IBM terá que organizar os dados em domínios relevantes para maximizar a confiança no sistema, e, tanto quanto nós podemos dizer DeepQA não é construída de tal forma que ele pode ser facilmente segmentado em domínios individuais.


Ao contrário, para o serviço baseado na nuvem da IBM para gerar insights maiores do que a soma dos dados contribuíram de um desenvolvedor individual, parece Big Blue terá que adicionar em um sistema hierárquico que pode selecionar quais os repositórios de informação são relevantes para resolver um problema particular. Hardware-wise, tudo isso é factível (que precisava de 2.880 cores do POWER7 , além de Wikipedia e de outros textos, realizada em 15TB de memória RAM, para ganhar Jeopardy! em 2011), mas não está claro se o software está lá.


Uma coisa é certa - em seu estado atual, os projetos de Watson-motorizados requerem forte desenvolvimento tanto pela IBM e os clientes em potencial, e, embora a IBM está formando um laboratório para ajudar a trabalhar com as empresas do Vale do Silício para criar aplicativos Watson, parece ser um caminho difícil. ®



Nenhum comentário:

Postar um comentário