VERISPEAK SDK

•O VeriSpeak SDK é baseado na tecnologia de reconhecimento de voz VeriSpeak e é projetado para desenvolvedores e integradores de sistemas biométricos. O SDK permite o rápido desenvolvimento de aplicações biométricas usando funções do algoritmo VeriSpeak. O VeriSpeak pode ser facilmente integrado ao sistema de segurança do cliente. O integrador tem controle completo sobre a entrada e saída de dados do SDK.

•O VeriSpeak está disponível como os seguintes SDKs:

•O VeriSpeak Standard SDK é projetado para desenvolvimento de aplicativos biométricos baseados em PC, embarcados ou móveis. Inclui licenças de componente Voice Matcher e Extractor, exemplos de programação e tutoriais e documentação de software. O SDK permite o desenvolvimento de aplicativos biométricos para sistemas operacionais Microsoft Windows, Linux, MacOS e Android.

•O VeriSpeak Extended SDK foi projetado para desenvolvimento biométrico baseado na Web e de aplicativos de rede. Ele inclui todos os recursos e componentes do SDK padrão com a adição de licenças de componente do Voice Client para PCs e dispositivos Android, exemplos de aplicativos clientes, tutoriais e um componente de servidor compatível pronto para uso .

•A tabela abaixo compara o VeriSpeak 11.1 Standard SDK e o VeriSpeak 11.1 Extended SDK. A lista pode ser reduzida com filtragem por certos requisitos baseados no sistema biométrico de destino. Consulte o modelo de licenciamento para obter mais informações sobre tipos de licença específicos.

CARACTERÍSTICAS E CAPACIDADES

O algoritmo dependente do texto impede o acesso não autorizado com uma voz de usuário secretamente gravada.
Autenticação de dois fatores, verificando a autenticação da frase-senha e biometria de voz.
Microfones e smartphones regulares são adequados para gravar vozes de usuários.
Disponível como um SDK multiplataforma que ofereça suporte a várias linguagens de programação.
Preços razoáveis, licenciamento flexível e suporte ao cliente gratuito.

O algoritmo VeriSpeak implementa o cadastro de voz e a verificação de impressões de voz usando tecnologias de processamento de som exclusivas:

Algoritmo dependente do texto. O reconhecimento do orador dependente do texto é baseado na mesma frase para o cadastro e verificação. O algoritmo VeriSpeak determina se uma amostra de voz corresponde ao template que foi extraído de uma frase específica. Durante o cadastro, uma ou mais frases são solicitadas à pessoa que está sendo cadastrada. Mais tarde, essa pessoa pode ser convidada a pronunciar uma frase específica para verificação. Este método garante proteção contra o uso de uma frase aleatória gravada dessa pessoa.
Autenticação de dois fatores com uma senha. O algoritmo de verificação de impressão de voz VeriSpeak pode ser configurado para funcionar em um cenário em que cada usuário grava uma frase exclusiva (como uma frase secreta ou uma resposta a uma "pergunta secreta" que é conhecida apenas pela pessoa que está sendo cadastrada). Mais tarde, uma pessoa é reconhecida por sua própria frase específica com um alto grau de precisão. A segurança geral do sistema aumenta à medida que a autenticidade da voz e a senha são verificadas.
Algoritmo independente do texto. O reconhecimento de oradores independente de palavras usa frases diferentes para inscrição e reconhecimento de usuários. Esse método é mais conveniente, pois não exige que cada usuário se lembre da frase-senha. Pode ser combinado com o algoritmo dependente do texto para executar pesquisas mais rápidas em texto com verificação de frases adicionais usando o algoritmo dependente de texto mais confiável.
Detecção automática de atividade de voz. VeriSpeak é capaz de detectar quando os usuários começam e terminam de falar.
Detecção de vida. Um sistema pode solicitar a cada usuário que cadastre um conjunto de frases únicas. Posteriormente, o usuário será solicitado a dizer uma frase específica do conjunto inscrito. Desta forma, o sistema pode garantir que uma pessoa viva esteja sendo verificada (em oposição a um impostor que usa uma gravação de voz).
Capacidade de identificação. As funções do VeriSpeak podem ser usadas em modos “1-para-1” (verificação) e “1-para-muitos” (identificação).
Múltiplas amostras da mesma frase. Um template pode armazenar vários cadastros de voz com a mesma frase para melhorar a confiabilidade do reconhecimento. Certas variações naturais de voz (ou seja, voz rouca) ou alterações de ambiente (isto é, escritório e exterior) podem ser armazenadas no mesmo template.
Combinações mescladas. Um sistema pode pedir aos usuários para pronunciarem várias frases específicas durante a verificação ou identificação do alto-falante e combinar cada amostra de áudio com os cadastros no banco de dados. O algoritmo VeriSpeak pode fundir os resultados correspondentes para cada frase em conjunto para melhorar a confiabilidade de verificação.

•ESPECIFICAÇÕES TÉCNICAS E RECOMENDAÇÕES DE USO

•Recomendações gerais :

•A precisão do reconhecimento do alto-falante do MegaMatcher depende da qualidade do áudio durante a inscrição e a identificação.

•Amostras de voz com pelo menos 2 segundos de duração são recomendadas para garantir a qualidade do reconhecimento do alto-falante.

•Uma frase secreta deve ser mantida em segredo e não ser falada em um ambiente onde outros possam ouvi-la se o sistema de reconhecimento de alto-falante for usado em um cenário com frases exclusivas para cada usuário.

•O reconhecimento de locutor independente de texto pode ser vulnerável a ataques com uma frase secretamente gravada de uma pessoa. A verificação por senha ou a autenticação de dois fatores (ou seja, o requisito para digitar uma senha) aumentará a segurança geral do sistema .

•Microfones - não há restrições específicas em modelos ou fabricantes ao usar microfones comuns para PC, fones de ouvido ou microfones embutidos em laptops, smartphones e tablets. No entanto, esses fatores devem ser observados:

•O mesmo modelo de microfone é recomendado (se possível) para uso durante o registro e reconhecimento, pois diferentes modelos podem produzir uma qualidade de som diferente. Alguns modelos também podem introduzir ruído ou distorção específica no áudio, ou podem incluir certo processamento de som de hardware, que não estará presente ao usar um modelo diferente. Este também é o procedimento recomendado ao usar smartphones ou tablets , pois diferentes modelos de dispositivos podem alterar a gravação da voz de diferentes maneiras.

•Recomenda-se a mesma posição e distância do microfone durante a inscrição e o reconhecimento. Os fones de ouvido proporcionam uma distância ideal entre o usuário e o microfone; essa distância é recomendada quando microfones sem fone de ouvido são usados.

•Os microfones internos da webcam devem ser usados ??com cuidado , pois geralmente são posicionados a uma distância bastante longa do usuário e podem fornecer uma qualidade de som menor. A qualidade do som pode ser afetada se os usuários alterarem subsequentemente sua posição em relação à web cam.

•Definições de som:

•Configurações para um som claro devem ser asseguradas; alguns softwares de áudio, hardware ou drivers podem ter a modificação de som ativada por padrão . Por exemplo, o sistema operacional Microsoft Windows geralmente tem, por padrão, o aumento de som ativado.

•Uma taxa de amostragem mínima de 11025 Hz , com pelo menos uma profundidade de 16 bits , deve ser usada durante a gravação de voz.

•Restrições de ambiente - o mecanismo de reconhecimento de alto-falantes do MegaMatcher é sensível a ruídos ou vozes altas em segundo plano ; eles podem interferir na voz do usuário e afetar os resultados do reconhecimento. Essas soluções podem ser consideradas para reduzir ou eliminar esses problemas:

•Um ambiente silencioso para inscrição e reconhecimento.

•Várias amostras da mesma frase gravadas em diferentes ambientes podem ser armazenadas em um modelo biométrico. Mais tarde, o usuário será comparado a essas amostras com uma qualidade de reconhecimento muito maior.

•Microfones de curto alcance (como aqueles em fones de ouvido ou smartphones) que não são afetados por fontes distantes de som.

•Soluções terceirizadas ou personalizadas para redução de ruído de fundo, como o uso de dois microfones separados para gravar sons de voz e de fundo do usuário e subtração posterior do ruído de fundo da gravação.

•Comportamento do usuário e alterações de voz:

•As alterações naturais de voz podem afetar a precisão do reconhecimento do alto-falante:

•uma voz temporariamente rouca causada por um resfriado ou outra doença;

•estados emocionais diferentes que afetam a voz (ou seja, uma voz alegre versus uma voz cansada);

•diferentes velocidades de pronúncia durante a inscrição e identificação.

•As alterações de voz e comportamento do usuário mencionadas acima podem ser gerenciadas de duas maneiras:

•registros separados para a voz alterada, armazenando os registros no modelo da mesma pessoa;

•um , voz neutra controlada durante a inscrição e identificação.

•Todos os modelos de voz devem ser carregados na RAM antes da identificação, portanto, o tamanho máximo do banco de dados de modelos de voz é limitado pela quantidade de RAM disponível.

•O tamanho do modelo de impressão de voz depende linearmente do tamanho da amostra de voz. Por exemplo, ao usar amostras de voz que são 2 vezes menores, os valores de tamanho do modelo serão 2 vezes menores.

•O mecanismo dependente de texto do VeriSpeak 11.1 pode realizar a correspondência de modelos em dois modos:

•Frase fixa - cada sujeito no banco de dados registrou a mesma frase. Este modo fornece correspondência mais rápida , mas menor confiabilidade.

•Frase única - cada sujeito no banco de dados registrou uma frase única. Esse modo fornece maior confiabilidade , mas menor velocidade de correspondência.

•O algoritmo de extração e combinação de modelos biométricos VeriSpeak é projetado para rodar em processadores multi-core, permitindo alcançar o máximo desempenho possível no hardware usado.

•REQUISITOS DE SISTEMA

•

•Conteúdos da página:

•Plataforma Microsoft Windows

•Plataforma Android

•plataforma iOS

•plataforma MacOS

•Plataforma Linux x86-64

•Plataforma ARM Linux

•Existem requisitos específicos para cada plataforma que executará aplicativos baseados no VeriSpeak.
Clique na plataforma específica para visualizar os requisitos correspondentes.

•REQUISITOS DA PLATAFORMA MICROSOFT WINDOWS

•Microsoft Windows 7/8/10 .

•PC ou laptop com processadores compatíveis com x86-64 (64 bits) .

•Recomenda-se processador de 2 GHz ou melhor.

•Os processadores x86 (32 bits) ainda podem ser usados, mas o algoritmo não fornecerá o desempenho especificado.

•O suporte AVX2 é altamente recomendado. Os processadores que não suportam o AVX2 ainda executarão os algoritmos VeriSpeak, mas em um modo que não fornecerá o desempenho especificado. A maioria dos processadores modernos suportam este conjunto de instruções, mas, por favor, verifique se um determinado modelo de processador o suporta.

•Recomenda-se 2 GB de RAM livre para cenários de uso geral. É possível reduzir o uso de RAM para cenários específicos. Além disso, RAM adicional pode ser necessária para aplicativos que realizam identificação de 1 para muitos, já que todos os modelos biométricos precisam ser armazenados na RAM para correspondência.

•Microfone. Qualquer microfone que seja suportado pelo sistema operacional pode ser usado.

•Mecanismo de banco de dados ou conexão com ele. Modelos VeriSpeak podem ser salvos em qualquer banco de dados (incluindo arquivos) que suporte salvamento de dados binários. O VeriSpeak Extended SDK contém os seguintes módulos de suporte para o Matching Server na plataforma Microsoft Windows:

•Microsoft SQL Server;

•MySQL;

•Oráculo;

•PostgreSQL;

•SQLite.

•Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente correspondente do servidor (incluído no VeriSpeak Extended SDK). O VeriSpeak SDK não fornece criptografia de comunicação com o servidor Matching, portanto, os integradores devem proteger a comunicação por si mesmos.

•Microsoft .NET framework 4.5 ou mais recente (para uso de componentes .NET).

•Um dos seguintes ambientes de desenvolvimento para desenvolvimento de aplicativos:

•Microsoft Visual Studio 2012 ou mais recente (para desenvolvimento de aplicativos em C / C ++, C #, Visual Basic .Net)

•Sun Java 1.7 SDK ou posterior