Especificação do arquivo .nam

Os arquivos .NAM atualmente podem ser interpretados como arquivos JSON. A estrutura de dados mais externa é um dicionário.

Existem algumas chaves principais que você deve esperar encontrar, com os seguintes significados:

  • “version”: Uma string que informa a versão do arquivo. Segue o padrão de versionamento semântico (semantic versioning).
  • “architecture”: A arquitetura de alto nível do modelo (normalmente “WaveNet” ou “LSTM”, embora qualquer string correspondente ao nome de uma classe de modelo definida no pacote nam seja válida). Caso você tenha criado uma nova arquitetura, deve definir um novo nome aqui. A convenção é utilizar o nome da classe.
  • “config”: Um dicionário contendo detalhes específicos da arquitetura (por exemplo, número de camadas, etc).

“weights”: Uma lista de números do tipo float que representam os pesos (parâmetros) do modelo. A forma como esses valores são mapeados no modelo depende da arquitetura.

 

CHAVES OPCIONAIS

Existem também algumas chaves opcionais que o NAM pode utilizar:

  • “sample_rate”: A taxa de amostragem (possivelmente não inteira) dos dados que o modelo espera receber, em amostras por segundo (Hz). Caso não esteja presente, geralmente deve-se assumir que a taxa de amostragem é 48kHz.
  • “metadata”: Um dicionário contendo pares chave-valor com informações sobre o modelo. As seguintes chaves podem ser utilizadas por este pacote:

 

METADADOS DISPONÍVEIS
  • “date”: Um dicionário com os campos “year”, “month”, “day”, “hour”, “minute” e “second”, indicando a data e hora em que o modelo foi exportado (todos do tipo inteiro).
  • “name”: Nome do modelo (pode ser utilizado como nome de exibição por plugins).
  • “modeled_by”: Quem criou o modelo.
  • “gear_make”: Fabricante do equipamento (ex.: Fender).
  • “gear_model”: Modelo do equipamento (ex.: Deluxe Reverb).
  • “gear_type”: Tipo de equipamento que está sendo modelado. As opções são:
    amp, pedal, pedal_amp, amp_cab, amp_pedal_cab, preamp e studio.
  • “tone_type”: Característica sonora do modelo. As opções são:
    clean, overdrive, crunch, hi_gain e fuzz.
  • “training”: Um dicionário contendo informações sobre o treinamento (presente apenas quando os treinadores simplificados são utilizados).
  • “input_level_dbu”: Nível de sinal de entrada aplicado ao equipamento, em dBu, correspondente a uma onda senoidal de 1kHz com pico em 0dBFS.
  • “output_level_dbu”: Nível, em dBu, de uma onda senoidal de 1kHz que atinge pico de 0dBFS quando aplicada à interface que grava a saída do equipamento modelado.