BLOG, www – articoli dal web

Voice Commander : Parla alla tua DAW

BLOG | 29 Aprile 2021 Cristiano Alberghini

Voice Commander

Dall’idea al prodotto

DAW.VOICECOMMANDER.NET

Voice Commander : Parla alla tua DAW!
Vuoi controllare la DAW con la tua voce? Certo hai capito bene, invece di utilizzare le scorciatoie da tastiera, perché non usare la propria voce?
Di seguito lo sviluppatore Arnaud Lamy, (CEO) spiega la realizzazione di Voice Commander, dall’idea al prodotto:

“Lavorando nell’industria dei videogiochi come designer del suono, vedevo i colleghi sprecare il loro tempo in azioni ripetitive di ogni tipo, compiti noiosi al computer che aggiungevano ore di lavoro inutile alla loro giornata. Questi compiti costituivano un labirinto che impediva loro di andare dal punto A al punto B. Essendo un perfezionista, mi piaceva lavorare ore extra per compiacere il mio supervisore, anche quando ciò significava sacrificare il mio tempo personale e il mio benessere. Il lavoro veniva sempre prima delle relazioni. Ma quando mi sono avvicinata ai 30 anni, le mie priorità hanno iniziato ad evolversi. Volevo vivere una vita equilibrata, piena e sana, ma la mancanza di tempo mi impediva di raggiungere questo obiettivo. Essendo fiducioso nelle mie capacità di esecuzione, ho cercato dei modi per snellire drasticamente il mio flusso di lavoro al fine di recuperare tempo prezioso”.

“Ho sviluppato nuovi strumenti software collegati a controller hardware. Questo progetto creativo mi ha permesso di iterare su funzioni, gestire azioni ricorsive e navigare senza sforzo nella mia giornata di lavoro. Stavo cercando di automatizzare il mio flusso di lavoro e di espandere la quantità di comandi in entrata alla mia postazione di lavoro usando controller hardware aggiuntivi. Ad un certo punto la mia configurazione comprendeva controller pad sul lato sinistro della mia tastiera, una ruota di movimento circolare a destra del mio mouse e pedali per i miei piedi. Questo si è rivelato essere eccessivo! Non potevo elaborare i miei pensieri e i comandi del software usando tutti questi dispositivi contemporaneamente. Era come dirigere un’orchestra e cercare di suonare la batteria allo stesso tempo. Tutto questo hardware non era accessibile da altre stanze dell’ufficio ed era una sofferenza spostarlo in altre posizioni di lavoro. Inoltre, imparare ad usare tutta l’attrezzatura e ad eseguire i comandi finiva per farmi lavorare più lentamente, non più velocemente per le prime settimane. Come potevo liberarmi di questo complesso disordine?

 

Avevo bisogno di qualcosa a mani libere a cui potessi accedere ovunque, qualcosa che sembrasse naturale da usare in modo da non dover investire tempo per imparare a usarlo. Uno strumento che capisse i miei comandi ed elaborasse rapidamente operazioni estese. È stato allora che mi è venuto in mente: Avevo bisogno di un “assistente virtuale onnipresente” al mio fianco che potesse sostituire centinaia di controller”. Quale tecnologia poteva soddisfare i requisiti audaci di comunicazione remota tra me e il mio computer, con un’elaborazione veloce, operare a mani libere, non richiedere curva di apprendimento e nessun hardware aggiuntivo? È quasi come se volessi che il mio computer mi leggesse nel pensiero!

Ho iniziato ad informarmi sulle interfacce cervello-computer. Sviluppare un tale prodotto in questa fase iniziale della tecnologia era molto rischioso. Richiedeva anche un’ingegneria hardware avanzata per il casco o la fascia per registrare l’attività elettrica del cervello. C’erano pochissime possibilità che riuscissi a farlo funzionare. Avevo bisogno di una nuova strategia. Quale processo naturale segue la nascita di un pensiero? Spesso proiettiamo un’immagine mentale; non c’è modo di catturarla. Cosa viene dopo allora? Spesso comunichiamo un’idea mettendola in parole. Bingo!

Il riconoscimento vocale è ora disponibile nelle nostre app mobili per inserire il testo; potrebbe anche automatizzare il processo tramite comandi personalizzati? La parola ci viene naturale, non richiede un hardware speciale per essere catturata, e potrebbe essere completamente remota se potessi accoppiare il mio software con il mio iPhone e inviare comandi attraverso la rete. Ho cercato le API disponibili e fortunatamente c’erano molte opzioni. Alcune di esse includevano strati di apprendimento profondo che avrebbero migliorato la precisione del riconoscimento nel tempo. Questo suonava così promettente, soprattutto perché Siri, un popolare assistente ad attivazione vocale, si era unito ai computer desktop, e lo strumento Microsoft Garage ora permetteva alcuni comandi vocali con Microsoft Word. Dato che non esisteva ancora nulla per il software grafico e le workstation audio digitali. Ho visto un’opportunità per innovare, e qui vi porto la mia creazione, Voice Commander.
Bene allora, mettiamoci al lavoro!”.

L’ecosistema Voice Commander
Scarica l’applicazione per desktop e iPhone che lavora in modo sincrono.

Voicer Commander : Parla alla tua DAW

Pensa al controller sia come una fabbrica di comandi che come un ponte tra le applicazioni. La parte ponte raccoglie le informazioni provenienti dall’app per iPhone, trova un comando corrispondente e invia i compiti corretti. La parte factory ti permette di costruire e organizzare comandi vocali personalizzati per il tuo flusso di lavoro.

Un assistente simile a Siri specializzato nella produzione di musica. Quando viene lanciato, il software ascolta in ogni momento e aspetta i vostri comandi. Filtra tutti gli input audio estranei alla lista dei comandi vocali del controller e al tuo progetto. (es. nomi di tracce e regioni).Per la massima sicurezza, il Voice Commander impara dalla tua impronta vocale a lasciare fuori altre voci. Col tempo l’assistente imparerà da te e dal tuo modo di parlare per prendere decisioni più intelligenti dalle tue richieste.

 

Selezione dele Tracce
Seleziona le tracce, ingloba e compatta le cartelle di tracce.

Voice Commander : Parla alla tua DAW

Niente più scorrimento. Chiama la traccia con la voce!
Non è raro che i progetti musicali contengano più di 50 tracce, si può arrivare facilmente a un centinaio, e più per i template di musica da film. Non importa quanto sia grande lo schermo di un computer, non è possibile visualizzarlo tutto in modo leggibile e confortevole. Daws fornisce un workaround con funzioni di raggruppamento (Folder (cartelle) e Stack), che richiedono l’azione di piegare e dispiegare per il loro accesso. Voice Commander, razionalizza il processo con comfort: all’interno della finestra di arrange o mix, basta chiamare una traccia e la tua daw la selezionerà e la metterà a fuoco.

Se la traccia è in uno stack, lo stack si aprirà e selezionerà la traccia contenuta allo stesso modo. Chiamando una traccia al di fuori di questo stack automaticamente
la ripiegherà di nuovo per mantenere la tua sessione pulita e ordinata. Tutto questo in un batter d’occhio, sì! Con la modalità veloce “on” la selezione delle tracce richiede meno di 0,25 secondi!

 

Modalità di MIX
Estensione della selezione delle tracce per il mixaggio.

Voice Commander : Parla alla tua DAW

Visualizzazione automatica dei plug-in
Voice Commander assiste il tuo mix! Mentre la classica selezione delle tracce è comoda anche durante i mix, ci siamo spinti un po’ oltre con la “visualizzazione automatica dei plugin per le tracce selezionate”. L’ho chiamata modalità mix, perché è molto probabile che la userai durante le sessioni di mixaggio. La modalità mix ha due opzioni: Singolo e Parallelo

Seleziona la traccia e visualizza tutti i plugin contenuti. Quando chiami un’altra traccia, i plugin della traccia precedente saranno sostituiti da quelli nuovi.

Come single, selezionerà e aprirà il plugin di una traccia, ma alla successiva chiamata della traccia precedente i plugin rimarranno sullo schermo. La modalità Prallel è utile per mixare le tracce una con l’altra.

 

Comandi vocali
Da semplici comandi a chiave a marcature complesse.

Voice Commander : Parla alla tua DAW

Comandi vocali personalizzati

Questa è la caratteristica principale di Voice Commander. Per prima cosa definiamo cos’è un comando vocale:
“Un comando vocale è una parola o una frase contenente una o più azioni da eseguire nella Daw.
Al livello superiore Voice Commander riconosce questi comandi vocali dal discorso e passa le azioni contenute al Daw. Chiamiamo queste azioni “comandi” che possono essere di due tipi:

Tipo Key
Tipo Midi

Costruirai i tuoi comandi vocali personalizzati all’interno dell’app controller (app MacOS Desktop). Per approfondimenti vai al manuale.

 

Navigazione a tempo
Accesso intuitivo ai bar indipendentemente dall’età.

Voice Commander : Parla alla tua DAW

Estensione della navigazione orizzontale
Poiché il nostro obiettivo finale è quello di rendere il mouse non necessario, abbiamo fatto un altro passo verso quel paradigma con Time Navigation.

Naturalmente è possibile spostare la testina di riproduzione sui marcatori tramite comandi vocali basati su tasti, l’opzione Time Navigation la sposta su un numero specifico di barre. Per usarla, prima assicuratevi di attivare la Navigazione a tempo dalle preferenze, poi pronunciate la parola chiave “Bar” seguita dal numero della barra su cui volete navigare.

 

tags

DAW, Logic Pro

blog

ultime dal blog

Iscriviti alla newsletter

Cliccando su "Iscriviti" accetti la Privacy Policy (consultabile qui) e accetti di ricevere la newsletter di tutorial Video.IT.
Potrai cancellarti in qualsiasi momento tramite apposito il link presente sulla newsletter stessa.