Opera Aria genera immagini e legge le risposte

Opera Aria genera immagini e legge le risposte

Opera Aria può generare immagini a partire da una descrizione testuale e leggere le risposte a voce alta (al momento solo in Opera One Developer).
Opera Aria genera immagini e legge le risposte
Opera Aria può generare immagini a partire da una descrizione testuale e leggere le risposte a voce alta (al momento solo in Opera One Developer).

La software house norvegese ha annunciato due importanti novità per il suo chatbot integrato nelle varie versioni del browser. Opera Aria permette ora di generare le immagini a partire da un input testuale e può leggere le risposte a voce alta. Queste novità sono al momento disponibili agli sviluppatori tramite Opera Developer. Gli utenti possono testare Aria in Opera One (desktop e mobile). In futuro potranno scegliere tra oltre 150 modelli.

Nuovo AI Feature Drops

Le novità fanno parte del programma AI Feature Drops, avviato all’inizio di marzo, che prevede il rilascio di funzionalità sperimentali basate sull’intelligenza artificiale generativa per Opera One. L’accesso è riservato agli sviluppatori che forniranno i feedback prima della distribuzione generale.

La software house sfrutta i modelli GPT di OpenAI per le normali conversazioni. Per la generazione delle immagini viene utilizzato il modello Imagen 2 di Google. L’utente deve inserire un prompt (input) specificando l’intenzione di generare un’immagine e aggiungendo una descrizione testuale, ad esempio “Crea un’immagine di un cane in vacanza sulla spiaggia mentre beve un drink“.

Opera Aria - generazione immagini

Se l’immagine non è quella desiderata è possibile rigenerarla cliccando sul terzo pulsante mostrato in alto a destra. È quindi possibile chiedere ad Aria di modificare l’immagine, senza ripetere il prompt completo. C’è tuttavia il limite di 30 immagini al giorno.

La seconda funzionalità è utile soprattutto per gli utenti con problemi visivi. Cliccando sul primo pulsante in alto a destra, il chatbot legge il testo della risposta a voce alta. In questo caso viene utilizzata la versione base del modello Wavenet di Google. Opera Aria è accessibile dalla barra laterale o linea di comando (Ctrl + / o Cmd + /).

Opera Aria - lettura risposte

Fonte: Opera
Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
2 mag 2024
Link copiato negli appunti