QuSeed: l’intelligenza artificiale al servizio dell’innovazione

In Startup Bakery creiamo SaaS con elementi di intelligenza artificiale, ma che vuol dire davvero fare AI?
AI QuSeed

In Startup Bakery, l’intelligenza artificiale è molto di più di un semplice ingrediente della business recipe. Andiamo oltre l’utilizzo dell’AI. Noi la creiamo e la mettiamo al servizio delle nostre startup per fare innovazione. 

Quindi fate startup Deep Tech? No! Ma crediamo che l’AI sia un elemento abilitante, una leva da sfruttare per amplificare l’impatto dei nostri SaaS (a tal proposito, ne abbiamo già parlato in passato).

E cosa fate?

Facciamo AI. Per spiegare esattamente e praticamente cosa facciamo, non c’è miglior modo che leggere la ricetta di QuSeed e vedere gli ingredienti utilizzati.  

QuSeed è il SaaS proprietario di Startup Bakery che ci supporta nella ricerca dei trend dell’innovazione. È in costante evoluzione e questo ci consente di esplorare tecnologie cutting-edge, di testarle rapidamente e di integrarle all’interno del ciclo di sviluppo, mettendo poi a disposizione i nuovi componenti all’interno di tutto il gruppo e creando così un’AI pronta all’uso.

Dal momento che il nostro SaaS incamera e analizza quotidianamente una grande quantità di dati non strutturati (ovvero articoli rilevati in rete), abbiamo deciso di chiamare in causa una serie di tecniche di NLP (Natural Language Processing) per l’estrazione di valore da queste informazioni. A questi dati vengono abbinati anche quelli finanziari, che vengono a loro volta manipolati e sfruttati per l’identificazione di trend significativi nel mondo dell’innovazione. 

Ecco quindi illustrate di seguito alcune delle principali tecnologie e tecniche che adottiamo per lo sviluppo di QuSeed.

Keyword extraction

L’estrazione di parole chiave dai testi permette di velocizzare la consultazione e il processamento dei documenti, fornendo in breve i termini cardine attorno a cui è costruito un testo. Una delle migliori librerie di elaborazione del linguaggio naturale progettata per semplificare l’estrazione di parole chiave significative da un testo è keyBERT che – basandosi su tecniche di embedding – utilizza rappresentazioni vettoriali delle parole per identificare rapidamente le chiavi semantiche di un documento.

  • keyBERT ci consente di estrarre le informazioni essenziali dai testi incamerati in QuSeed, semplificando l’analisi del testo e riducendo la complessità delle operazioni di NLP. 

Database vettoriali

I database vettoriali rappresentano un tipo di base di dati che implementano una serie di tecniche per organizzare, memorizzare e recuperare velocemente informazioni basate su vettori e non solo su identificatori o etichette testuali.

Grazie all’esplosione di applicativi che utilizzano LLM, generative AI e semantic search, i database vettoriali sono diventati un must per processare efficientemente la mole di dati generati dai modelli e per consentire l’introduzione di funzionalità avanzate, quali semantic information retrieval, long-term memory, clustering, etc.

  • All’interno di QuSeed usiamo i db vettoriali per incamerare gli embedding degli articoli da analizzare e li sfruttiamo per la ricerca di contenuti (semantic search) e per fornire un contesto al nostro chatbot (Austin), rendendolo in grado di rispondere a domande che riguardano questi contenuti.

Semantic search

La semantic search è un approccio alla ricerca di informazioni che mira a comprendere il significato e il contesto di una query di ricerca, al fine di restituire risultati più pertinenti e significativi rispetto a una ricerca basata solo su parole chiave. Questa tecnologia cerca di interpretare il significato delle parole nella query e di fornire risultati che siano più coerenti con l’intento reale dell’utente.

  • Le ricerche libere di QuSeed sfruttano proprio questo approccio, permettendo di fornire all’utente risposte pertinenti, sia nella ricerca di dati finanziari, sia nella navigazione delle news che incameriamo.

OpenAI API e LangChain

Le API di OpenAI offrono accesso a potenti modelli di linguaggio con capacità di elaborazione del linguaggio naturale (NLP). Questi modelli sono capaci di rispondere in modo intelligente a input basati sul linguaggio naturale.

LangChain è un framework progettato per semplificare la creazione di applicazioni NLP – utilizzando i Large Language Models (LLMs) – che siano consapevoli del contesto (forniscono risposte adeguate al contesto) e trasversali (permettono di ampliare i casi d’uso degli LLM).

Entrambe, combinate con il robusto database interno di QuSeed, alimentano il nostro chatbot proprietario Austin.

  • OpenAI permette a Austin di comprendere e rispondere in modo naturale a input umani, creando un’esperienza di comunicazione fluida e intuitiva, e agli utenti di interagire con il chatbot come farebbero con un essere umano, senza dover adattare il linguaggio o la terminologia.
  • Il framework LangChain consente di gestire e concatenare le richieste inviate a OpenAI, garantendo che ogni conversazione con Austin sia coerente e ben contestualizzata.

Analisi statistica e Studio delle serie temporali

L’analisi statistica è il metodo che consente di raccogliere, analizzare e interpretare i dati. Uno dei rami è lo studio delle serie temporali che si occupa dei dati che cambiano nel tempo. Queste tecniche consentono di identificare modelli e correlazioni nei dati, al fine di comprendere meglio i fenomeni che sono alla base di questi dati. In ambito startup, possono essere utilizzate per identificare tendenze, nuove opportunità di investimento, settori emergenti, ecc.

  • QuSeed utilizza metodi statistici come il test di Mann-Kendall per eseguire un’analisi approfondita delle serie temporali, rilevare pattern e anomalie e identificare la presenza di tendenze nascoste nei dati o eventi significativi nel tempo. Inoltre, utilizza e serie temporali derivate da metriche proprietarie legate agli articoli analizzati, misurando aspetti come l’Information Diffusion Rate o l’interesse degli utenti.
  • QuSeed esegue anche uno studio dettagliato sulla correlazione tra diverse serie temporali, fornendo insights preziosi sulle relazioni e le interconnessioni tra i diversi dati e dando così una visione completa e approfondita del panorama informativo trattato.

SetFit e Contrastive Learning

SetFit è un framework potente e versatile che può essere utilizzato per addestrare una varietà di modelli di apprendimento automatico su set di dati di piccole dimensioni. Mentre il contrastive learning è un approccio all’apprendimento automatico che si basa sulla differenziazione tra esempi simili e diversi con l’obiettivo di imparare a distinguere tra esempi che appartengono alla stessa categoria e esempi che appartengono a categorie diverse. 

  • Entrambi vengono utilizzati nel processo di apprendimento di Bouncer, il modello proprietario di machine learning presente in QuSeed per un filtraggio avanzato di tutti i dati documentali acquisiti, permettendo di avere sufficienti esempi per poter raggiungere un’alta precisione, nonostante un dataset di partenza con dimensioni limitate. 

L’obiettivo principale di Bouncer è eliminare selettivamente i dati ritenuti non utili per le nostre analisi, garantendo che solo le informazioni più rilevanti siano incluse nei nostri studi e offrendo un approccio mirato e ottimizzato alla gestione delle informazioni. 

Clustering

Le tecniche di clustering sono metodi utilizzati nell’analisi dei dati per raggruppare insiemi di osservazioni simili tra loro. Noi utilizziamo un approccio ibrido al clustering, che include DBSCAN, una tecnica che identifica i cluster basandosi sulla densità degli elementi, associato a degli algoritmi custom per gestire in modo dinamico l’aggiunta dei documenti ai cluster identificati.

  • Il clustering consente di identificare i topic di QuSeed, ossia gli insiemi di articoli da cui partono le analisi dei trend. 

La ricerca e lo sviluppo sono alla base del nostro lavoro

Tutte queste tecnologie e tecniche consentono a QuSeed di:

  • Estrarre le informazioni essenziali dai testi incamerati
  • Memorizzare e recuperare le informazioni in modo efficiente
  • Ricercare informazioni in modo pertinente e significativo
  • Comprendere e rispondere in modo naturale a input umani
  • Identificare tendenze, nuove opportunità di investimento e settori emergenti
  • Eliminare selettivamente i dati ritenuti non utili.

QuSeed è uno strumento che può essere utilizzato da startup, aziende e investitori per identificare le tendenze dell’innovazione e prendere decisioni informate.

Tuttavia, le tecnologie elencate in questo articolo sono solo alcune di quelle che adottiamo e che compongono sia QuSeed, sia i componenti di AI messi a disposizione di ogni nostra startup.

La scelta di ogni tecnologia, framework e tecnica è il frutto di mesi di ricerca e test al fine di identificare la strada migliore da un punto di vista di performance, integrabilità, qualità e costi. 

L’innovazione tecnologica (sostenibile) è l’ingrediente principale in Startup Bakery e proprio per questo investiamo costantemente in ricerca e sviluppo, con l’obiettivo di identificare le tecnologie e le tecniche più avanzate per generare le migliori idee di business e supportare le startup del nostro startup studio nel loro percorso di crescita.

Startup Bakery è lo startup studio italiano specializzato nella creazione di aziende SaaS B2B con Intelligenza Artificiale. Offriamo ad aspiranti Co-Founders l’opportunità di sviluppare un’idea di business. Creiamo opportunità di investimento per Investitori Professionali. Aiutiamo le aziende nel processo di innovazione.

  • Blog
  • QuSeed: l’intelligenza artificiale al servizio dell’innovazione

Creiamo startup innovative

Startup Bakery, lo startup studio italiano specializzato nella creazione di aziende SaaS B2B con Intelligenza Artificiale.