Discussion about this post

User's avatar
Stefano Maestri's avatar

Come sai, se dici agente, tocchi immediatamanete una delle nicchie dell'AI che più mi appassiona e mi coinvolge. Ne parlo spesso sui miei canali, e non fa eccezione questa settimana in cui affronto il ruolo cruciale del design di software ed architetture nel modo degli agenti.

Rispetto alla valutazione degli agenti una delle metriche che più spesso si usa è la capacità di autonomia intesa come la lunghezza dei task che sono in grado di eseguire senza interazione umana. Credo sia una metrica interessante, che mesa su un grafico da lpidea dell'evoluzione che stiamo vivendo. Se pensiamo ad un anno fa, l'iterazione era di pochi secondi o meno, nel loop fomanda/risposta tipico di un chat bot. Anche senza scomodare esempi più di nicchia, i vari deep research of agenti di coding in backgroung oggi arrivano facilmente a minuti o decine di minuti.

Expand full comment
2 more comments...

No posts