Ho risolto finalmente il problema del limite di richiesta API dei miei bot!

📖 12 min read•2,347 words•Updated Apr 3, 2026

Ciao a tutti, sono Marcus di ai7bot.com. Oggi è il 17 marzo 2026 e ultimamente ho combattuto con un problema particolare che scommetto molti di voi hanno incontrato quando costruiscono bot per clienti o anche solo per i propri progetti personali. Si tratta della gestione di quei fastidiosi limiti di richiesta delle API, specialmente quando ti trovi a dover lavorare con servizi di terze parti che hanno la straordinaria capacità di essere… beh, avari con le loro richieste.

Ho visto troppi bot promettenti arrestarsi e fallire perché hanno raggiunto un limite di richiesta e si sono semplicemente arresi. O, peggio ancora, sono stati limitati, portando a un’esperienza utente terribile. Il mio ultimo cliente, una piccola startup e-commerce, voleva un bot Telegram che potesse estrarre aggiornamenti in tempo reale dell’inventario e controlli dei prezzi dall’incredibilmente vecchia e francamente, piuttosto fragile API del loro fornitore. La documentazione dell’API del fornitore era vaga sui limiti di richiesta, menzionando solo “uso ragionevole” – che, come sappiamo tutti, è codice per “ti banna se lo guardi storto.”

Il mio primo pensiero è stato: “Oh no, ci risiamo.” Ma questa volta, ho deciso di affrontarlo a muso duro, non solo con semplici ritardi, ma con un approccio più sofisticato e auto-riparativo. Volevo costruire un bot in grado di gestire elegantemente questi limiti, anche quando non sapevo esattamente quali fossero. Così, oggi, ci immergeremo profondamente nella costruzione di una coda di richieste API auto-regolante per i tuoi bot, concentrandoci su una strategia che si adatta piuttosto che semplicemente presume.

Il Problema: Limiti di Richiesta API Imprendibili

Pensa a questo. Stai costruendo un bot Telegram che ha bisogno di recuperare dati da un servizio esterno. Magari sono prezzi delle azioni, aggiornamenti meteorologici o, nel mio caso, inventario di prodotti. Invi un richiesta, ricevi una risposta. Facile, vero? Fino a quando a un certo punto, inizi a ricevere errori HTTP 429 Troppi Richieste. O peggio, l’API inizia a restituire dati vuoti o risposte malformate senza dirti perché. Questo è ciò che “uso ragionevole” spesso si traduce nel mondo reale.

L’API del fornitore del mio cliente era un esempio lampante. A volte, potevo colpirla cinque volte al secondo senza problemi. Altre volte, due richieste in un secondo avrebbero attivato un timeout. Era frustrante. Non potevo programmare un semplice time.sleep(1) dopo ogni richiesta perché questo avrebbe reso il bot dolorosamente lento quando l’API si sentiva generosa, e non avrebbe comunque evitato problemi quando si sentiva di cattivo umore.

Il problema principale è la mancanza di informazioni trasparenti e coerenti sui limiti di richiesta. Molte API forniscono intestazioni X-RateLimit-Limit, X-RateLimit-Remaining e X-RateLimit-Reset, e se sei abbastanza fortunato da lavorare con una di queste, fantastico! Puoi implementare abbastanza facilmente un algoritmo a bucket di token o a bucket che perde. Ma che dire delle API che non lo fanno? Quelle che semplicemente restituiscono errori, o peggio, ti limitano silenziosamente? È qui che entra in gioco la parte “auto-regolante.”

La Soluzione: Una Coda di Richieste Adattativa con Backoff

Il mio approccio ha coinvolto la creazione di una coda centrale di richieste attraverso cui tutte le chiamate API sarebbero passate. Questa coda non avrebbe semplicemente trattenuto le richieste; gestirebbe intelligentemente il loro tempismo in base al comportamento dell’API. I componenti chiave sono:

Una coda per contenere le richieste in attesa.
Un meccanismo per tenere traccia del successo/fallimento delle richieste recenti.
Un ritardo adattativo che aumenta in caso di fallimento e diminuisce in caso di successo.
Un operatore dedicato che elabora la coda.

Analizziamo come ho implementato questo in Python, che è il mio linguaggio di riferimento per lo sviluppo di bot. Sto usando la libreria asyncio perché è perfetta per operazioni concorrenti senza il sovraccarico dei thread, fondamentale per un bot reattivo.

Costruzione della Coda di Richiesta Principale

Per prima cosa, abbiamo bisogno di un modo per memorizzare le nostre richieste. Ogni “richiesta” nella nostra coda sarà una chiamata a funzione insieme ai suoi argomenti e un modo per segnalare indietro il risultato. Ho scoperto che racchiudere la chiamata API effettiva in una piccola classe o in un functools.partial rende il tutto più pulito.


import asyncio
import time
import collections

class ApiRequestQueue:
 def __init__(self, api_call_func, initial_delay=0.1, max_delay=5.0, delay_factor=1.5, success_factor=0.9):
 self.api_call_func = api_call_func
 self.queue = asyncio.Queue()
 self.current_delay = initial_delay
 self.max_delay = max_delay
 self.delay_factor = delay_factor # Moltiplicatore per il ritardo in caso di errore
 self.success_factor = success_factor # Moltiplicatore per il ritardo in caso di successo
 self.is_running = False
 self.worker_task = None
 self.last_request_time = 0

 async def _worker(self):
 self.is_running = True
 while self.is_running:
 try:
 task_id, future, func_args, func_kwargs = await self.queue.get()
 
 # Imporre un ritardo minimo tra le richieste
 elapsed = time.monotonic() - self.last_request_time
 if elapsed < self.current_delay:
 await asyncio.sleep(self.current_delay - elapsed)

 self.last_request_time = time.monotonic()
 
 try:
 result = await self.api_call_func(*func_args, **func_kwargs)
 future.set_result(result)
 # Se ha successo, riduci leggermente il ritardo, ma non sotto il valore iniziale
 self.current_delay = max(self.current_delay * self.success_factor, 0.05) 
 print(f"[{time.monotonic():.2f}] Richiesta {task_id} riuscita. Nuovo ritardo: {self.current_delay:.2f}s")
 except Exception as e:
 future.set_exception(e)
 # Se fallisce, aumenta significativamente il ritardo, fino al massimo
 self.current_delay = min(self.current_delay * self.delay_factor, self.max_delay)
 print(f"[{time.monotonic():.2f}] Richiesta {task_id} fallita: {e}. Nuovo ritardo: {self.current_delay:.2f}s")
 finally:
 self.queue.task_done()
 except asyncio.CancelledError:
 print("Operazione dell'operatore annullata.")
 break
 except Exception as e:
 print(f"L'operatore ha riscontrato un errore non gestito: {e}")
 # Non lasciare che l'operatore si arresti, mantienilo in esecuzione
 await asyncio.sleep(1) # Piccola pausa per prevenire un ciclo serrato in caso di errore persistente

 async def start(self):
 if not self.is_running:
 self.worker_task = asyncio.create_task(self._worker())
 print("Operatore della coda di richieste API avviato.")

 async def stop(self):
 if self.is_running:
 self.is_running = False
 if self.worker_task:
 self.worker_task.cancel()
 await self.worker_task
 print("Operatore della coda di richieste API fermato.")

 async def put(self, *args, **kwargs):
 if not self.is_running:
 raise RuntimeError("Coda non avviata. Chiamare prima .start().")
 future = asyncio.Future()
 task_id = f"req_{time.time():.4f}" # ID unico semplice per il logging
 await self.queue.put((task_id, future, args, kwargs))
 return await future

Alcune cose da notare qui:

api_call_func: Questa è la funzione asincrona effettiva che effettua la chiamata API. È fondamentale che questa funzione gestisca le potenziali eccezioni (come errori di rete, HTTP 429, ecc.) e le sollevi in modo che la nostra coda possa catturarle.
current_delay: Questo è il cuore della nostra strategia adattativa. Inizia con un valore ridotto (ad esempio, 0.1 secondi) e cambia in base al successo o al fallimento.
delay_factor e success_factor: Questi controllano quanto aggressivamente il ritardo si regola. Ho trovato un delay_factor di 1.5 essere un buon compromesso per aumentare il ritardo in caso di fallimento, e un success_factor di 0.9 per ridurlo lentamente. Potresti dover aggiustare questi valori per la tua API specifica.
max_delay: Un limite su quanto lungo può diventare il ritardo. Non vogliamo aspettare 30 secondi tra le richieste se l’API è semplicemente temporaneamente sovraccarica.
future: Questo è come otteniamo il risultato della chiamata API di ritorno al chiamante. Quando una richiesta viene inserita nella coda, creiamo un oggetto asyncio.Future. L’operatore poi imposta il risultato o l’eccezione su questo futuro, e il chiamante await il suo esito.

Integrazione con la Logica del Tuo Bot

Ora, come si usa questo nel tuo bot? Immaginiamo un semplice bot Telegram (usando python-telegram-bot o una libreria simile) che ha bisogno di recuperare i dettagli del prodotto dalla nostra problematica API del fornitore.


# Assumendo di avere una funzione asincrona per effettuare effettivamente la chiamata API
# Questa funzione dovrebbe sollevare un'eccezione in caso di errori API (ad es., 429, 500 o dati malformati)
async def fetch_product_details_from_supplier_api(product_id: str):
 # Simula una vera chiamata API con limitazioni di velocità imprevedibili
 # In un scenario reale, si userebbe aiohttp o requests_async
 await asyncio.sleep(0.05) # Simula la latenza di rete
 
 # Simula un errore API occasionale (ad es., 429 Troppe Richieste)
 # Regola la probabilità per testare diversi scenari
 if random.random() < 0.2: # 20% di possibilità di errore
 if random.random() < 0.5:
 raise Exception(f"Errore API: Prodotto {product_id} - Troppe Richieste (Simulato 429)")
 else:
 raise Exception(f"Errore API: Prodotto {product_id} - Errore Interno del Server (Simulato 500)")
 
 # Simula il recupero riuscito dei dati
 return {"id": product_id, "name": f"Gadget Fantastico {product_id}", "price": random.randint(10, 100)}

# --- Integrazione Bot ---
import random
# from telegram import Update
# from telegram.ext import Application, CommandHandler, ContextTypes

# Inizializza la nostra coda adattiva
product_api_queue = ApiRequestQueue(fetch_product_details_from_supplier_api, initial_delay=0.2)

async def start_queue():
 await product_api_queue.start()

async def stop_queue():
 await product_api_queue.stop()

async def get_product_info_command(product_id: str): # Semplificato per la dimostrazione, sarebbe `update: Update, context: ContextTypes.DEFAULT_TYPE`
 # Qui è dove il gestore del comando del tuo bot chiamerebbe la coda
 try:
 product_data = await product_api_queue.put(product_id)
 # await update.message.reply_text(f"Prodotto {product_data['name']}: ${product_data['price']}")
 print(f"Il bot ha ricevuto informazioni per {product_id}: {product_data['name']}")
 return product_data
 except Exception as e:
 # await update.message.reply_text(f"Mi dispiace, non sono riuscito a ottenere informazioni sul prodotto in questo momento. Riprova più tardi. Errore: {e}")
 print(f"Il bot non è riuscito a ottenere informazioni per {product_id}: {e}")
 return None

# Esempio di utilizzo (senza configurazione effettiva del bot di Telegram per brevità)
async def main():
 await start_queue()

 # Simula più richieste concorrenti dagli utenti
 print("\n--- Inviando un carico di 10 richieste ---")
 tasks = []
 for i in range(1, 11):
 tasks.append(get_product_info_command(f"PROD-{i}"))
 
 results = await asyncio.gather(*tasks)
 print(f"\nTutte le richieste elaborate. Risultati: {len([r for r in results if r is not None])} riusciti.")

 print("\n--- Inviando un altro carico dopo una breve pausa ---")
 await asyncio.sleep(3) # Simula una pausa nell'attività degli utenti
 tasks_2 = []
 for i in range(11, 16):
 tasks_2.append(get_product_info_command(f"PROD-{i}"))
 
 await asyncio.gather(*tasks_2)

 await stop_queue()

if __name__ == "__main__":
 asyncio.run(main())

Nella funzione get_product_info_command, invece di chiamare direttamente fetch_product_details_from_supplier_api, ora chiamiamo await product_api_queue.put(product_id). Questo significa che i gestori dei comandi del nostro bot non devono preoccuparsi delle limitazioni di velocità; devono semplicemente inviare la loro richiesta alla coda e attendere il risultato. La coda gestisce tutti i backoff e i tentativi (anche se per questa implementazione specifica, ritarda solo le richieste successive, senza riprovare direttamente quelle che sono fallite – potresti aggiungere un meccanismo di ripetizione all’interno di _worker se necessario).

Raffinamento: Gestire Diversi Tipi di Errori

API del fornitore del mio cliente era particolarmente difficile. A volte restituiva un 429, altre un 500, e a volte semplicemente un array JSON vuoto se era sovraccarica. L’implementazione attuale tratta tutte le eccezioni allo stesso modo. Per un sistema più sofisticato, potresti voler differenziare:

Errori Temporanei (429, 503, timeout di connessione): Aumentare il ritardo, potenzialmente ripetere la stessa richiesta alcune volte prima di arrendersi.
Errori Permanenti (400, 401, 404): Questi di solito significano che la richiesta stessa è errata, o l’autenticazione è fallita. Non aumentare il ritardo; fallisci immediatamente la richiesta specifica.

Puoi ottenere questo modificando la tua api_call_func per catturare specifici codici di stato HTTP e sollevare diverse eccezioni personalizzate, e poi il tuo _worker può avere blocchi `except` più granulati.

Per il mio cliente attuale, data l’inflessibilità generale dell’API, trattare la maggior parte degli errori come “dobbiamo allontanarci” era la scommessa più sicura. Ha priorizzato la stabilità rispetto all’identificazione immediata degli errori, il che era un buon compromesso in quel particolare scenario.

Lezioni Pratiche per il Tuo Prossimo Progetto Bot

Non fidarti di “uso ragionevole”: Assumi che qualsiasi API di terze parti senza intestazioni di limitazione di velocità esplicite fallirà sotto carico. Pianificalo fin dal primo giorno.
Centralizza le chiamate API: Inoltra tutte le richieste a una specifica API di terze parti attraverso una singola coda o un servizio dedicato. Questo rende più facile gestire i limiti.
Implementa il backoff adattivo: Invece di ritardi fissi, crea un sistema che reagisca agli errori API rallentando e accelerando quando l’API è reattiva. Il backoff esponenziale è un buon alleato qui.
Usa la programmazione asincrona: Per i bot, in particolare, asyncio in Python è inestimabile. Permette al tuo bot di rimanere reattivo all’input dell’utente mentre aspetta che le chiamate API vengano completate (o messe in coda).
Monitora e registra: Registra quando la tua coda aumenta i ritardi e quando si riprende. Questo ti fornisce informazioni vitali sul comportamento dell’API e ti aiuta a regolare il tuo delay_factor e success_factor. Di solito collego i registri del mio bot a Grafana o a uno strumento di monitoraggio simile per visualizzare queste tendenze.
Considera i limiti per singolo utente: Se il tuo bot effettua chiamate per conto di singoli utenti (ad es., ogni utente ha la propria chiave API), potresti aver bisogno di una coda separata o di un limitatore di velocità per ogni utente per prevenire che un utente esaurisca il limite di un altro. Questo è un tema più avanzato ma da considerare.

Costruire bot resiliente riguarda principalmente anticipare i fallimenti. Più il tuo bot può gestire elegantemente le interruzioni o le limitazioni dei servizi esterni, migliore sarà l’esperienza dell’utente e meno capelli tirerai fuori nel tentare di debug di errori “casuali”. Questa coda di richieste adattiva mi ha salvato da innumerevoli mal di testa e ha permesso al bot Telegram del mio cliente di funzionare senza intoppi, anche con l’antiquato e capriccioso API del loro fornitore.

Prova questo approccio nel tuo prossimo progetto bot e fammi sapere come va nei commenti qui sotto! Ci sono altre strategie che usi per affrontare i limiti API imprevedibili? Sono sempre ansioso di imparare.

Ho risolto finalmente il problema del limite di richiesta API dei miei bot!

Il Problema: Limiti di Richiesta API Imprendibili

La Soluzione: Una Coda di Richieste Adattativa con Backoff

Costruzione della Coda di Richiesta Principale

Integrazione con la Logica del Tuo Bot

Raffinamento: Gestire Diversi Tipi di Errori

Lezioni Pratiche per il Tuo Prossimo Progetto Bot

Articoli Correlati

Related Articles

Il Problema: Limiti di Richiesta API Imprendibili

La Soluzione: Una Coda di Richieste Adattativa con Backoff

Costruzione della Coda di Richiesta Principale

Integrazione con la Logica del Tuo Bot

Raffinamento: Gestire Diversi Tipi di Errori

Lezioni Pratiche per il Tuo Prossimo Progetto Bot

Articoli Correlati

You May Also Like

📚 You Might Also Like

Related Articles