Async Concurrent Map

Problema

En aplicaciones backend con Vapor, cuando procesamos grandes volúmenes de datos de forma concurrente, nos enfrentamos a un dilema de optimización:

Procesamiento secuencial con asyncMap: garantiza control sobre los recursos, pero es lento al procesar elementos uno a uno.
Procesamiento totalmente concurrente con concurrentMap: maximiza la velocidad, pero puede saturar recursos al lanzar miles de tareas simultáneas.

Por ejemplo, al procesar 10,000 registros con llamadas a APIs externas:

asyncMap: 10,000 llamadas secuenciales → muy lento pero controlado.
concurrentMap: 10,000 llamadas simultáneas → muy rápido pero puede agotar conexiones/memoria.

Necesitamos una solución que combine ambos enfoques: dividir el trabajo en grupos manejables y procesar cada grupo de forma concurrente, equilibrando velocidad y uso de recursos.

Solución

Extendemos Collection con una función que combina chunking (división en grupos) y procesamiento concurrente, permitiendo configurar el tamaño de los grupos y timeout por chunk.

extension Collection where Element: Sendable {
    func asyncConcurrentMap<T: Sendable>(
        chunkSize: Int? = nil,
        timeout: Double? = nil,
        _ transform: @escaping @Sendable (Element) async throws -> T
    ) async throws -> [T] {
        guard let chunkSize else {
            return try await concurrentMap(transform)
        }

        return try await chunks(ofCount: chunkSize)
            .asyncMap(timeout: timeout) {
                try await $0.concurrentMap(transform)
            }.flatMap { $0 }
    }
}

Puntos clave:

Si no se especifica chunkSize, usa concurrentMap puro (procesamiento totalmente concurrente).
Si se especifica chunkSize, divide la colección en grupos con chunks(ofCount:).
Procesa los chunks secuencialmente con asyncMap (con timeout opcional).
Dentro de cada chunk, procesa los elementos concurrentemente con concurrentMap.
Aplana los resultados con flatMap para devolver un array unificado.

Resultado

// Procesar 10,000 registros en chunks de 100
// 100 tareas concurrentes a la vez, 100 veces
let results = try await records.asyncConcurrentMap(
    chunkSize: 100,
    timeout: 30.0
) { record in
    try await apiClient.process(record)
}

Beneficios de esta aproximación:

⚡ Balance perfecto: combina la velocidad del procesamiento concurrente con el control del procesamiento secuencial por chunks.

🎯 Control de recursos: limita la cantidad de tareas simultáneas al tamaño del chunk, evitando saturación.

⏱️ Timeout por chunk: detecta y maneja chunks problemáticos sin bloquear todo el procesamiento.

🔧 Flexibilidad total: usa chunking cuando lo necesites, o procesamiento concurrente puro cuando no.

📊 Escalabilidad: permite procesar millones de registros ajustando el tamaño del chunk según los recursos disponibles.

Si necesitas ejecución paralela pura, lo cubrí en Concurrent Map. Y si tus chunks secuenciales necesitan rate limiting entre ellos, añadí esa capacidad en Async Map Timeout.

Esta solución es la evolución natural de asyncMap y concurrentMap, combinando lo mejor de ambos mundos para optimizar el procesamiento de datos masivos en aplicaciones backend.

Keep coding, keep running 🏃‍♂️

Async Concurrent Map

Tabla de contenidos

Problema

Solución

Resultado