In un mercato dell’intelligenza artificiale che corre a velocità folle, Apple si trova davanti a un bivio tecnologico senza precedenti. Secondo un’indagine esclusiva pubblicata da The Information, il colosso di Cupertino avrebbe ufficialmente chiesto a Google di studiare la fattibilità di installare e gestire server nei propri data center per far girare la futura versione di Siri potenziata da Gemini.
Si tratta di una svolta clamorosa che mette in luce le difficoltà di Apple nel gestire internamente l’immane carico di calcolo richiesto dai grandi modelli linguistici (LLM) di prossima generazione.
L’insufficienza del Private Cloud Compute con Siri
Attualmente, Apple gestisce le query IA più complesse tramite il Private Cloud Compute (PCC), un sistema che gira su server proprietari equipaggiati con chip Apple Silicon. Nonostante oggi solo il 10% della capacità del PCC sia effettivamente utilizzata (molti server sono ancora imballati nei magazzini), la situazione è destinata a cambiare radicalmente con il lancio della nuova Siri.
Il problema, tuttavia, non è solo di spazio, ma di architettura. I chip Apple Silicon attualmente usati nei server PCC sono derivati da quelli per dispositivi consumer e non sono ottimizzati per i flussi di lavoro massicci dell’IA. Al contrario, l’infrastruttura di Google è progettata specificamente per far girare modelli enormi come Gemini, rendendola l’unica opzione pronta per un eventuale picco di richieste globale.
Il crollo del muro della Privacy
Per anni, Apple ha vietato ai propri ingegneri di utilizzare le tecnologie cloud di Google per timore di violazioni della privacy. Lo stesso capo del software di Apple, Craig Federighi, ha più volte posto il veto su Google Cloud come opzione per l’IA.
Tuttavia, la situazione è cambiata nel 2023 quando:
• Google ha introdotto modifiche radicali ai propri sistemi di sicurezza, soddisfacendo gli elevatissimi standard di Apple.
• L’infrastruttura interna di Apple ha iniziato a mostrare segni di “decadimento”, con lo smantellamento dei vecchi server Nvidia che non è stato seguito da un potenziamento adeguato della rete proprietaria.
Una scelta dettata dalla necessità
La riluttanza storica di Apple nell’investire pesantemente nelle infrastrutture cloud — preferendo concentrarsi sul design dell’hardware — ha portato alla partenza di esperti chiave come Patrick Gates, il pioniere dell’idea di portare i chip Apple nei data center.
Ora, con il debutto della nuova Siri basata su Gemini previsto per la fine di quest’anno, Apple non può permettersi errori. Chiedere a Google di far girare Siri direttamente sui propri server è una mossa pragmatica: l’obiettivo è essere pronti per l’ondata di attivazioni che seguirà il lancio, evitando i rallentamenti che hanno piagato le prime versioni di Apple Intelligence.
Resta da capire come Apple comunicherà questa “dipendenza” dal suo principale rivale ai propri utenti, da sempre abituati alla narrativa dell’indipendenza totale e della privacy gestita esclusivamente in casa.
[fonte]