Krönika: DeepSeek - en viktig accelerator för framtidens AI

Babak Hodjat, CTO för AI på Cognizant. Foto: Cognizant
Babak Hodjat, CTO för AI på Cognizant. Foto: Cognizant

Av Babak Hodjat, CTO för AI på Cognizant

Det var många som blev chockade över lanseringen av DeepSeek. Efter en tids rekflektion är det nu dags att ställa viktiga frågor om lösningens påverkan påkonkurrenssituationen, innovationen och AI:s framtid.

Med många års erfarenhet i branschen ser jag att DeepSeeks kanske viktigaste funktion är i form av en välbehövlig  branschkorrigering som kommer att påskynda AI-innovation.

Framtiden ligger i demokratisering
En gång i tiden var datorer stora som hus, men idag har våra smartklockor större processorkapacitet än de första datorerna. Denna utveckling skedde inte över en natt, utan är resultatet av en kontinuerlig optimering av processorkraft, vilket möjliggjorde integration i allt mindre format och till en betydligt lägre kostnad.

På liknande sätt har DeepSeek optimerat sin modell till att bli mindre och snabbare. Det är smart och det är också vad som krävs för att företag ska kunna använda AI brett. 

Jag och mitt team har testat mindre DeepSeek-modeller på en MacBook och har blivit överraskade kring hur mycket kraftfullare den är jämfört med modeller av liknande storlek för bara några månader sedan. Det krävdes ingen massiv processorkraft eller lagring. Dessutom kan Deepseek-modellerna tränas snabbare samtidigt som driften kräver mindre resurser. 

Det leder oss till konceptet demokratisering. Kraftfullare modeller är inte längre reserverade för ett fåtal stora spelare. Det är en utveckling som gynnar alla.

Multi-agent-system till alla?
Hittills har ribban lagts väldigt högt för vilka AI-modeller som kan stödja avancerade processer. Vi har fram till nu bara haft en handfull alternativ som kan klassas som acceptabla LLM-baserade agenter i den här bemärkelsen. Nu är dörren för fler modeller inspirerade av DeepSeek öppen. 

Vi har alla sett hur användning av agenter har blivit ett kraftfullt sätt att dra nytta av AI, och vi börjar nu se hur de kan kopplas in i system med flera agenter, vilket ger enorma fördelar för produktivitet och autonomi. De optimeringar som DeepSeek har introducerat breddar  användningsområdena för multiagent-system, eftersom vi nu kan börja arbeta med billigare, mindre och snabbare AI-modeller.

När dessa nya modeller börjar få fäste på marknaden kommer företag att få betydligt större flexibilitet i hur och var de utvecklar och distribuerar dem. Det påskyndar samtidigt införandet av AI hos många företag.

En mängd användningsfall
I takt med att stora språkmodeller blir snabbare och mer energieffektiva blir det allt mer rimligt och praktiskt att utveckla och använda multiagent-lösningar. 

Hittills har det ofta varit så att en beslutsfattare inom ett visst område använder system med flera agenter för att öka processflöden bland ett fåtal användare. Utmaningen är att skala dessa lösningar till tusentals människor. Dessa modeller kan dock vara långsamma och ineffektiva i multiagent-miljöer. Genom att utnyttja kostnadseffektiva och snabbare modeller för att köra sådana system i stor skala kan man öka antalet personer som använder dem.

Det mest uppenbara användningsområdet är callcenter- och supportfunktioner, där flera AI-agenter hanterar en kundförfrågan från början till slut.

Ett annat exempel är inom försäkringsbranschen. En aktör bedömer vanligtvis stora mängder tredjepartsdata och avgör slutligen om och hur kunden kan försäkras. När system för flera agenter blir mer tillgängliga kan ett försäkringsbolag förbättra denna process genom sammankopplade agenter. Dessa agenter kan analysera både tredjeparts- och intern information, analysera och konsolidera perspektiv samt tillhandahålla olika alternativ. Att köra sådana system som har höga datasäkerhetskrav lokalt blir nu mycket mer kostnadseffektivt.

Vad händer nu?
Moderna LLM-baserade agenter har ofta handlat mycket om att bygga stora allt-i-ett-lösningars. Men jag tror inte att det är rätt väg framåt. Istället handlar det om att utnyttja den kollektiva intelligensen hos en mängd mindre kostnadseffektiva AI-agenter, som är smarta nog att representera olika processnoder i ett affärsflöde.

DeepSeek har inspirerat branschen att ta till sig modeller som är snabbare, effektivare och mer kostnadseffektiva. Detta ger en fingervisning om vad som kan uppnås. När hajpen kring DeepSeek lagt sig något hoppas jag att vi kan få uppleva en guldrush kring vad dessa modeller kan användas till.