IBM har presenterat sin mest sofistikerade familj av AI-modeller hittills, kallad Granite 3.0, vid företagets årliga TechXchange händelse.
Granite 3.0-serien innehåller en rad olika modeller som är utformade för olika applikationer:
- Allmänt ändamål/språk: 8B- och 2B-varianter i både Instruct- och Base-konfigurationer
- Säkerhet: Guardian-modeller i storlekarna 8B och 2B, utformade för att implementera skyddsräcken
- Blandning av experter: En serie modeller optimerade för olika användningsscenarier
IBM hävdar att de nya språkmodellerna 8B och 2B kan matcha eller överträffa prestandan hos motsvarande modeller från ledande leverantörer i ett stort antal akademiska och industriella benchmarks. Dessa modeller är positionerade som mångsidiga arbetshästar för AI i företag och utmärker sig i uppgifter som RAG (Retrieval Augmented Generation), klassificering, sammanfattning och entitetsextraktion.
En viktig skillnad för Granite 3.0-familjen är IBM:s engagemang för AI med öppen källkod. Modellerna släpps under den tillåtande Apache 2.0-licensen och erbjuder en unik kombination av prestanda, flexibilitet och autonomi för både företagskunder och den bredare AI-communityn.
IBM tror att genom att kombinera en kompakt Granite-modell med egenutvecklad företagsdata, särskilt med hjälp av deras nya InstructLab-teknik, kan företag uppnå uppgiftsspecifik prestanda som konkurrerar med större modeller till en bråkdel av kostnaden. Tidiga proof-of-concept tyder på potentiella kostnadsbesparingar på upp till 23 gånger mindre än stora frontier-modeller.
Enligt IBM är transparens och säkerhet en viktig del av företagets AI-strategi. Företaget har publicerat en teknisk rapport och en guide för ansvarsfull användning av Granite 3.0, som beskriver de dataset som används, databehandlingssteg och benchmarkresultat. Dessutom erbjuder IBM IP-skadestånd för alla Granite-modeller på sin watsonx.ai plattform, vilket ger företagen större förtroende när de integrerar dessa modeller med sina egna data.
Granite 3.0 8B Instruct-modellen har visat särskilt lovande resultat och överträffar liknande modeller med öppen källkod från Meta och Mistral på akademiska standardbenchmarks. Den är också ledande inom alla uppmätta säkerhetsdimensioner i IBM:s AttaQ-benchmark för säkerhet.
IBM introducerar också Granite Guardian 3.0-modellerna, som är utformade för att implementera säkerhetsräcken genom att kontrollera användarinstruktioner och LLM-svar för olika risker. Dessa modeller erbjuder en omfattande uppsättning funktioner för risk- och skadedetektering, inklusive unika kontroller för RAG-specifika frågor som grund och relevans i sammanhanget.
Hela sviten av Granite 3.0-modeller finns tillgänglig för nedladdning på HuggingFace, med alternativ för kommersiell användning på IBM:s watsonx-plattform. IBM har också samarbetat med ekosystempartner för att integrera Granite-modeller i olika erbjudanden, vilket ger större valmöjligheter för företag över hela världen.
Eftersom IBM fortsätter att utveckla sin AI-portföljfokuserar företaget på att utveckla mer sofistikerade AI-agentteknologier som kan hantera större autonomi och komplex problemlösning. Detta inkluderar planer på att införa nya AI-agentfunktioner i IBM watsonx Orchestrate och bygga agentfunktioner i hela sin portfölj 2025.
Se även: Poängsättning av AI-modeller: Endor Labs presenterar utvärderingsverktyg
Vill du lära dig mer om AI och big data från branschledare? Kolla in AI & Big Data Expo som äger rum i Amsterdam, Kalifornien och London. Det omfattande evenemanget är samlokaliserat med andra ledande evenemang, bland annat Konferens om intelligent automation, BlockX, Veckan för digital omvandling, och Cybersäkerhet & Cloud Expo.
Utforska andra kommande evenemang och webbseminarier om företagsteknik som drivs av TechForge här.