Interviu
Bryonas Jacobas, CTO ir „data.world“ interviu serijos įkūrėjas
Bryonas Jacobas yra CTO ir vienas iš įkūrėjų duomenys.pasaulis – kuriant prasmingiausią, bendradarbiavimo ir gausiausią duomenų šaltinį pasaulyje. Iki data.world jis dešimt metų praleido didinančios atsakomybės vaidmenis HomeAway.com, pasibaigus Technikos viceprezidentu / Technikos kolegos vaidmeniu. Bryonas taip pat anksčiau dirbo „Amazon“ ir yra ilgametis „Capital Factory“ mentorius. Jis turi informatikos bakalauro / magistro laipsnį Case Western universitete.
Kuo jus iš pradžių patraukė informatika?
Mane užkabino kodavimas nuo tada, kai, būdamas 64 metų, įsigijau Commodore 10. Pradėjau nuo BASIC ir greitai perėjau prie asamblėjos kalbos. Man kompiuterių mokslas yra tarsi daugybės sudėtingų galvosūkių sprendimas su automatizavimo jauduliu. Būtent šis problemų sprendimo aspektas mane visada sudomino ir jaudino.
Ar galite pasidalinti data.world atsiradimo istorija?
data.world gimė po daugelio mūsų įkūrėjų komandos smegenų šturmo seansų. Brettas, mūsų generalinis direktorius, susisiekė su Jonu ir Mattu, su kuriais abu dirbo anksčiau. Jie pradėjo susitikinėti, kad galėtų mėtyti idėjas, o Jonas man atnešė kelias iš tų koncepcijų techniniam įvertinimui. Nors šios idėjos nepasiteisino, jos sukėlė diskusijas, kurios glaudžiai siejasi su mano paties darbu. Per šiuos pokalbius mes pasiekėme idėją, kuri galiausiai tapo data.world. Mūsų bendra istorija ir abipusė pagarba leido mums greitai suburti puikią komandą, suburti geriausius žmones, su kuriais dirbome praeityje, ir padėti tvirtą pagrindą naujovėms.
Kas paskatino data.world sukurti AI konteksto variklį ir kokius konkrečius iššūkius jis sprendžia įmonėms?
Nuo pat pradžių žinojome, kad žinių grafikas (KG) bus labai svarbus siekiant tobulinti AI galimybes. Didėjant generatyviniam AI, mūsų klientai norėjo dirbtinio intelekto sprendimų, kurie galėtų sąveikauti su jų duomenimis pokalbio metu. Reikšmingas AI programų iššūkis šiandien yra paaiškinamumas. Jei negalite parodyti savo darbo, atsakymai bus mažiau patikimi. Mūsų KG architektūra kiekvieną atsakymą grindžia patikrinamais faktais, pateikdama aiškius ir atsekamus paaiškinimus. Tai padidina skaidrumą ir patikimumą, leidžiančią įmonėms drąsiai priimti pagrįstus sprendimus.
Kaip AI kontekstinio variklio žinių grafiko architektūra padidina LLM tikslumą ir paaiškinamumą, palyginti su vien SQL duomenų bazėmis?
Mūsų novatoriškas popierius, mes parodėme tris kartus didesnį tikslumą naudodami žinių grafikus (KG), palyginti su tradicinėmis reliacinėmis duomenų bazėmis. KG naudoja semantiką, kad pateiktų duomenis kaip realius objektus ir ryšius, todėl jie yra tikslesni nei SQL duomenų bazės, kuriose pagrindinis dėmesys skiriamas lentelėms ir stulpeliams. Kad būtų lengviau paaiškinti, KG leidžia mums susieti atsakymus su terminų apibrėžimais, duomenų šaltiniais ir metrika, suteikdami patikrinamą pėdsaką, kuris padidina pasitikėjimą ir patogumą.
Ar galite pasidalinti pavyzdžiais, kaip AI konteksto variklis pakeitė duomenų sąveiką ir sprendimų priėmimą įmonėse?
AI Context Engine sukurtas kaip API, kuri sklandžiai integruojasi su esamomis klientų AI programomis, nesvarbu, ar tai būtų pasirinktiniai GPT, antrieji pilotai, ar pagal užsakymą sukurti sprendimai, sukurti naudojant „LangChain“. Tai reiškia, kad vartotojams nereikia pereiti prie naujos sąsajos – vietoj to mes jiems pateikiame AI Context Engine. Ši integracija pagerina vartotojų priėmimą ir pasitenkinimą, skatina geresnių sprendimų priėmimą ir efektyvesnę duomenų sąveiką, įterpdama galingas AI galimybes tiesiai į esamas darbo eigas.
Kokiais būdais AI konteksto variklis užtikrina skaidrumą ir atsekamumą priimant AI sprendimus, kad būtų laikomasi reguliavimo ir valdymo reikalavimų?
AI konteksto variklis susieja su mūsų žinių diagrama ir duomenų katalogu, išnaudodamas galimybes, susijusias su kilme ir valdymu. Mūsų platforma seka duomenų liniją, siūlydama visišką duomenų ir transformacijų atsekamumą. Dirbtinio intelekto sukurti atsakymai vėl prijungiami prie duomenų šaltinių, suteikiant aiškų pėdsaką, kaip buvo gauta kiekviena informacija. Šis skaidrumas yra labai svarbus siekiant užtikrinti, kad būtų laikomasi reguliavimo ir valdymo, užtikrinant, kad kiekvienas DI sprendimas gali būti audituojamas ir patikrintas.
Kokį vaidmenį, jūsų nuomone, ateinančiais metais atliks žinių grafikai platesnėje AI ir duomenų valdymo aplinkoje?
Žinių grafikai (KG) tampa vis svarbesni, kai atsiranda generatyvus AI. Įformindami faktus į grafiko struktūrą, KG suteikia tvirtesnį AI pagrindą, padidindami tikslumą ir paaiškinamumą. Pastebime perėjimą nuo standartinių paieškos papildytų kartos (RAG) architektūrų, kurios remiasi nestruktūrizuotais duomenimis, prie Graph RAG modelių. Šie modeliai pirmiausia paverčia nestruktūrizuotą turinį į KG, todėl žymiai pagerėja atšaukimas ir tikslumas. KG vaidina pagrindinį vaidmenį skatinant dirbtinio intelekto naujoves ir efektyvumą.
Kokių būsimų patobulinimų galime tikėtis, kad dirbtinio intelekto kontekstinis variklis dar labiau pagerins jo galimybes ir naudotojų patirtį?
AI Context Engine tobulėja naudojant, nes kontekstas grįžta į duomenų katalogą, todėl laikui bėgant jis tampa išmanesnis. Produkto požiūriu mes sutelkiame dėmesį į agentų kūrimą, kurie atlieka pažangias žinių inžinerijos užduotis, paverčiant neapdorotą turinį turtingesnėmis ontologijomis ir žinių bazėmis. Mes nuolat mokomės iš veikiančių modelių ir greitai integruojame šias įžvalgas, suteikdami vartotojams galingą, intuityvų įrankį duomenims valdyti ir panaudoti.
Kaip data.world investuoja į mokslinius tyrimus ir plėtrą, kad išliktų AI ir duomenų integravimo technologijų priešakyje?
AI Context Engine moksliniai tyrimai ir plėtra yra mūsų didžiausia investicijų sritis. Esame įsipareigoję išlikti AI ir duomenų integravimo galimybių srityje. Mūsų komanda, simbolinio AI ir mašininio mokymosi ekspertai, vadovaujasi šiuo įsipareigojimu. Tvirtas pagrindas, kurį sukūrėme svetainėje data.world, leidžia mums greitai judėti ir peržengti technologines ribas, užtikrinant, kad nuolat teikiame pažangiausias galimybes savo klientams.
Kokia yra jūsų ilgalaikė AI ir duomenų integravimo ateities vizija ir kaip, jūsų nuomone, data.world prisideda prie šios evoliucijos?
Mano ateities AI ir duomenų integravimo vizija visada buvo siekti ne tik palengvinti naudotojų duomenų užklausas. Vietoj to siekiame, kad vartotojams apskritai nereikėtų teirautis savo duomenų. Mūsų vizija nuolat buvo sklandžiai integruoti organizacijos duomenis su jos žiniomis, įskaitant metaduomenis apie duomenų sistemas ir loginius realaus pasaulio subjektų modelius.
Pasiekus šią integraciją į mašininiu būdu nuskaitomą žinių grafiką, AI sistemos gali iš tikrųjų įvykdyti natūralios kalbos sąveikos su duomenimis pažadą. Per pastaruosius dvejus metus sparčiai tobulėjant generatyviniam AI ir mūsų pastangoms integruoti ją su įmonės žinių grafikais, ši ateitis šiandien tampa realybe. Data.world esame šios evoliucijos priešakyje, skatinantys transformaciją, leidžiančią dirbtiniam intelektui teikti precedento neturinčią vertę per intuityvią ir protingą duomenų sąveiką.
Dėkojame už puikų interviu, skaitytojai, norintys sužinoti daugiau, turėtų apsilankyti duomenys.pasaulis.