Tehno Novo

Tag: investicija

  • Da li su agenti veštačke inteligencije spremni za radno mesto? Novi pokazatelj pokreće sumnje

    Prošlo je skoro dve godine otkako je izvršni direktor Majkrosofta, Satja Nadela, predvideo da će veštačka inteligencija zameniti rad zasnovan na znanju – poslove „belih okovratnika“ koje obavljaju advokati, investicioni bankari, bibliotekari, računovođe, IT stručnjaci i drugi.

    Ali uprkos ogromnom napretku koji su postigli modeli fondacija, promena u radu zasnovanom na znanju je sporo stizala. Modeli su savladali detaljna istraživanja i agentsko planiranje, ali iz nekog razloga, većina poslova „belih okovratnika“ je ostala relativno nepromenjena.

    To je jedna od najvećih misterija u veštačkoj inteligenciji – i zahvaljujući novom istraživanju giganta za podatke o obuci Merkor, konačno dobijamo neke odgovore.

    Novo istraživanje ispituje kako vodeći modeli veštačke inteligencije izvode stvarne zadatke „belih okovratnika“, iz konsaltinga, investicionog bankarstva i prava. Rezultat je novi benčmark pod nazivom APEX-Agents – i do sada, svaka laboratorija za veštačku inteligenciju dobija neuspešnu ocenu. Suočeni sa upitima pravih profesionalaca, čak su se i najbolji modeli mučili da tačno odgovore na više od četvrtine pitanja. U velikoj većini slučajeva, model se vraćao sa pogrešnim odgovorom ili bez ikakvog odgovora.

    Prema rečima izvršnog direktora kompanije Merkor, Brendana Fudija, koji je radio na ovom radu, najveća prepreka modela bila je praćenje informacija u više domena — nešto što je sastavni deo većine rada sa znanjem koji obavljaju ljudi.

    „Jedna od velikih promena u ovom benčmarku je to što smo izgradili celokupno okruženje, po uzoru na stvarne profesionalne usluge“, rekao je Fudi za TechCrunch. „Način na koji obavljamo svoj posao nije tako što nam jedna osoba daje sav kontekst na jednom mestu. U stvarnom životu, radite preko Slack-a i Google Drive-a i svih ovih drugih alata.“ Za mnoge agentske AI modele, ta vrsta višedomenskog rezonovanja je i dalje pogodak ili promašaj.
    Snimak ekrana

    Svi scenariji su izvučeni od stvarnih profesionalaca na Merkorovom stručnom tržištu, koji su postavili upite i standard za uspešan odgovor. Pregled pitanja, koja su javno objavljena na Hugging Face-u, daje osećaj koliko složeni zadaci mogu biti.

    Jedno pitanje u odeljku „Zakon“ glasi:

    Tokom prvih 48 minuta prekida proizvodnje u EU, inženjerski tim kompanije Nortstar je izvezao jedan ili dva paketa dnevnika događaja proizvodnje u EU koji sadrže lične podatke američkom dobavljaču analitike… Prema sopstvenim politikama kompanije Nortstar, može li razumno tretirati jedan ili dva izvoza dnevnika kao u skladu sa Članom 49?

    Tačan odgovor je da, ali da bi se to postiglo, potrebna je detaljna procena sopstvenih politika kompanije, kao i relevantnih zakona EU o privatnosti.

    To bi moglo zbuniti čak i dobro informisanog čoveka, ali istraživači su pokušavali da modeliraju rad koji obavljaju profesionalci u ovoj oblasti. Ako magistar prava može pouzdano da odgovori na ova pitanja, mogao bi efikasno da zameni mnoge advokate koji danas rade. „Mislim da je ovo verovatno najvažnija tema u ekonomiji“, rekao je Fudi za TechCrunch. „Referentna vrednost u velikoj meri odražava stvarni posao koji ovi ljudi rade.“

    OpenAI je takođe pokušao da izmeri profesionalne veštine svojim GDPDval benčmarkom — ali APEX-Agents test se razlikuje na važne načine. Dok GDPval testira opšte znanje u širokom spektru profesija, APEX-Agents benčmark meri sposobnost sistema da obavlja kontinuirane zadatke u uskom skupu visoko vrednih profesija. Rezultat je teži za modele, ali je takođe više povezan sa tim da li se ovi poslovi mogu automatizovati.

    Iako se nijedan od modela nije pokazao spremnim da preuzme ulogu investicionih bankara, neki su bili očigledno bliži cilju. Gemini 3 Flash je postigao najbolje rezultate u grupi sa 24% tačnosti u jednom pokušaju, a odmah za njim je sledio GPT-5.2 sa 23%. Ispod toga, Opus 4.5, Gemini 3 Pro i GPT-5 su svi postigli otprilike 18%.

    Iako početni rezultati nisu dovoljni, oblast veštačke inteligencije ima istoriju probijanja kroz izazovne benčmarkove. Sada kada je APEX-Agents test javan, to je otvoreni izazov za laboratorije veštačke inteligencije koje veruju da mogu bolje – nešto što Fudi u potpunosti očekuje u narednim mesecima.

    „Poboljšava se veoma brzo“, rekao je za TechCrunch. „Trenutno je fer reći da je to kao da pripravnik uradi nešto tačno u četvrtini slučajeva, ali prošle godine je pripravnik uradio to tačno u pet ili deset procenata slučajeva. Takvo poboljšanje iz godine u godinu može imati veoma brz uticaj.“

  • Izvori: Projekat SGLang se oslanja na RadixArk sa vrednošću od 400 miliona dolara dok tržište inferencije eksplodira

    U svetu veštačke inteligencije (AI) infrastrukture pojavljuje se obrazac: popularni alati otvorenog koda transformišu se u startapove podržane rizičnim kapitalom vredne stotine miliona dolara. Najnoviji primer je RadixArk, komercijalna kompanija koja stoji iza SGLang-a, sve popularnijeg alata koji pomaže AI modelima da rade brže i jeftinije.

    RadixArk je nedavno procenjen na oko 400 miliona dolara u rundi finansiranja koju je vodio Accel, prema rečima dve osobe upoznate sa ovom temom, što je značajan iznos za startap koji je najavljen tek prošlog avgusta. TechCrunch nije mogao da potvrdi veličinu finansiranja.

    Vest dolazi u trenutku kada je deo tima zadužen za održavanje SGLang-a, koji koriste kompanije poput xAI i Cursor za ubrzavanje obuke AI modela, prešao na nedavno pokrenuti komercijalni startap. RadixArk je nastao kao SGLang 2023. godine u laboratoriji UC Berkeley suosnivača Databricksa, Jona Stoike.

    Startap je prethodno prikupio anđeoski kapital od investitora, uključujući izvršnog direktora Intel-a, Lip-Bu Tana, rekli su izvori.

    Jing Šeng, ključni saradnik SGLang-a i bivši inženjer u xAI, napustila je Ilon Maskov startap za veštačku inteligenciju kako bi postala suosnivač i izvršni direktor RadixArk-a, prema saopštenju na LinkedIn-u koje je dala prošlog meseca. Šeng je ranije bila istraživački naučnik u Databricks-u.

    Jing Šeng, Accel i Lip-Bu Tan iz RadixArk-a nisu odgovorili na zahtev za komentar.

    I SGLang i RadixArk se fokusiraju na optimizaciju obrade inferencije — u suštini omogućavajući modelima da rade brže i efikasnije na istom hardveru. Zajedno sa obukom modela, inferencija predstavlja veliki deo troškova servera povezanih sa uslugama veštačke inferencije. Kao rezultat toga, alati koji optimizuju proces mogu skoro odmah stvoriti ogromne uštede.

    RadixArk nije jedini koji pravi ovu tranziciju od projekta otvorenog koda do dobro finansiranog startapa. vLLM, zreliji projekat za optimizaciju inferencije, takođe je napravio ovaj skok. Novoformirana kompanija je vodila razgovore o prikupljanju finansiranja od preko 160 miliona dolara po procenjenoj vrednosti od oko milijardu dolara, objavio je Forbs prošlog meseca.

    Tri osobe upoznate sa tim sporazumom rekle su za TechCrunch da Andresen Horovic predvodi investiciju u vLLM, iako konačni brojevi te investicije tek treba da se vide. Andresen Horovic je odbio da komentariše. Suosnivač vLLM-a, Sajmon Mo, okarakterisao je informacije o ovoj rundi „činjenično netačnim“ u izjavi za TechCrunch, mada je odbio da precizira koji su detalji netačni.

    Kao i SGLang, vLLM je bio inkubiran u laboratoriji Jona Stoike na Kalifornijskom univerzitetu u Berkliju. Stoika, profesor na Kalifornijskom univerzitetu u Berkliju, poznati je suosnivač Databricks-a, kao i brojnih drugih startapova.

    Nekoliko velikih tehnoloških kompanija već pokreće svoja inferentna radna opterećenja koristeći vLLM, a SGLang je takođe stekao značajnu popularnost u poslednjih šest meseci, rekla je za TechCrunch Britani Voker, generalni partner u CRV-u. Njena firma nije podržala nijednu kompaniju.

    RadixArk nastavlja da razvija SGLang kao endžin za modeliranje veštačke inteligencije otvorenog koda. Startap takođe gradi Miles, specijalizovani okvir dizajniran za učenje sa pojačanjem, koji omogućava preduzećima da obučavaju modele veštačke inteligencije kako bi vremenom postali pametniji.

    Iako većina njegovih alata ostaje besplatna, RadixArk je počeo da naplaćuje naknade za usluge hostinga, rekla je osoba upoznata sa kompanijom za TechCrunch.

    Startapovi koji pružaju infrastrukturu za zaključivanje programerima zabeležili su porast finansiranja poslednjih meseci, što naglašava kontinuirani značaj sloja zaključivanja za veštačku inteligenciju. Baseten je nedavno obezbedio 300 miliona dolara po procenjenoj vrednosti od 5 milijardi dolara, objavio je The Wall Street Journal u utorak. Ovo sledi sličan potez konkurentske kompanije Fireworks AI, koja je prikupila 250 miliona dolara po procenjenoj vrednosti od 4 milijarde dolara prošlog oktobra.

  • OpenEvidens dostigao vrednost od 12 milijardi dolara, a novu rundu finansiranja predvode Thrive i DST

    Investitori rizičnog kapitala koji su podržali OpenEvidence očigledno nisu zabrinuti zbog novih zdravstvenih informacionih proizvoda od OpenAI i Anthropic-a.

    U sredu je startap objavio da je prikupio dodatnih 250 miliona dolara u Seriji D finansiranja uz procenu od 12 milijardi dolara, koju su zajedno predvodili Thrive Capital i DST.

    To je dvostruko više od procene od poslednjeg prikupljanja sredstava u oktobru: 200 miliona dolara uz procenu od 6 milijardi dolara, koju je predvodio GV. Sada je prikupljeno ukupno 700 miliona dolara, kaže kompanija, od podupirača uključujući Sequoia, Nvidia, Kleiner Perkins, Blackstone, Bond, Craft Ventures, Mayo Clinic i druge.

    OpenEvidence je platforma za medicinske informacije zasnovana na veštačkoj inteligenciji, slična onome što je WebMD bio za prethodnu generaciju interneta, ali je usmerena ka lekarima. Ovo je donekle više stavlja u konkurenciju Anthropic-ovom Claude for Healthcare, koji je namenjen pacijentima, platiocima i pružaocima usluga, dok je novi zdravstveni proizvod ChatGPT-a više usmeren ka potrošačima.

    Kompanija kaže da je besplatna platforma, finansirana oglasima, samo u decembru pružila 18 miliona kliničkih konsultacija od verifikovanih zdravstvenih radnika u SAD. To se može uporediti sa oko 3 miliona pretraga mesečno pre godinu dana. Takođe je navedeno da je prihod premašio 100 miliona dolara.

  • Tajvan će investirati 250 milijardi dolara u proizvodnju poluprovodnika u SAD

    Trampova administracija potpisala je značajan trgovinski sporazum sa Tajvanom vredan više milijardi dolara, koji je osmišljen da pomogne Sjedinjenim Državama da povećaju domaću proizvodnju poluprovodnika.

    U skladu sa sporazumom koji je u četvrtak objavilo Ministarstvo trgovine SAD, tajvanske kompanije za proizvodnju poluprovodnika i tehnologije pristale su da direktno investiraju 250 milijardi dolara u američku industriju poluprovodnika. Ova ulaganja će se odnositi na poluprovodnike, energetiku i „proizvodnju i inovacije“ u oblasti veštačke inteligencije, navodi se u saopštenju za štampu. Tajvan trenutno proizvodi više od polovine svetskih poluprovodnika.

    Tajvan će takođe obezbediti dodatnih 250 milijardi dolara kreditnih garancija za dodatna ulaganja od ovih preduzeća u oblasti poluprovodnika i tehnologije, prema Ministarstvu trgovine. Vremenski period ovih ulaganja nije jasan.

    Zauzvrat, SAD će investirati u tajvansku industriju poluprovodnika, odbrane, veštačke inteligencije, telekomunikacija i biotehnološke tehnologije. U saopštenju za štampu nije naveden iznos u dolarima vezan za američku stranu sporazuma.

    Vest dolazi dan nakon što je Trampova administracija objavila proglas u kojem je ponovljeno cilj zemlje da vrati više proizvodnje poluprovodnika u Sjedinjene Države i priznala da će proces potrajati, jer se samo 10% poluprovodnika proizvodi u SAD.

    „Ova zavisnost od stranih lanaca snabdevanja predstavlja značajan ekonomski i nacionalni bezbednosni rizik“, navodi se u proglasu. „S obzirom na fundamentalnu ulogu koju poluprovodnici igraju u modernoj ekonomiji i nacionalnoj odbrani, poremećaj lanaca snabdevanja koji zavise od uvoza mogao bi da optereti industrijske i vojne kapacitete Sjedinjenih Država.“

    U proglasu, kojim je najavljeno 25% carina na neke napredne čipove veštačke inteligencije, takođe se navodi da će, kada se završe trgovinski pregovori sa drugim zemljama – poput ovog sporazuma sa Tajvanom – biti uvedene dodatne carine na poluprovodnike.