Anthropic og OpenAI tar sin AI-krig inn i vitenskapelig forskning

Skrevet av

Lockridge Okoth

Redigert av

Mohammad Shahid

30. juni 2026, 19:43 UTC

Anthropic lanserte Claude Science, en AI-arbeidsplattform koblet til over 60 vitenskapelige databaser
OpenAI lanserte GeneBench-Pro, en benchmark for AI-vurdering innen computational biology
OpenAI sitt beste modell besto bare 28,7 % av GeneBench-Pro sine biologioppgaver

Anthropic og OpenAI åpnet et nytt kapittel i rivaliseringen tirsdag, begge med fokus på vitenskapelig forskning. Anthropic lanserte Claude Science, en AI-verktøykasse for forskere, mens OpenAI slapp GeneBench-Pro, en test for beregningsbiologi.

Lanseringene samme dag flytter AI-kappløpet forbi chatboter og koding og inn i laboratoriearbeidet. Ett selskap har gitt forskere et verktøy som kan brukes i dag. Det andre har laget en målestokk for hvor langt teknologien har igjen å gå.

Hva Claude Science fra Anthropic gjør

Claude Science samler databaser, kode og regnekraft som forskere bruker, i én app. Den kobler sammen mer enn 60 vitenskapelige databaser innen genomikk, proteomikk og kjeminformasjon.

Introducing Claude Science, a new app designed with every stage of research in mind.

Artifacts traced to their code, environments managed on demand, and 60+ optional scientific databases that you can connect.

Available now in beta. pic.twitter.com/HKhLknxLJO
— Claude (@claudeai) June 30, 2026

Claude Science er en app, ikke en ny modell. Den lanseres mens Anthropics kraftigste modeller Fable 5 og Mythos 5 forblir underlagt USAs eksportregler. Hvert resultat er reviderbart og kan spores tilbake til koden som produserte det.

Verktøykassen bygger videre på satsingen på livsvitenskap som Anthropic startet oktober 2025. I beta-test har Allen Institute-forsker Jérôme Lecoq brukt den til å komprimere vurderinger som tidligere tok opptil to år.

Anthropic vil også finansiere opptil 50 forskningsprosjekter med inntil $ 30 000 i kreditter til hvert.

OpenAI løfter listen med GeneBench-Pro

Kort tid etter lanseringen av Claude Science, slapp OpenAI GeneBench-Pro. Den tester om AI-agenter kan ta de vurderingene som virkelig biologisk forskning krever.

We’re introducing GeneBench-Pro, a research-level benchmark for a harder kind of AI progress: how well agents can navigate messy biological data, choose the right analysis path, and make judgment calls that real computational research depends on.https://t.co/AsilnnSxnE
— OpenAI (@OpenAI) June 30, 2026

Testen inneholder 129 oppgaver innen genomikk, kvantitativ biologi og translasjonell medisin.

OpenAIs beste modell, GPT-5,6 Sol, løste 28,7 % av oppgavene på høyeste resonneringsnivå. Denne andelen steg til 31,5 % i Pro-modus. Selskapets tidligere rullerende GPT-5,6-lansering skjedde etter forespørsel fra Washington.

GPT-5 fikk under 5 % på den opprinnelige GeneBench, mens Anthropics Opus 4,8 nådde 16 % på den vanskeligere testen.

Følg oss på X for de siste nyhetene mens de skjer

To strategier, ett kappløp

Forskjellen viser to veier mot samme mål. Anthropic leverer et produkt til bruk i laboratoriet hver dag. OpenAI måler hvor pålitelige modellene er til å resonnere gjennom rotete data.

Begge lanseringer kommer også samtidig som kinesiske modeller avanserer innen AI-forskning. OpenAIs egne tall demper hypen, ettersom deres beste modell fortsatt mislykkes på de fleste GeneBench-Pro-oppgaver.

Presset er både geopolitisk og vitenskapelig. USAs eksportbegrensninger har allerede fått Anthropic til å vurdere nye vertsland for modellene sine.

Fagpersoner anslår at hver GeneBench-Pro-oppgave vil ta en menneskelig ekspert 20 til 40 timer, til en kostnad på flere tusen dollar. OpenAI oppgir at modellen deres utfører samme analyse for noen få dollar.

Aubrey de Grey, en biomedisinsk gerontolog, mener AI kan fjerne viktige flaskehalser i forskningen selv om større gjennomslag tar lengre tid.

“Det vi snart vil se er at AI vil gjøre visse deler av prosessen, spesielt utvikling av nye legemidler, ikke lenger blir flaskehalser,” sier Aubrey de Grey, president og Chief Science Officer i Longevity Escape Velocity Foundation, i en BeInCrypto-podcast.

De Grey påpeker at raskere forskning fortsatt er avhengig av regulering og offentlig aksept av risiko, før de kan bli godkjente behandlinger.

Forskere venter raskere innføring

Noen mener skiftet allerede er i gang. Dr. Derya Unutmaz, professor i immunologi, sa til samme BeInCrypto-panel at AI nå overgår hans egen dømmekraft.

“Jeg stoler personlig mer på AI enn på egne ideer etter 35 år i feltet.”

Han forventer at bruken vil spre seg raskt til klinisk praksis.

“Det er uetisk, og jeg tror det snart vil bli ansett som feilbehandling å ikke bruke AI i medisin.”

Den optimismen ligger fortsatt foran testresultatene. De kommende månedene vil vise om forskerne tar i bruk disse verktøyene og om GeneBench-Pro-scorene begynner å stige.