Anthropic udoskonalił swój flagowy model. Opus 4.1 osiąga lepsze wyniki nie tylko w programowaniu

  • Anthropic wydał Claude Opus 4.1 z ulepszeniami w programowaniu i analizie danych
  • Nowa wersja osiągnęła 74,5% skuteczności w benchmarku programistycznym SWE-bench Verified
  • Model jest dostępny poprzez API, Amazon Bedrock i Google Cloud w tej samej cenie co Opus 4

Sdílejte:
Adam Kurfürst
Adam Kurfürst
7. 8. 2025 20:00

Firma Anthropic we wtorek zaprezentowała Claude Opus 4.1, zaktualizowaną wersję swojego flagowego modelu sztucznej inteligencji. Nowy wariant wprowadza ulepszenia w obszarach programowania, automatyzacji zadań i logicznego rozumowania. Oryginalny Opus 4 wraz z modelem Sonnet 4 został zaprezentowany w maju tego roku.

Lepsze wyniki w programowaniu i analizie

Claude Opus 4.1 osiągnął 74,5% skuteczności w benchmarku SWE-bench Verified, który testuje możliwości modeli w rzeczywistych zadaniach programistycznych. Model wykazuje również poprawę w szczegółowej analizie danych i wyszukiwaniu informacji za pomocą zautomatyzowanych narzędzi.

Według firmy GitHub, nowa wersja poprawia wydajność większości funkcji w porównaniu do poprzedniego Opus 4, przy czym największy postęp odnotowano w refaktoryzacji kodu w wielu plikach. Japońska firma Rakuten Group podaje, że Opus 4.1 potrafi precyzyjnie identyfikować niezbędne poprawki w dużych bazach kodu bez zbędnych modyfikacji lub wprowadzania błędów.

Rozszerzone możliwości rozumowania

Claude Opus 4.1 należy do hybrydowych modeli rozumowania (reasoning), które łączą standardowe odpowiedzi z rozszerzonym myśleniem do 64 000 tokenów. Funkcja ta pozwala modelowi na bardziej szczegółową analizę złożonych problemów przed sformułowaniem odpowiedzi.

Firma Windsurf, zajmująca się rozwojem oprogramowania, zgłasza poprawę o jedno odchylenie standardowe w porównaniu do Opus 4 w swoim benchmarku dla młodszych deweloperów. Ta poprawa odpowiada podobnemu skokowi jak przejście z modelu Sonnet 3.7 na Sonnet 4.

Dostępność i polityka cenowa

Claude Opus 4.1 jest już dostępny dla płacących użytkowników usługi Claude oraz w aplikacji Claude Code. Deweloperzy mogą korzystać z modelu poprzez API pod nazwą claude-opus-4-1-20250805, a także jest on dostępny na platformach Amazon Bedrock i Google Cloud’s Vertex AI.

Anthropic zachowuje tę samą strukturę cenową co w przypadku poprzedniego Opus 4, więc użytkownicy nie muszą liczyć się z wyższymi kosztami przy przejściu na nową wersję. Firma zaleca aktualizację z Opus 4 do wersji 4.1 do wszystkich zastosowań.

Anthropic jednocześnie zapowiada, że w nadchodzących tygodniach planuje znacznie większe ulepszenia swoich modeli, niż te, które wnosi obecna aktualizacja Opus 4.1. Nie sprecyzował jednak szczegółów.

Czy korzystasz z któregoś z modeli Claude w swojej pracy?

Źródło: Anthropic

O autorze

Adam Kurfürst

Adam studuje na gymnáziu a technologické žurnalistice se věnuje od svých 14 let. Pakliže pomineme jeho vášeň pro chytré telefony, tablety a příslušenství, rád se… Więcej o autorze

Adam Kurfürst
Sdílejte: